Rozdíly mezi strojním učením a hlubokým učením

Co je strojové učení?

Strojové učení je sada metod používaných k vytváření počítačových programů, které se mohou naučit z pozorování a předpovídat. Strojové učení používá algoritmy, regrese a příbuzné vědy k pochopení dat. Tyto algoritmy lze obecně považovat za statistické modely a sítě.

Co je hluboké učení?

Hluboké učení je podmnožinou metod strojového učení. Data jsou analyzována prostřednictvím několika vrstev hluboké učební sítě, aby mohla síť vyvodit závěry a rozhodovat o datech. Metody hlubokého učení umožňují velkou přesnost na velkých datových sadách, ale tyto funkce dělají hlubší učení mnohem více náročné na zdroje než klasické strojní učení.

Rozdíly mezi strojovým učením a hlubokým učením

Vztah k umělé inteligenci

Několik desetiletí se strojní učení používalo jako metoda k dosažení umělé inteligence ve strojích. V jeho jádru je oblast strojového učení zaměřena na vytváření počítačů, které se mohou učit a rozhodovat, což dělá strojní učení vhodný pro výzkum umělé inteligence. Avšak ne všechny modely strojového učení jsou určeny k vývoji "pravé" umělé inteligence, která dokonale odpovídá nebo překračuje lidskou inteligenci. Místo toho jsou modely často navrženy k výzkumu specifických, omezených problémů.

Hluboké učení bylo navrženo v počátečních fázích diskusí o strojovém učení, ale jen málo výzkumníků usilovalo o metody hlubokého učení, protože výpočetní požadavky na hluboké učení jsou mnohem větší než v klasickém strojovém učení. Počítačová síla počítačů se však od roku 2000 exponenciálně zvyšuje, což umožňuje výzkumným pracovníkům provádět obrovské vylepšení v konstrukci strojového učení a umělé inteligence. Vzhledem k tomu, že hluboké učební modely se dobře stupňují se zvýšeným počtem dat, hluboké učení má potenciál překonat významné překážky při vytváření pravé umělé inteligence.

Základní konstrukce v strojním a hlubokém učení

Strojové učení a hluboké učení jsou algoritmické. V klasickém strojovém učení výzkumníci používají poměrně malé množství dat a rozhodují o tom, jaké jsou nejdůležitější vlastnosti v rámci dat, které algoritmus potřebuje k předpovědi. Tato metoda se nazývá inženýrská funkce. Například, pokud byl strojový učební program vyučen k rozpoznání obrazu letadla, jeho programátoři by vytvořili algoritmy, které umožňují programu rozpoznat typické tvary, barvy a velikosti komerčních letounů. S těmito informacemi by strojový učební program mohl předpovídat, zda jsou zobrazeny obrázky s zahrnutými letouny.

Hluboké učení se obecně odděluje od klasického strojního učení mnoha rozhodujícími úrovněmi. Hluboké vzdělávací sítě jsou často považovány za "černé skříňky", protože data jsou analyzována prostřednictvím několika síťových vrstev, z nichž každá provádí pozorování. To může ztěžovat pochopení výsledků, než je výsledkem klasického strojového učení. Přesný počet vrstev nebo kroků v rozhodování závisí na typu a složitosti zvoleného modelu.

Data a škálovatelnost v strojním a hlubokém učení

Strojové učení tradičně používá malé datové množiny, ze kterých se učí a předpovídá. S malým množstvím dat mohou vědci zjistit přesné funkce, které pomáhají programu pro strojní učení pochopit a naučit se z dat. Nicméně, pokud program spustí informace, které nemůže klasifikovat na základě svých již existujících algoritmů, výzkumníci obvykle potřebují manuálně analyzovat problematická data a vytvořit novou funkci. Kvůli tomu se klasické strojové učení obvykle neprojeví velkým množstvím dat, ale může minimalizovat chyby na menších datových sadách.

Hluboké učení je zvláště vhodné pro velké datové sady a modely často vyžadují, aby byly užitečné velké soubory dat. Vzhledem k složitosti sítě pro hluboké učení potřebuje síť značnou část údajů o školení a dodatečných údajích pro testování sítě po školení. V současné době výzkumníci vylepšují sítě pro hluboké učení, které mohou být efektivnější a používají menší soubory dat.

Požadavky na výkon pro strojní a hluboké učení

Strojové učení má různé požadavky na výkon počítače. Existuje spousta modelů, které lze provozovat na průměrném osobním počítači. Čím pokročilejší jsou statistické a matematické metody, tím těžší je, aby počítač rychle zpracovával data.

Hluboké učení má tendenci být velmi náročné na zdroje. Rozbor velkého množství informací prostřednictvím několika vrstev rozhodování vyžaduje spoustu výpočetní síly. Vzhledem k tomu, že počítače jsou rychlejší, hlubší učení je stále přístupnější.

Omezení v strojním a hlubokém učení

Tradičně strojové učení má několik běžných a významných omezení. Overfitting je statistický problém, který může ovlivnit algoritmus strojového učení. Algoritmus strojového učení obsahuje určité množství "chyby" při analýze a předpovídání dat. Algoritmus předpokládá vztah mezi příslušnými proměnnými, ale při nadměrném namáhání začíná zachycovat i chybu, což vede k "hlučnějšímu" nebo nepřesnému modelu.Modely strojového učení mohou být také předurčené k idiosynkrázám dat, s nimiž byli vyškoleni, problém, který je obzvláště patrný tehdy, když výzkumníci vybírají algoritmy na celé dostupné datové množině namísto ukládání části dat pro testování algoritmu.

Hluboké učení má stejné statistické úskalí jako klasické strojové učení, stejně jako několik unikátních otázek. Pro řadu problémů není k dispozici dostatek údajů pro výuku poměrně přesné sítě pro hluboké učení. Je často zakázané nebo nemožné shromažďovat více dat nebo simulovat problém v reálném světě, který omezuje aktuální rozsah témat, pro které může být vyučování hluboce využito.

Tabulka srovnání pro Strojové a hluboké učení

Shrnutí stroje Vs. Hluboké učení

Strojové učení a hluboké učení popisují metody výuky počítačů, které se učí a rozhodují. Hluboké učení je podmnožinou klasického strojového učení a některé důležité rozdíly dělají hluboké učení a strojní učení, které jsou vhodné pro různé aplikace.

Klasické strojové učení často zahrnuje inženýrské funkce programátorů, které pomáhají algoritmu provést přesné předpovědi na malém souboru dat. Deep learning algoritmy jsou obvykle navrženy s více vrstvami rozhodování vyžadovat méně specifické inženýrské funkce.
Hluboké učení se tradičně používá pro velmi rozsáhlé datové množiny, takže sítě nebo algoritmy mohou být vyškoleny, aby udělaly mnoho vrstvených rozhodnutí. Klasické strojové učení používá menší datové množiny a není tak škálovatelné jako hluboké učení.
I když se hluboké učení může dobře naučit spoustu dat, existuje mnoho problémů, u nichž není k dispozici dostatek dat pro to, aby bylo hluboké učení užitečné. Jak hluboké učení, tak i strojní učení sdílejí standardní statistické omezení a mohou být zkresleny, pokud je výuková datová sada velmi idiosynkrativní nebo byla shromážděna s nevhodnými statistickými technikami.