Mit is jelent a mesterséges intelligencia
Napjainkban az emberek az élet minden területén találkoznak a mesterséges intelligencia különböző formáival. Ilyen eljárások ajánlanak nekünk zenét, terveznek útvonalat, válogatják a leveleinket fontossági sorrend alapján, vagy éppen szűrik a levélszemetünket. Ám ennek ellenére laikusként nehéz különbséget tenni a címben említett fogalmak között. Ehhez nyújtunk most egy kis segítséget.
Mesterséges intelligencia? Gépi tanulás? Mély tanulás? Melyik mögött mi van a valóságban?
A mesterséges intelligencia olyan tudományág, mint például a matematika. Ez a tudomány azzal foglalkozik, hogy az informatika egy-egy problémára milyen kreatív választ tud adni az intelligens programok segítségével.
A machine learning ezen tudományágnak egy iránya. Olyan tanuló algoritmusok tartoznak ide az egyszerűbb statisztikai modellektől kezdve az összetettebb neurális hálózatokig, melyek tapasztalatok, előre betanított adatok alapján képesek automatikusan megtanulni egy adott probléma megoldását.
A deep learning valójában a gépi tanulás egy speciális változata, ahol mélyebb összefüggéseket is képes tanulni az eljárás, még jobban minimalizálva az emberi beavatkozás szükségességét. Amikor az A.I. bumm-ot emlegetjük akkor igazából a mélytanulás megjelenésére gondolunk. Leginkább az eredményezte ezt a felfutást, hogy megjelentek azok a hardver elemek, amiken képesek lehetünk értelmes idő alatt lefuttatni ezeket a számításokat.
Hogyan tanulnak az algoritmusok?
Ezt egy felügyelt tanulási (supervised learning) problémával fogjuk szemléltetni. A tanuló algoritmusok mögött az az alapgondolat, hogy lehetséges olyan algoritmusokat készíteni, amik egy bemeneti adatra adnak valamilyen kimeneti predikciót. Tehát szükségünk van adatokra, az adatokból kinyert valamilyen jellemzőre, egy tanuló algoritmusra és a problémára adott válaszokra.
Adathalmaz: Itt gyakorlatilag bármilyen adatra gondolhatunk. Lehet az képi adat, hanganyag, vagy bármilyen adatsorozat. Például a telefonunk gyorsulásmérő szenzorából rögzített adatsor, melyből akár előre jelezhető, hogy éppen mennyire intenzív mozgást végzünk. A jellemző (feature) egy olyan, mintákból előállított reprezentáció, mely jól szemléletei a problémát és már a gép által is értelmezhető formában van.
Tanuló algoritmusok: Itt a gépi tanulás teljes tárháza felsorolható, ami fontos, hogy az egyes megoldásoknak vannak korlátai, futásidőben eltérnek egymástól, és eltérő teljesítményre azaz pontosságra képesek. De ezek az eljárások még nem képesek mélyebb összefüggések megtalálására egy-egy probléma kapcsán. Tehát ha a problémák összetettebb akkor az első lépésbe le kell egyszerűsíteni. Ehhez pedig emberi beavatkozásra van szükség, így az ember a saját intuícióját kódólja bele a megoldásba.
Annotáció: azaz válaszok pedig a problémák megoldásai. Ha a gyorsulás szenzoros példánál maradunk, akkor az idő melyik pillanatában futottunk, sétáltunk vagy éppen pihentünk. Vagy éppen egy zene ajánló alkalmazás esetén fontos, hogy a felajánlott zenét mennyi ideig hallgattuk tovább. Hiszen, ha nem volt jó az ajánlás akkor gyorsan zenét váltottunk. Amennyiben számunkra kedvező eredményt kaptunk szívesen végig hallgattuk akár a teljes zeneszámot.
Tehát megvan az adatunk, az azokból kinyert jellemzők, amik már a gép által értelmezhető formában reprezentálják a problémát és ismerjük, hogy erre milyen választ kell adni a tanuló algoritmusunknak. Ekkor a jellemző minták folyamatos adagolásával “meghajtjuk” az algoritmusunkat, ami valamilyen választ ad. Amikor ez a válasz megközelíti, vagy egyezik az általunk ismert jó válasszal, akkor jutalmazzuk az algoritmusunkat, ha távolinak találjuk akkor büntetjük. Így megtanulja az eljárás, hogy milyen úton tudja a legjobb eredményt elérni.
Miben más a mély tanulás?
A deep learning alapvetően abban más, hogy nincs szükség az egyedi jellemzők/leírók kinyerésére. Ezt már rábízzuk a tanuló algoritmusra. Például egy képfeldolgozási probléma esetén nem az emberi megérzésre támaszkodunk és nem az ember által értelmezhető képből kiszámolható jellemzőket vesszük alapul pl.: élek iránya, erőssége, színek stb.
Ebben az esetben a képből már a tanulás folyamán a tanuló algoritmus ítéli meg, milyen jellemzők írják le jobban a problémát. Így egy összetettebb tanulási folyamatot kapunk, aminek nagyobb a tipikus mintaigénye, nagyobb számítást kell elvégezni, és több időt kell a tanítására szánni. Azonban ebben az esetben a végeredmény tipikusan pontosabb és jobb, mint amelyikbe sok emberi heurisztikát kalkuláltunk bele. Egy gyártósori minőségbiztosítási problémán keresztül részletesebbem bemutatjuk a tanulási folyamatot.
Teljesen más emberi erőforrásokat igényel a deep learning. Ugyanis ehhez a metódushoz arányaiban több adatra van szükség, így megnőnek az adathoz köthető feladatok, mint a rögzítés, az annotálás. Ellenben nincs szükség akkora mértékű gépi látásban jártas szakemberre. Illetve kiküszöböli az emberi megérzés helyességének kockázatát hiszen, hogy mi a fontos jellemzője egy problémának, azt nem mindig találja el elsőre az ember. Ezért azoknak az iterációknak a számát se kell ráfordítani a tanításra, amíg ezek a leírók ideálisan reprezentálják a problémát.