M.I. korlátai: A realitás és a hype közötti szakadék
A mesterséges intelligencia (MI) és annak gyors fejlődése az elmúlt évtizedekben nemcsak a technológiai világot, hanem a köznyelvet is meghódította. Ahogy már részletesen elemeztük korábban az MI általános hátrányait, különös tekintettel az etikai kérdésekre és az emberi életre gyakorolt hatásokra, most a technológiai lehetőségeket és az általános neurális hálózatokat szeretnénk megvizsgálni.
Mi a mesterséges intelligencia és a deep learning? Ezt a kérdést a már egy másik cikkünkben tárgyaltuk. De röviden összefoglalva a mesterséges intelligencia (MI) olyan tudományág, amely az informatika problémáira kreatív válaszokat ad intelligens programok segítségével. 1950 óta aktív kutatási terület tehát nem a napjaink felvetése. A gépi tanulás az MI egyik iránya, ahol tanuló algoritmusok, például statisztikai modellek és neurális hálózatok, tapasztalatok alapján automatikusan megtanulják egy probléma megoldását. A deep learning a gépi tanulás speciális formája, ahol mélyebb összefüggéseket tanul meg az algoritmus. A deep learning (mély tanulás, mélyebb összefüggések keresése a bemeneti adatokon) hardveres fejlődésétől állt a figyelmet középpontjába a közelmúltban, mivel a nagyobb számítási kapacitás komplexebb tanulási folyamatot tesz lehetővé. A köznyelvben ez jelenti manapság a mesterséges intelligenciát és ez az a technológia, ami miatt bekövetkezett az úgynevezett „AI Boom”.
A „AI Boom” és a generatív AI
Az „AI Boom” az 2010-as évek közepétől kezdődő mesterséges intelligencia (MI) területén tapasztalható gyors és példátlan előrehaladást jelöli. A generatív AI további lendületet adott ennek az amúgy is robbanásszerű növekedésnek, jelentős előrehaladást eredményezve a tudományban és más területeken is.
A ChatGPT és a generatív MI technológiák népszerűsége robbanásszerűen nő, de ez jelentős költségekkel is jár. A nagy nyelvi modellek, mint a GPT-3, tanítása több mint 4 millió dollárba kerülhet. Tehát az MI fejlesztési költségei jelentős befektetést jelentenek a vállalatoknak.
Azok a cégek, amelyek jelentős összegeket költenek a mesterséges intelligencia kutatására és rendszereik üzemeltetésére, természetesen profit-orientáltak. Ennek következtében széles körű marketing kampányok és reklámköltésekbe fektetnek, hogy vonzóvá tegyék technológiájukat a felhasználók számára. Ez a stratégia hozzájárul a mesterséges intelligencia iránti növekvő közérdeklődéshez. Fontos megjegyezni, hogy a nyelvi modellek olyan területeken is jól teljesítenek, amelyek az átlagember számára is hasznosak vagy legalábbis érdekesek, ami szintén elősegíti a gyors növekedést és az MI közbeszéd tárgyává válását.
Problémák a valós alkalmazások tükrében
Miután tisztáztuk a mesterséges intelligencia fogalmát és megértettük az “AI Boom” mögötti hatásokat, fordítsuk figyelmünket néhány konkrét példára. Ezek a példák bemutatják, hogy miként jelenthetnek kihívást az MI technológiák a gyakorlatban, és milyen problémák merülnek fel azok alkalmazásakor.
MI Kihívások a Sportközvetítésben: A meccs helyett a partjelző közvetítette az M.I.
Az első példa egy skót másodosztályú focimeccsről szól, ahol az MI-vezérelt kamera közvetítette a meccset, azaz a mozgatta a kamerát hogy a leginkább releváns tartalmat kapják a nézők. A technológiai hiba miatt a kamera folyamatosan a partjelzőre fókuszált a labda helyett, ami nyilván rontotta a szurkolók élményét. A jelenség arra a triviális hibára vezethető vissza hogy a tanító adatokban nem szerepelt kopasz fejű ember, így a neuronháló nem tudott különbséget tenni a partjelző feje és a labda között. Ezen a problémán keresztül az is megérthető hogy az emberi látás és gondolkodás, azaz a világ érzékelése és értelmezése mennyivel összetettebb mint amit amit mesterséges intelligenciának hívunk.
A neurális hálózatok tanításánál a szerteágazó tanító minta fontossága abban rejlik, hogy ez biztosítja a modell általánosíthatóságát és rugalmasságát. Ha a hálózatot különböző típusú és változatos adatokkal tanítják, akkor képes lesz jobban alkalmazkodni és reagálni a változó valós helyzetekre. Ez az eset rávilágít a mesterséges intelligencia korlátaira és arra, hogy az MI mekkora hibákat képes elkövetni, különösen akkor, ha olyan helyzetekkel találkozik, amelyekre nem lett megfelelően betanítva.
Nyelvi modellek zavaros vizein: Az emberi és gépi szöveg közti határ
A legfrissebb kutatások azt mutatják, hogy a ChatGPT akár még az embereket is meg tudja téveszteni az esetek körülbelül 41%-ban, hogy valós személyek kommunikálnak. Érdekesség hogy ugyan ezen a teszten a résztvevő embereket, másik ember is csak az esetek 63%-ban volt képes meggyőzni hogy valós személyek valójában. Ez az aktuális közvéleményt írhatja le talán, ami a túl hype-oltságra utalhat és igazából az embereknek nincs saját tapasztalatuk a nyelvi modellek kapcsán. Érdekes lenne megnézni egy hasonló mérést mondjuk 10-20 évvel ezelőtről, hogy akkor az emberi beszélgető partnereket milyen arányban azonosították helyesen az emberi tesztalanyok.
Nagy vitákat generál a kutatók körében is, hogy tényleg mire képesek ezek a modellek. Alkalmas-e bármilyen kreatív viselkedésre, vagy érzelmek felismerésére és azok lereagálására. Lassan a kérkedők kerülnek többségbe, és azt mondják, hogy mivel az összes interneten fellelhető szöveges tartalommal tanították, így képes bármilyen szituációba belehelyezni magát és onnan „ötletet” meríteni. De ez talán nem más mint a világ legdrágább plagizáló szoftvere. Igazságot nem akarunk tenni csak azt akarjuk bemutatni, hogy a nagy nyelvi modellek kapcsán is rengeteg kutatás folyik, amiket természetesen viták kísérnek, illetve nagyon sokan vélekednek úgy, hogy statisztikailag kiszámíthatóak ezen modell válaszai is, tehát az általánossága csak illúzió.
Egy példán keresztül szeretnénk bemutatni, hogy a nyelvi modellek kapcsán is fennáll az a jelenség, hogy a tanuló mintáktól eltérő környezetben nem tud hatékony lenni. A mesterséges intelligencia írásait felismerő programok, mint a GPTZero, hibásan azonosították az Egyesült Államok alkotmányát és a Biblia részleteit gépi eredetűként. A hiba pontos okát nem tudjuk, de nagy magabiztossággal állíthatjuk, nem használtak hivatalos vagy régies nyelvezetű tanító adat a neurális hálózat tanításakor. Persze az is lehet, hogy ezen minták elnyomásra kerültek a sokkal nagyobb számú internetes tartalom mellett, ahol nyilván nem ez az írásmód és nyelvezet a domináns.
Az itt is észrevehető, hogy nagyon más módon “értelmezi” egy neuronháló a szöveget mint az ember. Mivel azokat igazából nem értelmezi csak szókapcsolatok és öszetettebb szerkezetek előfordulási gyakoriságára támaszkodik. Egy olyan szöveg esetén ami jelentősen eltért a tanult mintáktól, már nem volt képes helyes választ adni.
Az önvezető technológia gátja: Általánosított modellek hiánya
Harmadik és egyben utolsó példánkat az önvezető autózás világából merítjük. A Tesla Autopilot rendszerét megzavarhatja az erős villogó fény, például egy rendőr-, tűzoltó- vagy mentőautó megkülönböztető jelzése. Egy ilyen nemvárt jelenség kezelésére jelenleg nem eléggé általánosak a képelemző és döntéshozó mesterséges intelligenciák, tehát a modern önvezető technológiák még mindig számos kihívással néznek szembe, és további fejlesztésekre van szükség a biztonságos működés érdekében.
Az önvezetés következő lépcsője a level 5-ös önvezetés felé, hogy a nyelvi modellekhez hasonlóan kellően általános modellt tanítsanak, ami sokkal kevésbé lenne érzékeny arra, hogy egy-egy nemvárt esetet kezeljenek. A nyelvi modellek, az internet teljes szöveges tartalmával vannak betanítva, ami lehetővé teszi számukra, hogy széles körű helyzetekre reagáljanak, bár még mindig vannak korlátaik. Az önvezető autók esetében egy hasonlóan általánosított modell fejlesztése jelentős kihívásokkal jár, mivel a világ összes képének és helyzetének tanítása jelenlegi technológiákkal és hardverekkel nem lehetséges. Továbbá, még ha sikerülne is egy ilyen általános modellt létrehozni, annak mérete miatt valós idejű futtatása egy autóban elhelyezhető hardveren jelenleg lehetetlen lenne.
Konklúzió
A cikkünkben a mesterséges intelligencia technológiai kihívásait vizsgáltuk, az AI Boom háttérbejárásától kezdve a konkrét példákon át a jövőbeli kilátásokig. Láttuk, hogy bár az AI fejlett és sokrétű, még mindig számos korláttal és kihívással küzd, legyen szó nyelvi modellekről vagy önvezető járművekről. A példák rávilágítottak az AI rendszerek törékenységére és a további fejlesztés szükségességére. Az AI alkalmazása ígéretes, de fontos a körültekintő megközelítés és a technológiai korlátok tudatosítása.