Tanulás adatokból a mesterséges intelligencia segítségével
Az adaptáció és tanulás eddig többnyire az élőszervezetek képességeihez volt kapcsolható, de a mesterséges intelligencia fejlődésével kezd megváltozni.
Tanulás alatt azt értjük, hogy a környezetnek megfelelően módosítjuk és javítjuk viselkedésünket. Persze a tanulás fogalmának definíciója, ennél azért természetesen összetettebb. De ez a mi nézőpontunkból most nem releváns, nézzük inkább meg, hogy a mesterséges intelligenciával kapcsolatba mit jelent a tanulás.
Hogyan tanul a mesterséges intelligencia?
A mesterséges intelligenciának tárházában léteznek olyan algoritmusok, melyek képesek tanulni. A gépi tanulás lényege, hogy a környezeti hatások által, a tanuló rendszer javítja teljesítőképességét. A rendszer adott bemenetekre előzetesen megadott, kívánt válaszokat kap, ha azt eltalálta, akkor jutalmazzuk, ha nem, akkor büntetjük. Ezt több iterációba ismételjük, ezáltal remélhetőleg egy ideális optimumba jutunk el.
Azonban nagyon kritikus a tanítóadat meghatározása a mesterséges intelligenciával kapcsolatban. Ez azt jelenti, hogy a tanító adathalmaztól jelentősen eltérő minták esetén a hatékonyság csökken. Ezért nagyon körültekintő módon kell a tanítóadatot meghatározni, törekedni kell arra, hogy a lehető legnagyobb spektrumban, szerteágazó adat birtokában kezdjük el a tanítást.
Ezáltal tudjuk garantálni, hogy olyan jellemzőket választ ki a mély tanulás, melyek elég általánosak, hogy a tanítóadattól eltérő mintákon is aránylag magas hatékonyságot érjünk el. Illetve minimalizáljuk azokat a szituációkat, amikor nem várt szituációba kellene döntenést hozznia.
Hogyan alakítsuk ki a képi tanító adatbázisunkat?
Ez képi adatok tekintetében a legszerencsésebb, ha az összes lehetséges környezeti vagy egyéb eltérést sorra vesszük és mindegyikből reprezentatív mennyiségű mintát gyűjtünk. Példákon keresztül be is mutatjuk mire is gondolunk.
Eltérő kamerák
A használat során előforduló kamera típusokról mindegyikéről kell képeket szerepeltetni a tanítómintákban. Mivel a kamerákba lehetnek eltérő szenzorok, eltérő képjavító eljárások, ezek ráadásul lehetnek adaptív megoldások is, azaz egy-egy környezeti változásra nem úgy és nem ugyanolyan gyorsasággal reagálnak az egyes kamerák.
Amikor a telefonunkkal fényképet készítünk sötétben és hirtelen felkapcsoljuk a villanyt megnézhetjük, hogy milyen gyorsan tudja átállítani a kép mintavételezési idejét, ez például egy ilyen kamera specifikus paraméter. Vagy hogy sötétben milyen zajos a kép, az a szenzor és a későbbi képjavítások saját tulajdonsága. Ezzel kizártuk a különböző kamerákból fakadó eltéréseket.
Változatos környezeti hatások
Amire még reagálni kell, azok a környezeti hatások. Például a rendszámfelismerő megoldásunk esetén, szükséges volt bel- és kültéri képek gyűjtése eltérő napszakokban, eltérő időjárási körülmények között.
Az eltérő időjárási viszonyok közti adatgyűjtés az egyik legnehezebb és nagyon hosszú feladat. Ha tanító adatbázisunkban szerepeltetni akarunk havas, esős, napsütéses képeket akkor ez belátható, hogy legalább fél éves átfutású folyamat.
Mit is kell detektálni
Miután kizártuk a környezeti hatásokat is, már csak a megfigyelt objektumok közötti eltérésekre kell figyelmet fordítanunk. Ha az arcfelismerő megoldásunkat vesszük alapul több korcsoportból, minden nemből, különböző arcszőrzettel és frizurával volt szükségünk tanító adatra.
Folyamatos finomhangolás
Újabb és újabb adat gyűjtésével lehet további javulást elérni. Így azt is mondhatjuk, hogy ez egy végtelenségig tartó folyamat, idővel a tized és század százalékokkal is harcolhatunk, ha szeretnénk. Szükséges leszögezni, hogy egy idő után már nincs összhangban a befektetett munka és az abból fakadó javulás