Esettanulmány – sertés húsrészek azonosítása

CallioVision > Esettanulmányok  > Esettanulmány – sertés húsrészek azonosítása
Gyártósori sertés húsrész azonosítás

Esettanulmány – sertés húsrészek azonosítása

Cégünk számára eddig nem ismert piaci szegmensben mutatjuk be, hogy megoldásaink képesek a legmagasabb minőségben az agrárium témakörébe tartozó gyártósori termékazonosításra. Hogy miként került a CallioVision az agráriummal és a húsiparral kapcsolatba arról korábbi blogbejegyzésünkben írtunk. Jelen esettanulmány célja, hogy mesterséges intelligencia hatékony használatát szemléltesse élelmiszeripari környezetben. Részletesen bemutatjuk a problémát, kielemezzük az adatokat, bemutatjuk eredményeinket, és szemléltetjük hogy milyen fejlesztési potenciál van még a rendszerben.

Az adatbázis

A képadatbázist az MCS Vágóhíd Zrt. biztosítja számunkra, amelyet egy tipikus húsipari, élelmiszeripari gyártósori termék felismerés probléma körében gyűjtöttek. Az Bonafarm Csoport alá tartozó MCS Vágóhíd Zrt.-vel cégünk a NAK TechLab keretei között találkozott. Ez a Nemzeti Agráripari Kamara gondozásában megvalósított platform, melynek célja, hogy a hazai agrár nagyvállalatok és a hazai innovatív kisvállalatok között kapcsolatot teremtsen.

A rendelkezésünkre álló adatbázis 42 kategóriát tartalmaz. Sajnálatos módon az adatbázis imbalanszos, azaz egyes kategóriákból nagyon kis számú mintát tartalmaz. Ezen felül az képek két különböző időpontban kerültek rögzítésre vélhetőleg eltérő mobiltelefonnal. Ez utóbbi tulajdonságot azért fontos kiemelni mert se a szenzor zaja, se a rálátás nem azonos az összes képen, ahol az azonosítandó terméket kellene vizsgálni. Ezek mind negatívan hatnak az eredményeinkre. Pozitívan hat azonban a végeredményre, hogy a végső körülbelül száz kategória helyett csak negyvenkettőt tartalmaz.

Augmentáció, azaz Rorschach teszt a húsiparban

Az adatbázis 955 képből áll, 42 osztályba sorolható, azaz átlagosan körülbelül 23 kép tartozik egy kategóriához. Ez a mennyiségű minta nem elegendő ahhoz, hogy kellően átlagos modellt tanítsunk. Főleg úgy, hogy vannak olyan kategóriák melyekbe lényegesen kevesebb minta tartozik, mint a többibe. Így legfontosabb feladatunk, hogy az adatbázis varianciáját növeljük azzal, hogy képmanipuláló eljárásokat alkalmazunk a képeken, ezzel garantálva, hogy a tanító adat kellően átlagos lesz.

Ezek tipikusan a színek vagy a képélesség megváltoztatásával növelik a tanítóadat szerteágazóságát, vagy ha éppen tükörszimmetrikus a probléma felvetés, akkor a képek tükrözése nagyon elterjedt eljárás. Ezeken felül kutattuk azokat az eljárásokat, amik egy neurális hálózatot képessé tesznek arra, hogy kisszámú tanító mintából következtessenek egy a tanító mintától eltérő termék kategóriájára. Ebben láttuk sikerünk kulcsát.

Hús kategorizálás, augmentáció (rorschach teszt)

A legnagyobb javulást elérő képtorzító eljárás, meglepő módon az volt amikor a képeket valahol elvágtuk vízszintesen vagy függőlegesen és az egyik részét tükrözve hozzáadtuk az elvágott képhez. Az így kapott képek az ember számára már kifejezetten zavaróak, és egész furcsa asszociációra ösztönzi az emberi agyat hasonlóan a Rorschach teszthez. Ez kicsit arra utal, hogy a neurális hálózatnak több információt hordoz az egyes húsok textúrája, mint azok formája. Persze direkt ráhatásunk ilyenkor nincs, hogy milyen leírókat választ ki a neurális háló a tanulási folyamat alatt, de egy-egy ilyen furfangos praktikával tudjuk irányítani a folyamatot.

Megoldásunk

Mivel az elkészült neurális hálózat és annak tanítókódja magas hozzáadott értékkel rendelkezik, annak részletes bemutatásától eltekintünk. Erre az információra úgy tekintünk, mint magas értékű know how és nem szeretnénk, ha szaktudásunk nélkül reprodukálható lenne ez az eljárás.

Eredmények

A lenti confusion matrix mutatja, hogy milyen a bemeneti a teszt adathalmazba tartozó képet milyen kategóriába sorolt a neurális hálózat. Mivel ismerjük a bemeneti kép eredeti kategóriáját így ki tudjuk számolni, hogy mekkora a hálózatunk pontossága. Ez jelen esetünkben 95,16%. (weighted accuracy)

MCS Vágóhíd – húsrészek azonosítás a benchmark eredmény

Az is jól látható, hogy két közeli kategória van az adathalmazban ahol a neurális hálózat téveszt. Mind a két kategória sertéscombról készült fényképeket tartalmaz, eltérés annak zsírtartalma. Azaz pontosan a comb felületén mennyi zsírt hagyott a hentes amikor azt feldolgozta. Ezeken a kategóriákon nagy mértékű javulást váron további adatgyűjtés után.

Konklúzió

Az elért eredmények a kihívás kiírója által visszaigazoltan kimagasló. Fontos megemlíteni, hogy észrevételeink alapján kiderült, hogy az átadott adatbázis kis mértékben zajos. Illetve, nagy mértékű javulás várható a nagyobb mennyiségű minták esetén. Ezen felül a kézi adatrögzítésből adódó zaj sem fog problémát okozni a végső eljárásban, így ez is pozitívan hat majd a jóságra.

Tehát várakozásunk, hogy az emberi pontosságot jócskán meghaladó megoldást tudunk biztosítani a kihívásra. Azokban az esetekben, ahol a neurális háló bizonytalan, a gyártósoron kilökést valósítunk meg. Így a kérdéses esetekben emberi validációval kerül a termék kategória meghatározásra, azaz az ügyfél elégedettség nem csökken, sőt középtávon nő, hiszen azokat az adatokat, ahol emberi beavatkozás szükséges, automatizáltan visszavezetjük a tanító adatba, ezáltal egyre jobb eljárást kapunk.