MI, deep learning, machine learning… avagy hogyan vezessük be a MI-t a cégünkbe

MI, deep learning, machine learning… avagy hogyan vezessük be a MI-t a cégünkbe

Trapp Henci, a Gyártástrendnek készített interjút Szabados Levente, mesterséges intelligencia- (MI-) szakértővel arról, hogy az ipari szereplők hogyan tudják az MI-t munkára bírni, ehhez milyen ismeretek és befektetések szükségesek. Ezzel a cikkel elnyerte a Siemens Press Awards 2018, II. díját.

Az artifical intelligence (AI), magyarul mesterséges intelligencia (MI) úgy lett a mindennapjaink szerves rész, hogy észre sem vettük. AI nélkül nincs chatbot, nincs arcfelismerés és nincs önvezető autó sem. A mesterséges intelligencia elnevezést McCarthy alkalmazta először 1956-ban olyan számítógépes rendszerekre, amelyek képesek bonyolult problémákat megoldani tanulás és felhalmozott tudásból való „következtetés” segítségével. Az MI-modellek gyakorta merítenek inspirációt a biológiai tanulás modelljeiből, fontos tulajdonságuk az adatokban rejlő mintázatok önálló felismerése, egyfajta „tapasztalati tanulás”. A MI olyan kognitív (megismerő) képességeket emuláló számítógépi programok tervezésével és alkalmazásával foglalkozik, mint az optimális problémamegoldás, vizuális vagy akusztikus érzékelés és a természetes nyelvek megértése.

GyártásTrend: Mi a különbség az MI-hoz kapcsolódó két legtöbbet hallott fogalom, a deep learning és a machine learning között?

Szabados Levente: Ezek egymást tartalmazó halmazok nagy átfedésekkel. 1956-ban John McCarthy, egy fiatal matematikaasszisztens a Dartmouth College-ban úgy döntött, hogy csoportot szervez a gondolkodó gépekkel kapcsolatban, és egy 8 hetes nyári egyetemen (The Dartmouth Summer Research Project on Artificial Intelligence) megtárgyalják a fejlesztési területeket matematikusokkal, tudósokkal – ekkor alakult ki az elnevezés is, a mesterséges intelligencia. Már ekkor úgy gondolták, hogy akkora számítógépes fejlődés van, hogy ezek a gépek könnyedén modelleznek kognitív folyamatokat is. Nehéz problémának gondolták akkor a sakkozást, utóbb kiderült, hogy informatikai szempontból ezek nem is annyira nehezen modellezhetők, mert komplex szabályszerűségekről szólnak, amikben a gépek elég jók. (Így lehet, hogy már elég korán győzött egy számítógép sakkban egy emberrel szemben).

Deep learning
A deep learning az idegrendszer által inspirált gépi tanuló modell. Egy mély neurális hálózat, akár több száz rétegben keresi a mélyebb összefüggéseket az adatokban az automatizált döntéshozatalhoz. Sokkal többről szól, mint egyszerű adatbányászat, megtalálja az adatok mély összefüggéseit, esetenként címkézetlen, nyers adatokkal is tud dolgozni, és nagy dimenziószámmal is könnyen elbánik. A neurális hálózatok és a deep learning rengeteg eddig nehéznek minősülő problémára képes megoldást adni. A megfigyelések alapján történő modellezés leghatékonyabb eszközévé vált ez a terület. A neuronhálók mély rétegei képesek a folyamatok összefüggéseinek kinyerésére, az események osztályozására, sőt, predikcióra is.

Az a látszólag egyszerű cselekvés azonban, hogy egy gép felismeri-e a cicát a képen, vagy megismeri-e valakinek a hangját, már sokkal definiálatlanabb, sokkal kevésbé szabályalapú probléma. Emberi szempontból is nagy kihívás írott szabályt adni arra, hogyan kell felismerni valakit a hangja alapján – márpedig a klasszikus gépi tanulási rendszerek épp ezt próbálták megtenni – akkor még kevés sikerrel. Azt azonban már akkor a 80-as években felismerték, hogy az egyszerű neuronhálózatok lehetőségeinek határa sokkal messzebbre vezet, mint azt korábban hitték. A deep learning tehát a neuronhálózatok elemzésével foglalkozik, és keresztapja Geoffrey Hinton, a Torontói Egyetem professzora és a Google AI kutatói karának tagja. Bár az alapokat már az 1980-as években lefektették, akkor még nem nagyon használta senki.

Ehhez képes ma ott tartunk, hogy már rendelkezésre áll akkora számítási kapacitás, hogy elég mély rétegekben tudjuk alkalmazni a neurális modelleket, így most a mély neurális hálók kerültek a fókuszba.

GyT.: Ezzel szemben a machine learning hogyan működik?

Sz. L.: A machine learning egy alkalmazott statisztikai modellezés tág területe, mely során van egy ipari/üzleti probléma, rendelkezésünkre áll valamennyi adat, amelyeket – kis túlzással élve – „rádobálunk a gépre, és kérjük a megoldást”. Tehát nem adunk meg szabályszerűségeket, a géptől várjuk, hogy az összes rendelkezésre álló adatból a kihozza a megfejtést. A gépi tanulás területén belül az elmúlt évek egyik legígéretesebb technológiája a fent említett mélytanulás- (deep learning) alapú modellalkotás. A deep learning úgy különbözteti meg nagy biztonsággal a kutyát a macskától (vagy önvezető autó esetén a járdát az úttesttől), hogy közben nem magyarázza el a rendszernek senki, hogy mit jelent a kutya és a macska. A deep learning nem utánozza az embert, nem tudása van, hanem tudáselsajátítási képessége.

GyT.: Milyen fontos területek vannak jelenleg az iparban, ahol az MI a legnagyobb lehetőségekkel bír?

Sz. L.: Három nagy helyzet van, amikor a mesterséges intelligencia-alapú megoldások optimálisan működni képesek. Az egyik, amikor vannak adataink, amelyek nem teljesen specifikusak a problémánkra nézve – például képek az internetről, rengeteg kép, rengeteg témában. Ez elég ahhoz, hogy erős általános modelleket építsünk fel. Itt kifejezetten szükséges, hogy komoly analógia álljon fent az általános modell és a saját alkalmazási területünk között. A másik eset, amikor nincsenek jelen nagy tömegben általános adatok. Ilyenkor meg kell tanítani a gépi rendszernek, hogy az adott folyamatokból származó adatokat mire használja, ez a specifikus machine learning. A harmadik eset, amikor valaki, aki a modelleket szolgáltatja (például egy népszerű, „cloudon keresztül” elérhető szolgáltatás), kiválóan ismeri az adott területet, nem kell tréningezni, csak testre szabni a folyamatokat, hiszen minél több az adat, annál könnyebben tanul a deep learning rendszer, és feltehető, hogy a szolgáltató a tanítás jelentős részét már elvégezte.

Korábban, amíg mindent helyi szakértők tudásának igénybevételével kellett egyedileg modellezni, borzasztó sokba került egy ilyen fejlesztés, ráadásul egy idő után – a korábbi megoldások limitációi miatt – hiába volt egyre több adat, nem volt fejlődőképes a rendszer. A deep learning ezzel szemben nagyságrendekkel több adatnál is fenntarthatja a tanulóképességét.

GyT.: Tudna példákat hozni?

Sz. L.: Fogjuk meg onnan, hogy milyen érzékszervi területekkel lehet végrehajtani ezeket a feladatokat: képpel, hanggal, adattal. Például a zajjal és egyéb mért adatokkal jelez elő az a prediktív karbantartásra alkalmazott MI-megoldás, amely egy liftforgalmazó szolgáltatása. Ennek során felajánlják ügyfeleiknek, hogy az általuk forgalmazott liftekbe szenzorokat szerelnek, és amikor azok anomáliákat jeleznek, akkor mennek szervizelni, így nem kell a kötelező karbantartási időszakokban feleslegesen kiszállni, és mivel már korábban felfedezik a szenzorok segítségével a meghibásodást, mint az bekövetkezne, azok leállás nélkül tudnak üzemelni és költséghatékonyan karbantartani.

Vagy ott van az alkatrész-minőségbiztosítás klasszikus példája. Emberi erőforrással a minőségbiztosítás úgy néz ki, hogy bizonyos mennyiségű legyártott darab után szúrópróba-szerűen ellenőriznek emberi szemmel néhány darabot. Amennyiben hibát találnak, az addig legyártott mennyiség megy a kukába, hiszen nem tudják egyesével ellenőrizni, melyek hibásak még. Viszont, ha minden egyes alkatrésznél képellenőrzést végez egy gép, és azt összeveti a tökéletes darabbal, akkor jelentős költségeket takaríthat meg a gyártó vállalat.

További kitűnő példa az energiagazdálkodás: a Google DeepMind-rendszerét (mely a mostanság híres gogyőzelmet aratta emberi ellenfelével szemben) alkalmazta saját szerverparkjainak hűtésszabályozására, így közel 40%-os energiaköltség-megtakarítást voltak képesek realizálni.

Ennek ellenére nem csak a nagyvállalatoknak jelent növekedési potenciált az MI, hiszen a legkisebb cégben is méretes adatmennyiség halmozódik fel a bevételekről, a kiadásokról, kommunikációról, annak tartalmáról, a kapcsolati hálózatokról, az alkalmazotti rutinról, a gyártás folyamatáról, a raktározásról, a vásárlásokról. A mesterséges intelligencia területéről származó többféle módszer közül a legtöbb esetben található megfelelő megoldás az adott üzleti problémára.

GyT.: Hogyan álljon neki egy vállalat az MI bevezetéséhez? 

Sz. L.: Három alapvető dologra van szükség az MI alkalmazásához: az üzleti probléma meghatározására KPI-szinten (Key Performance Indicators), például 3%-os selejtarány-csökkenés, amivel egy data scientist tud mit kezdeni. Az adatra, mert ezek a rendszerek adat nélkül nem működnek, továbbá a modellre, amely végrehajtja az adott predikciót, de egyben meg is határozza, hogy milyen erőforrásokra van szükség.

Ha ez megvan, akkor három út lehetséges. Első, hogy tanácsadót kér fel a vállalat, hogy nézze át a folyamatait, adatait. Ilyen jellegű tanácsadást itthon a PWc vagy a Deloitte végez, ők nagyon jók, naprakészek, de vannak a piacon független tanácsadók is.

A másik út az üzleti igény szervezeten belüli erőforrásokkal történő pontos felmérése és a probléma pontos megfogalmazása, majd egy szakértő, data scientist alkalmazása.

Létezik a világban egy mesterséges intelligencia-közösség, a City AI, amely számos városban – többek között Amsterdam.ai, Berlin.ai és Budapest.ai – azokat a gyakorló machine learning szakembereket és az üzleti szereplőket hozza össze, akik tudásukat megosztják, segítik a városok, vállalatok tech-ökoszisztémáját a következő szintre emelni. Ezen a közösségen keresztül szintén van lehetősége egy vállalatvezetőnek AI-segítséget kérni.

Tekintve, hogy munkaerő- és szakemberhiány van, az adatokat ki kell nyitni. A legnagyobb szereplők – Google, Amazon, Nvidia – ki is teszik a saját deep learning eszközeiket open source-ba. Nem ajándékba, hanem használatba adják, hogy jó ökoszisztémával rendelkező eszközök jöjjenek létre, így széles körben lehessen alkalmazni azokat.

A conceptual image of a pair of hands formed form many multi coloured spheres with index fingers outstretched near point of touching in similar pose to Michelangelo's painting 'Creation Of Adam'. At the point of contact there is a bright light and swirling colours which could depict energy, light or intelligence.

GyT.: Egy gyártó vállalatnak a termelési és logisztikai folyamatai hasonlóak. Vannak dobozos MI-megoldások a gyártók számára?

Sz. L.: Igen, vannak a „dobozos” szolgáltatók, amelyek a teljes folyamatra adnak megoldást, és vannak szigetmegoldások is. A platformszolgáltatóknak az a nagy ajánlatuk, hogy machine learningtől a szerverüzemeltetésig mindent elvállalnak. A másik a szigetmegoldások lehetősége, a szervezeten belüli tudásfelhalmozás és erre alapuló megoldások kidolgozása saját data scientist és machine learning szakemberrel. Egy cégen belül ők irányítják azt a szigetcsapatot, amely javítja a folyamatokat, egy-egy megoldással próbálja segíteni a hatékonyságot.

GyT.: Hol találhat egy cég data science szakértőt? Milyen az MI-képzés itthon?

Sz. L.: Ez egy olyan rétegszakma, amelyre az akadémiai oktatás még nem készült fel. Egyelőre hézag van az egyetemi tudás és a modellezési praktikum között. Viszont rendelkezésünkre áll iszonyú mennyiségű tudás, a deep learning forradalomban kifejezetten adnak arra, hogy a tudás elérhető legyen, hogy minél több kurzust írjanak ki az egyetemek vagy épp az olyan vállalatok, mint a Google. Nem véletlen Andrew Y. Ng, a Cursera alapítójának sikere, a machine learning oktatása manapság egy igen jól jövedelmező vállalkozás.

A KÜRT Akadémián 2018-ban indult az AI-képzés, de data scientistnek néhány éve már lehet tanulni.