Mérési adatok vizuális elemzése

Senior Lecturer: 
László Gönczy
Instructors: 
László Gönczy
Instructors: 
Imre Kocsis
Instructors: 
András Pataricza

Érdekel, hogyan lesz az adatból információ? Mire jó egy dashboard, mit lehet mondani néhány ezer féle mért adat kapcsolatáról, hogyan találjuk meg a tűt a szénakazalban, mi okoz mi? Hogyan lehet érdekes összefüggéseket megtalálni akár a saját szoftvered működésével kapcsolatban?

Manapság a hűtőgéptől az autóig, az okos épületektől a városüzemeltetésen keresztül a sokgépes szerverparkokig mindenütt gyűjtenek adatokat, azonban sok esetben a gyűjtött adatot soha senki nem használja hasznos célokra. Ennek oka, hogy az adatokat értelmezni és tisztítani kell, a gyakori vagy éppen ritka mintákat és összefüggéseket pedig validálni kell a valós, mért adatok alapján.

Automatizált módszerekkel számos összefüggés kinyerhető, de ezeket átlátni és a tapasztalatokat levonni pusztán számok alapján nehéz. Ezt támogatják a vizuális elemzési módszerek.

A tárgy gyakorlatias megközelítésben tárgyalja az adatfeldolgozás és elemzés kérdéseit, elsősorban olyan területekre fókuszálva, mint a gyártáselemzés és -optimalizálás, informatikai rendszerek teljesítményének tervezése és megfigyelése, felhő alapú kritikus szolgáltatások összehasonlítása, blockchain architektúra kiértékelése,  szűk keresztmetszet keresése banki folyamatok végrehajtásában, termékek gyártásból származó tesztadatok elemzése, stb. Célunk átadni a "statisztika" és a "data science" eszköztárából azokat az alapokat, amik elsősorban vizuális elemzéshez és a diagramok értelmezéséhez kellenek. 

Célkitűzések a hivatalos adatlap alapján:

A műszaki gyakorlatban kulcsfontosságú a tapasztalati adatok gyűjtése és elemzése mind a rendszerek méretezésénél, mind teljesítmény- és időviszonyaik helyességének ellenőrzésénél. Ennek legegyszerűbb, de hatékony és a műszaki szemlélethez közel álló megközelítése a vizuális adatelemzés. Ennek tipikus alkalmazási területei: HW/SW teljesítményvizsgálat, web és felhő alapú rendszerek méretezése, komponensek közti kommunikáció vizsgálata, szűk keresztmetszetek keresése.

A tantárgy alapvető célkitűzése megismertetni a hallgatókat a vizuális adatelemzés alkalmazási lehetőségeivel, elsődlegesen műszaki alkalmazásokban, informatikai rendszerek tervezésében és kiértékelésében. A tárgy statisztikai/elméleti alapozás után gyakorlati példákon keresztül mutatja be az elemzési folyamat főbb feladatait (adatgyűjtés és tisztítás, modellalkotás, feltáró és megerősítő elemzés, stb.).

A tantárgy elvégzése után a hallgatók képesek lesznek méréseket tervezni, benchmarkokból és rendszermonitorozásból/logokból származó adatokat kiértékelni, a rendszer működéséből adódó sajátosságokat (pl. elemek közti függőségek, kapcsolatok) az elemzés során módszeresen felhasználni, ill. a rendszerről alkotott feltételezéseket elemzésekkel kiértékelni és alátámasztani. Az elemzési eredmények hatékonyan fejleszthető, intuitív felületeken keresztül különböző részletességgel és fókusszal tudják megjeleníteni mind informatikusok/rendszermérnökök, mind a rendszerek felhasználói ill. megrendelői számára.

A tárgy oktatása során elsősorban a vizuális megjelenítésre helyezzük a hangsúlyt, korszerű vizuális elemzési technológiákon keresztül ismertetve az alapvető módszereket, emellett kitekintünk a széles körben használt R nyelv interaktív vizualizációs lehetőségeire.