Mérés alapú modellalkotás és vizualizáció

Mérés alapú modellalkotás és vizualizáció

Vezető kutató: 
Gönczy László

Érdekel, hogyan lesz az adatból információ? Mire jó egy dashboard, mit lehet mondani néhány ezer féle mért adat kapcsolatáról, hogyan találjuk meg a tűt a szénakazalban, mi okoz mi? Hogyan lehet érdekes összefüggéseket megtalálni akár a saját szoftvered működésével kapcsolatban?

Manapság a hűtőgéptől az autóig, az okos épületektől a városüzemeltetésen keresztül a sokgépes szerverparkokig mindenütt gyűjtenek adatokat, azonban sok esetben a gyűjtött adatot soha senki nem használja hasznos célokra. Ennek oka, hogy az adatokat értelmezni és tisztítani kell, a gyakori vagy éppen ritka mintákat és összefüggéseket pedig validálni kell a valós, mért adatok alapján.

Automatizált módszerekkel számos összefüggés kinyerhető, de ezeket átlátni és a tapasztalatokat levonni pusztán számok alapján nehéz. Ezt támogatja az adatvizualizáció, mely, akárcsak a matematikai statisztika, napjaink természet- és társadalomtudományainak és mérnöki gyakorlatának alapvető eszköze. 

Komplex informatikai rendszerek tervezésénél elsődleges fontosságú a rendszer viselkedésére vonatkozó feltételek korai kiértékelése, ideértve a rendszer dinamikus, időbeli viselkedésére vonatkozó elvárásokat. Másfelől, már működő rendszerek újratervezésénél, értelmezésénél fontos feladat a rendszer alapvető tulajdonságainak megértése, melyhez sokszor a megfigyelésekből származó mérési eredmények jelentik a legjobb támpontot.

A vizualizáció eszköze lehet

  • az elemzendő adatok megértésének és hipotézisek megsejtésének;
  • hipotézisek és modellek megerősítésének, vagy
  • az eredmények - lehetőleg minél szemléletesebb - bemutatásának

Az első két tevékenység-kategóriára szokásosan mint felderítő adatelemzés (Exploratory Data Analysis - EDA), illetve megerősítő adatelemzés (Confirmatory Data Analysis - CDA) hivatkozunk. A felderítő adatanalízis alapjait ugyanaz a John Tukey amerikai matematikus dolgozta ki, akinek a bit és szoftver szavakat köszönheti a szakmánk.

Az EDA népszerűségének egyik fő oka, az, hogy mérnökök és közgazdászok a grafikus analízist mély matematikai ismeretek nélkül is hatékonyan végezhetik és a technika rendkívül gyorsan tanulható olyan megközelítés, amellyel bonyolult folyamatok is vizsgálhatóak. Mindenképp további kutatást igényel ugyanakkor ezen módszerek alkalmazása nagy adat (Big Data) problémák esetében.

A rendszer (újra)tervezésének eszköze lehet (amennyiben pl. a rendszer egyes részei még tervezés alatt állnak)  a diszkrét, eseményalapú szimuláció, melyet üzleti folyamatoktól beágyazott rendszerekig számtalan területen használnak.  Szimulációs módszereket használnak új rendszerek tervezése mellett működő rendszerek újratervezésénél is pl. a tesztelési igény kiváltására. A szimuláció paraméterezése épülhet az adatelemzés során feltárt összefüggésekre.

Csoportunk fenti módszereket az utóbbi években több nemzetközi ipari K+F projektben is sikeresen alkalmazta felhő infrastruktúrák menedzsmentje, üzleti folyamatok optimalizálása, szoftver folyamatok menedzsmentje és gyártástámogatás terén. Az oktatásban szimulációs és adatvizualizációs eszközöket alkalmazunk a Rendszermodellezés, Kiberfizikai rendszerek, Big Data elemzési módszerek, Mérési adatok vizuális elemzése valamint az Intelligens adatelemzés tárgyakban. A feladatcsoporthoz kapcsolódóan számos gyakorlati esettanulmány példáiból válogatunk. A témacsoport oktatói szakmai több díjat nyertek vizualizációs megoldásokkal.

Megismerhető technológiák: 

A feladatcsoport tipikus témái/technológiái:

  • Szimuláció paraméterezése naplózott adatok alapján. Szimuláció használata alternatív modellek kiértékelésére.
  • Logelemzés és log alapú modellépítés (nagy IT rendszerek, gyártás, üzleti folyamatok/szabályrendszerek, ...)
  • Vizuális adatelemzési technológiák (Tableau, GGobi, Mondrian, processing és processing.js, d3.js, R, Shiny, Python, ...)
  • R és csomagjai
  • Dashboard készítés (PowerBI), "storytelling" adatok felett.
  • Weboldalakbba ágyazható interaktív megjelenítők.
  • Adatok és rendszermodell összekapcsolása.

Mintának néhány korábbi feladat: