Elosztott gráfalgoritmusok megvalósítása Apache Flink környezetben

A hálózatkutatás célja, hogy nagyméretű gráfok (hálózatok) struktúráját jellemezze, pl. a csomópontok fokszámeloszlásának meghatározásával. Klasszikusan a hálózatkutatás egyféle éltípust tartalmazó gráfokkal foglalkozott, többféle éltípust tartalmazó, ún. többdimenziós hálózatok (multidimensional, multiplex vagy multilayered network) elemzése csak az elmúlt évtizedben kezdődött. Emiatt nem érhetők el olyan függvénykönyvtárak, amelyek képesek hatékonyan, skálázható módon kiszámítani ezeket a metrikákat.

A MapReduce számítási modellt megvalósító Apache Hadoop keretrendszer indította reneszánsz nyomán több nyílt forráskódú, elosztott számításokat támogató keretrendszer is készült, különböző számítási modelleket megvalósítva (pl. Pregel, Gather-Apply-Scatter stb.). Kifejezetten nagyméretű gráfok feldolgozását támogatja az Apache Flink keretrendszer Gelly függvénykönyvtára, az Apache Spark keretrendszer GraphX függvénykönyvtára és az Apache Giraph keretrendszer. Egyik rendszer sem tartalmaz azonban beépítetten többdimenziós metrikákat számítására alkalmas eljárásokat.

A hallgató feladata, hogy a tanszéken folyó kutatásba bekapcsolódva egy kiválasztott eszközön kidolgozza és implementálja multidimenzionális gráfmetrikák számítását.

Jelleg: 
Elméleti és gyakorlati
Advisor: 
Gábor Bergmann
Advisor: 
Gábor Szárnyas
TDK lehetőség: 
TDK lehetőség
Megismerhető technológiák: 
Java, Apache Flink, Apache Giraph
Előismeretek: 
gráfelmélet, programozás alapjai
Állapot: 
Folyamatban