'Big Data' elemzési módszerek

Oktatók: 
Dr. Kocsis Imre
Oktatók: 
Pataricza András
Korábbi oktatók: 
Salánki Ágnes

A tárgy célja a Big Data problémakör megoldását biztosító eszközök és módszerek áttekintése, a nagy adatmennyiségből adódó speciális problémák kezelése. A tárgyaláshoz több szempontból előnyös, közös nevező a komplex modellek használata, valamint az adatok hatékony ábrázolása, vizualizációja, ide értve a vizuális adatelemzés lehetőségeinek áttekintését is.

Tárgyfelelős: Dr. Pataricza András

(Ábra forrása: http://www.mckinsey.com/insights/business_technology/big_data_the_next_f...)

Kiknek ajánljuk a tárgyat?

A tárgy hallgatói megismerhetik a nagy méretű adathalmazok elemzésére szolgáló legfontosabb elemzési megközelítéseket és platformokat. A Big Data specifikus kérdések tárgyalása előtt általános célú adatelemzési bevezetést tartunk (hansúlyosan: leíró statisztika, felderítő adatelemzés, vizualizáció), így a tárgy anyaga szinte teljes egészében önhordó, elsajátítása különleges előképzettséget nem igényel. Így jó szívvel ajánljuk minden mérnökhallgatónak :) Az egyetlen valós előkövetelmény, hogy a hallgató legalább egy kurrens/a területen jellemző programozási vagy szkriptnyelvet alapszinten ismerjen (Python, Java, Scala, R, SQL, ...) - ez a házi feladat megoldásához szükséges. Mindemellett a házi feladatok megoldása csoportosan történik, így "mankóként" adott esetben lehet a másik csapattag(ok)ra támaszkodni.

A tárgy tematikája tekintetében komplementer a ’Big Data’ elemzési eszközök nyílt forráskódú platformokon c. tárggyal. Így javasolt a két társtárgy együttes felvétele, vagy egymás után elvégzése (tetszőleges sorrendben). A társtárgyak felvétele egymástól függetlenül is lehetséges.