2016
ZH eredmények
Neptun | Pont | Százalék | Eredmény |
G9PTHG | 23 | 88.46 | OK |
Z10I3E | 16 | 61.54 | OK |
NLCAWP | 20 | 76.92 | OK |
EQMJDP | 14.5 | 55.77 | OK |
Z35SBZ | 21 | 80.77 | OK |
Q1A8C5 | 16 | 61.54 | OK |
FQPRHP | 3 | 11.54 | pótZH |
DS5M1P | 4 | 15.38 | pótZH |
WKJAGY | 22 | 84.62 | OK |
A7SOEA | 21 | 80.77 | OK |
CG4GG9 | 11.5 | 44.23 | OK |
HZI1EQ | 23 | 88.46 | OK |
LOGZ28 | 24 | 92.31 | OK |
RVFU1I | 24 | 92.31 | OK |
CN3Y8L | 8.5 | 32.69 | pótZH |
RGIUWF | 12 | 46.15 | OK |
Házi feladatok beosztása: konzulens, adatkészlet, csapatok
Klenik Attila (klenik@mit.bme.hu), AU "Toliet Map", https://data.gov.au/dataset/national-public-toilet-map
Dovala-Gerendai-Antal
Gönczy László (gonczy@mit.bme.hu), NY baleseti adatok, https://data.cityofnewyork.us/Public-Safety/NYPD-Motor-Vehicle-Collisions/h9gi-nx95/data
Ferenczi-Sík-Tárkány
Bartus-Tóth-Urbanovics
Kocsis Imre (ikocsis@mit.bme.hu), UFO Reporting Data, http://www.nuforc.org/webreports.html
Nádudvari-Cseh-Kincses
Vida
Kocsis Imre (ikocsis@mit.bme.hu), 2016 Presidential Campaign Finance, http://www.fec.gov/disclosurep/PDownload.do
Szász-Kemény-Nemes
Hullám Gábor (gaborhu@mit.bme.hu), World University Rankings, https://www.kaggle.com/mylesoneill/world-university-rankings
Dámsa-Hajdú-Kullai
Házi feladat
Amit a házi feladatról elmondtunk:
Dallam
- Big Data eszközökkel, de small (/biggish) data-n
- EDA-stílusú vizualizáció interpretációval és
- Hipotézisek megfogalmazása (CDA, modellépítés: nem követelmény, de pluszpont lehet)
- 3 fős csapatok
- Javasolt: legyen benne > másodéves informatikus
Feladatválasztás listából
- Eseti elbírálással: “hozott” feladat
- Kiírások: honlap (in progress)
- Jelentkezés: google docs, link NEPTUN-on keresztül
- Konzulens minden HF-hez
Teljesítés fázisai (konzulens ellenőrzi)
- 11. hét: Adatszótár (if applicable), fontos szakterületi fogalmak (if applicable), előzetes EDA eredményei (2 oldal) - PDF
- 12. hét: előzetes specifikáció leadása (2 oldal) - PDF
- Analízis-cél és vizualizációs célok meghatározása
- 14. hét: 5 perces (!) előadás
- 14. hét végéig: PDF/HTML dokumentáció és leadása, inkl. forráskódok, szkriptek
Tematika
1. hét: Bevezető. Javasolt segédanyag: tavalyi 1. előadás fóliái.
2. hét: Leíró statisztika. Javasolt segédanyag: tavalyi 2. előadás fóliái - a hisztogram MapReduce közelítése NÉLKÜL
3. hét: Adatvizualizáció. Javasolt segédanyag: tavalyi 5. előadás fóliái.
4. hét: Big data adatvizualizáció. Javasolt segédanyag: a 2014-es 6. előadás fóliái.
5. hét: Schönherz kupa miatt elmaradt.
6. hét: Stream processing, néhány alapvető stream processing algoritmus. Javasolt segédanyag: tavalyi 8. előadás fóliái.
7. hét: Alapvető stream processing algoritmusok folytatása. MapReduce algoritmika a k-means példáján. Javasolt segédanyag: tavalyi 4. előadás fóliái (kiemelten a 2. készlet, R-t és RHadoop-ot ebben a félévben nem oktattunk).
8. hét: Spark alapfogalmak, számítási modell és viszonya a klasszikus MapReduce-szal. Rövid hands-on bemutatás (IBM BlueMix, Spark szolgáltatás, IPython notebook). Javasolt segédanyag: http://spark.apache.org/talks/overview.pdf, kitekintésként: http://spark.apache.org/talks/strata_spark_streaming.pdf
9. hét: ML algoritmusok (Hullám Gábor). Javasolt segédanyag: előadásfóliák, lásd "Segédanyagok".
10. hét: ML algoritmusok (Hullám Gábor)
11. hét: TDK konferencia miatt elmaradt.
12. hét: zárthelyi, a felkészülést segítő ellenőrző kérdéseket lásd a segédanyagok között.