2016

ZH eredmények

Neptun Pont Százalék Eredmény
G9PTHG 23 88.46 OK
Z10I3E 16 61.54 OK
NLCAWP 20 76.92 OK
EQMJDP 14.5 55.77 OK
Z35SBZ 21 80.77 OK
Q1A8C5 16 61.54 OK
FQPRHP 3 11.54 pótZH
DS5M1P 4 15.38 pótZH
WKJAGY 22 84.62 OK
A7SOEA 21 80.77 OK
CG4GG9 11.5 44.23 OK
HZI1EQ 23 88.46 OK
LOGZ28 24 92.31 OK
RVFU1I 24 92.31 OK
CN3Y8L 8.5 32.69 pótZH
RGIUWF 12 46.15 OK

 

Házi feladatok beosztása: konzulens, adatkészlet, csapatok

Klenik Attila (klenik@mit.bme.hu), AU "Toliet Map", https://data.gov.au/dataset/national-public-toilet-map

Dovala-Gerendai-Antal

Gönczy László (gonczy@mit.bme.hu), NY baleseti adatok, https://data.cityofnewyork.us/Public-Safety/NYPD-Motor-Vehicle-Collisions/h9gi-nx95/data

Ferenczi-Sík-Tárkány

Bartus-Tóth-Urbanovics

Kocsis Imre (ikocsis@mit.bme.hu), UFO Reporting Data, http://www.nuforc.org/webreports.html

Nádudvari-Cseh-Kincses

Vida

Kocsis Imre (ikocsis@mit.bme.hu), 2016 Presidential Campaign Finance, http://www.fec.gov/disclosurep/PDownload.do

Szász-Kemény-Nemes

Hullám Gábor (gaborhu@mit.bme.hu), World University Rankings, https://www.kaggle.com/mylesoneill/world-university-rankings

Dámsa-Hajdú-Kullai

Házi feladat

Amit a házi feladatról elmondtunk:

Dallam

  • Big Data eszközökkel, de small (/biggish) data-n
  • EDA-stílusú vizualizáció interpretációval és
  • Hipotézisek megfogalmazása (CDA, modellépítés: nem követelmény, de pluszpont lehet)
  • 3 fős csapatok
  • Javasolt: legyen benne > másodéves informatikus

Feladatválasztás listából

  • Eseti elbírálással: “hozott” feladat
  • Kiírások: honlap (in progress)
  • Jelentkezés: google docs, link NEPTUN-on keresztül
  • Konzulens minden HF-hez

Teljesítés fázisai (konzulens ellenőrzi)

  • 11. hét: Adatszótár (if applicable), fontos szakterületi fogalmak (if applicable), előzetes EDA eredményei (2 oldal) - PDF
  • 12. hét: előzetes specifikáció leadása (2 oldal) - PDF
  • Analízis-cél és vizualizációs célok meghatározása
  • 14. hét: 5 perces (!) előadás
  • 14. hét végéig: PDF/HTML dokumentáció és leadása, inkl. forráskódok, szkriptek

Tematika

1. hét: Bevezető. Javasolt segédanyag: tavalyi 1. előadás fóliái.

2. hét: Leíró statisztika. Javasolt segédanyag: tavalyi 2. előadás fóliái - a hisztogram MapReduce közelítése NÉLKÜL

3. hét: Adatvizualizáció. Javasolt segédanyag: tavalyi 5. előadás fóliái.

4. hét: Big data adatvizualizáció. Javasolt segédanyag: a 2014-es 6. előadás fóliái.

5. hét: Schönherz kupa miatt elmaradt.

6. hét: Stream processing, néhány alapvető stream processing algoritmus. Javasolt segédanyag: tavalyi 8. előadás fóliái.

7. hét: Alapvető stream processing algoritmusok folytatása. MapReduce algoritmika a k-means példáján. Javasolt segédanyag: tavalyi 4. előadás fóliái (kiemelten a 2. készlet, R-t és RHadoop-ot ebben a félévben nem oktattunk).

8. hét: Spark alapfogalmak, számítási modell és viszonya a klasszikus MapReduce-szal. Rövid hands-on bemutatás (IBM BlueMix, Spark szolgáltatás, IPython notebook). Javasolt segédanyag: http://spark.apache.org/talks/overview.pdf, kitekintésként: http://spark.apache.org/talks/strata_spark_streaming.pdf

9. hét: ML algoritmusok (Hullám Gábor). Javasolt segédanyag: előadásfóliák, lásd "Segédanyagok".

10. hét: ML algoritmusok (Hullám Gábor)

11. hét: TDK konferencia miatt elmaradt.

12. hét: zárthelyi, a felkészülést segítő ellenőrző kérdéseket lásd a segédanyagok között.