Data Science módszerek internetes képi és szöveges adatokon

Témavezető (TMIT): 
Doktori iskola: 
Informatikai Tudományok Doktori Iskola
Kiírás dátuma: 
2017. 01. 03
Érvényesség: 
futó
Téma leírása: 

A kutatási téma leírása:

A strukturált adathalmazok mellett egyre gyakoribb, hogy a strukturálatlan adathalmazokon történik a tudásfeltárás, ahol lehet a cél különféle rejtett összefüggések keresése, információ tömörítés; lehetnek csoportosítási, mintaillesztési vagy predikciós feladatok. Az internetes környezetben ezek a felhasználók által létrehozott strukturálatlan adathalmazok (szöveg, kép, hang, videó) zajosak, igazság tartalmuk különböző mértékben torzítottak, hiszen metaadataikat (címkéiket) általában egyszerű (azaz nem szakértői) felhasználók hozzák létre és kezelik. A kutatás célja ebben a zajos környezetben dolgozó Data Science módszerek kidolgozása és javítása, melyek a gépi tanulás és látás, minta felismerés, jelfeldolgozás, adatbányászat, prediktív analitika tématerületeihez kapcsolódnak. A módszer családok közül a képek, hangok esetén előtérbe kerülnek a mély neurális hálók, melyek használatával általában pontosabb eredményeket lehet kapni, így ígéretes részfeladat a továbbfejlesztésük. A feladat olyan elméleti módszerek kutatása, melyek különböző médiatípusok osztályozási, klaszterezési, regressziós jellegű elemzési problémáinak megoldására alkalmasak zajos adathalmazok mellett is. A részfeladatokhoz tartozik a tartalmak célorientált reprezentálása, ehhez jellemző kinyerő módszereket kell megalkotni; továbbá multimodális problémákhoz olyan elméleti megoldások kidolgozása, melyek elősegíthetik a pontosabb eredményeket.

Kutatási feladatok:

- Osztályozási és klaszterezési algoritmusok kutatása internetes adathalmazoknál.
- Ismert megoldásokhoz hasonló új Data Science módszerek kidolgozása.
- Multimodális problémák elméleti megoldásainak kidolgozása
- Mély és egyéb tanuló módszerek kombinálása és kutatása.

előírt nyelvtudás: angol
további elvárások: 
adattudomány iránti érdeklődés

felvehető hallgatók száma: 1