Beszédfelismerés és hangbányászat csoport (LSR)

Laborvezető: 

Csoportunk közel két évtizede foglalkozik a beszédfelismerés kutatásával, fejlesztésével és oktatásával. A gyakorlati alkalmazhatóság kezdettől kiemelt célunk volt, a parancsszavak felismerésétől mára a természetes nyelvű beszéd a valós idejű (illetve akár nagyságrendekkel gyorsabb!) szöveges leiratozásáig jutottunk. Büszkék vagyunk rá, hogy eredményeink nemcsak közvetve (pl. Európai Bizottság Fordítástámogatási Osztály), hanem közvetlenül is hasznosulnak, ma már szinte mindenki által elérhetően (pl. MTVA élő műsorok feliratozása).

A gépi beszédfelismerés szépsége, hogy számos témakör mélyreható ismerete szükséges a világszínvonalú műveléséhez, úgymint gépi tanulás, véges állapotú gépek, statisztika, fizikai akusztika, fonetika, természetes és programozási nyelvek, script-nyelvek, illetve mindinkább mélytanulás és GPU programozás. Fontos kiemelni, hogy a 2010-es évek elejétől a "deep learning" berobbanásával a beszédfelismerési technológiák hatalmas fejlődésen mentek keresztül és ez a fejlődés nemcsak, hogy nem állt meg, de talán még gyorsul is. Számos izgalmas lehetőség áll rendelkezésre a kutatójelöltek számára, hogy ebbe a folyamatba bekapcsolódjanak.

Mi nemcsak követjük a gyors fejlődést, de részint alakítjuk is, különös tekintettel a magyar nyelvre. Mára a technológiai eszközök és nyelvi erőforrások soha nem látott számban és minőségben állnak rendelkezésre, azonban ezek a megfelelő szakértelem nélkül mit sem érnek. Legyen szó akár angol, magyar, lengyel, német, román vagy éppen svéd - netán latin - nyelvű beszédfelismerési feladatról, tudunk független megoldást javasolni. Széleskörű ipari tapasztatokkal valamint nemzetközi kapcsolatrendszerrel rendelkezve segítjük a hozzánk érkező hallgatók pályára állítását, illetve az érdeklődő cégek, kutatócsoportok specializált beszédfelismerési igényeinek kiszolgálását.