Szövegelemzési siker a big data versenyen

Ahogy a big data világában egyre nagyobb szerepet kapnak a technológiát, a gépi tanulást és az üzleti folymatokat egyaránt jól művelő data scientist-ek, úgy egyre több olyan versenyt indítanak, ahol összemérhetik erejüket a területen jártas kollégák. Míg korábban főleg adatbányászati, gépi tanulási versenyek értünk el kiemelkedő eredményeket, manapság a big data versenyeken is bizonyítjuk, hogy a hazai adatelemzési szakma nemzetközi mércével is kiemelkedően jó.

Barta Gergő kollégánk indult a TEXATA Big Data Analytics World Championships (http://www.texata.com) versenyén. Az október közepén megrendezett selejtezőn elméleti kérdések és big data szöveganalitikai feladatokkal szűrték le a 2000 jelentkezőt, hogy a legjobb 20%-nak már egy komolyabb második fordulót szervezhessenek. Ebbe a közel 400 fős mezőnybe jutott be Gergő kollégánk, a Dmlab doktorandusza, akinek a következő megmérettetésen 4 óra alatt kell majd megoldani Thomson-Reuters hírek elemzésével kapcsolatos feladatokat. Egy ilyen rövid ideig tartó versenyre érdemes jelentős fegyverarzenállal érkezni, több Hadoop alapú big data megoldást és egy közepes méretű klaszter kerül bevetésre a feladat hatékony megoldásához. A forduló legjobb 12 versenyzője egy hatalmas show keretében Texas-ban méri majd össze tudását november utolsó napjaiban.