Ezek azok a nyelvész-programozói feladatok, amelyekre embert keresünk:
* named entity recognition (magyar + angol), egyrészt a klasszikus kategóriákban (személy, földrajzi hely, intézmény) plusz dátumok, pénzösszegek felismerése
* Enju parser pontosságának növelése a bemeneti mondatok szerkezetének egyszerűsítésével
* ténykinyerés Enju parserrel ill. gépi tanulással
* ragtalanítás magyar szövegre, kontextustól függően
* koreferencia-feloldás (kevésbé lényeges)
* "ugyanabban az évben", "két hónappal később" stb. feloldása (kevésbé lényeges)
Programozói ismeretek esetén szükséges ill. előny:
Python vagy Perl, Prolog, esetleg JAVA, PostgreSQL adatbázis.
Nagyon jó lenne, ha találnánk egy ambíciózus, önjáró, programozásban is jártas kollegát.
A cégről ill. a programról itt találhatók infók:
http://www.in4.hu http://www.iglue.hu,
http://blog.iglue.hu/érdeklődni lehet: Vaskó Péternél:
vangso@gmail.com