NYELVÉSZ http://seas3.elte.hu/nyelveszforum/ |
|
Google translate http://seas3.elte.hu/nyelveszforum/viewtopic.php?f=78&t=872 |
Page 1 of 2 |
Author: | rebrus [ 2008. November 17, Monday, 20:19 ] |
Post subject: | Re: Google translate |
Jéé, nem is (én sem) vettem észre, hogy ez van. Annyi kis bigyó van a felületen. |
Author: | szigetva [ 2008. November 17, Monday, 18:37 ] |
Post subject: | Re: Google translate |
OFF fejes te most lebuktál: nem a jobbalsó sarokban levő kis [''idézet] dobozra klikkelve idézel, hanem copy+paste-tel, ezért nem jön neked autómatice, hogy kitől idézel. Nem baj, csak munkásabb így. ON |
Author: | fejes.lászló [ 2008. November 17, Monday, 16:13 ] |
Post subject: | Re: Google translate |
varasdi (aki ragaszkodik hozzá, hogy ez mindig itt legyen) wrote: Témába vág: http://webisztan.blog.hu/2008/11/16/a_g ... gyar_nyelv Épp be akartam linkelni. Mondjuk talán nyelszociológiailag lehetne feldolgozni a kommenteket... |
Author: | oravecz [ 2008. November 16, Sunday, 22:42 ] |
Post subject: | Re: Google translate |
rebrus wrote: Volt már itt, de most is releváns: a mokk/nyti-ben fejlesztett hunglish program pont így, kétnyelvű korpusszal és statisztikai alapon működ, ki lehet próbálni: http://szotar.mokk.bme.hu/hunglish/search/corpus nem, ez csak egy felület a párhuzamos korpusz felett, ami még nem nagyon egy stat. gépifordító |
Author: | rebrus [ 2008. November 16, Sunday, 18:50 ] |
Post subject: | Re: Google translate |
Volt már itt, de most is releváns: a mokk/nyti-ben fejlesztett hunglish program pont így, kétnyelvű korpusszal és statisztikai alapon működ, ki lehet próbálni: http://szotar.mokk.bme.hu/hunglish/search/corpus |
Author: | varasdi [ 2008. November 16, Sunday, 18:03 ] |
Post subject: | Re: Google translate |
Témába vág: http://webisztan.blog.hu/2008/11/16/a_g ... gyar_nyelv |
Author: | nadam [ 2008. May 31, Saturday, 20:56 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá? Nem értek hozzá, de ha van szótáram és morfológiai elemzőm minden nyelvhez, akkor én egyszerűen nagyjából szavakra tokenizálnám, majd megnézném, hogy melyik nyelven találok az adott szövegben a legtöbb valid szóelőfordulást. Szerintem nem érdemes ennél tovább finomítani a dolgot, mert ez is (hacsak nem nagyon rövid és nagyon trükkös a szöveg) halálbiztos eredményt ad. Magyarul a nyelvfelismerés egy triviális feladat pl. a fordításhoz képest. Esetleg a morfológiai elemzés sebességigénye miatt gondolkodnék valami kevésbé megbízható, de gyorsabb megoldáson. Vagy ha nem lenne szótáram és morfológiai elemzőm. (ekkor karakter n-esek statisztikájával dolgoznék) más: Egyébként nem tudja valaki, hogy a 'google translate' az teljesen tisztán statisztikai módon működik? Még morfológiai modelljük sincsen? (Mármint nem a nyelvfelismerésre gondolok most, hanem a fordításra.) Én amúgy a szabálybázisú rendszerek felmelegítésében/újragondolásában/reneszánszában hiszek, vagy legalábbis a hibrid rendszerekben. Míg a mainstream most a statisztikai megközelítés. |
Author: | R_Gabor [ 2008. May 31, Saturday, 14:11 ] |
Post subject: | Re: Google translate |
varasdi wrote: R_Gabor wrote: Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is. Én is elsősorban karakter-n-esekre gondoltam -- azokat viszont nem nagyon nevezik "n-gráf"-nak, mert a "gráf" szó erősen foglalt (annak ellenére, hogy az "n-gráf"-ot etimológiailag talán még indokolható is lehetne esetleg a "graféma-n"-es értelemben használni). Én karakter-ngramnak és ngráfnak egyaránt hallottam már, bár az utóbbit csak informális környezetben, de úgy többektől is ![]() |
Author: | varasdi [ 2008. May 31, Saturday, 14:01 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is. Én is elsősorban karakter-n-esekre gondoltam -- azokat viszont nem nagyon nevezik "n-gráf"-nak, mert a "gráf" szó erősen foglalt (annak ellenére, hogy az "n-gráf"-ot etimológiailag talán még indokolható is lehetne esetleg a "graféma-n"-es értelemben használni). |
Author: | R_Gabor [ 2008. May 31, Saturday, 13:38 ] |
Post subject: | Re: Google translate |
Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is. |
Author: | halmtomi [ 2008. May 31, Saturday, 13:14 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: tucyka wrote: Egyelten egy szó alapján nyelvet azonosít! No comment. Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá? |
Author: | varasdi [ 2008. May 31, Saturday, 13:13 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... Nem "n-gramot" akartál véletlenül írni? A nyelvfelismerés egyébként egy speciális osztályozási feladat, így bármit be lehet vetni, amit annál. |
Author: | tucyka [ 2008. May 31, Saturday, 13:12 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: tucyka wrote: Egyelten egy szó alapján nyelvet azonosít! No comment. Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá? nem tudom, hogy pontosan hogy müködik, de kiprobáltam "mic" nélkül a mondatot és már nem ismerte fel románnak. |
Author: | R_Gabor [ 2008. May 31, Saturday, 13:05 ] |
Post subject: | Re: Google translate |
tucyka wrote: Egyelten egy szó alapján nyelvet azonosít! No comment. Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá? |
Author: | tucyka [ 2008. May 31, Saturday, 12:59 ] |
Post subject: | Re: Google translate |
R_Gabor wrote: Én csak azt szeretném mondani, hogy ellopták a lovainkat! ![]() ![]() ![]() ![]() "mic" román szó. Egyelten egy szó alapján nyelvet azonosít! No comment. |
Page 1 of 2 | All times are UTC + 1 hour |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |