NYELVÉSZ
http://seas3.elte.hu/nyelveszforum/

Google translate
http://seas3.elte.hu/nyelveszforum/viewtopic.php?f=78&t=872
Page 1 of 2

Author:  rebrus [ 2008. November 17, Monday, 20:19 ]
Post subject:  Re: Google translate

Jéé, nem is (én sem) vettem észre, hogy ez van. Annyi kis bigyó van a felületen.

Author:  szigetva [ 2008. November 17, Monday, 18:37 ]
Post subject:  Re: Google translate

OFF
fejes te most lebuktál: nem a jobbalsó sarokban levő kis [''idézet] dobozra klikkelve idézel, hanem copy+paste-tel, ezért nem jön neked autómatice, hogy kitől idézel. Nem baj, csak munkásabb így.
ON

Author:  fejes.lászló [ 2008. November 17, Monday, 16:13 ]
Post subject:  Re: Google translate

varasdi (aki ragaszkodik hozzá, hogy ez mindig itt legyen) wrote:
Témába vág: http://webisztan.blog.hu/2008/11/16/a_g ... gyar_nyelv


Épp be akartam linkelni. Mondjuk talán nyelszociológiailag lehetne feldolgozni a kommenteket...

Author:  oravecz [ 2008. November 16, Sunday, 22:42 ]
Post subject:  Re: Google translate

rebrus wrote:
Volt már itt, de most is releváns: a mokk/nyti-ben fejlesztett hunglish program pont így, kétnyelvű korpusszal és statisztikai alapon működ, ki lehet próbálni:

http://szotar.mokk.bme.hu/hunglish/search/corpus

nem, ez csak egy felület a párhuzamos korpusz felett, ami még nem nagyon egy stat. gépifordító

Author:  rebrus [ 2008. November 16, Sunday, 18:50 ]
Post subject:  Re: Google translate

Volt már itt, de most is releváns: a mokk/nyti-ben fejlesztett hunglish program pont így, kétnyelvű korpusszal és statisztikai alapon működ, ki lehet próbálni:

http://szotar.mokk.bme.hu/hunglish/search/corpus

Author:  varasdi [ 2008. November 16, Sunday, 18:03 ]
Post subject:  Re: Google translate

Témába vág: http://webisztan.blog.hu/2008/11/16/a_g ... gyar_nyelv

Author:  nadam [ 2008. May 31, Saturday, 20:56 ]
Post subject:  Re: Google translate

R_Gabor wrote:
Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá?

Nem értek hozzá, de ha van szótáram és morfológiai elemzőm minden nyelvhez, akkor én egyszerűen nagyjából szavakra tokenizálnám, majd megnézném, hogy melyik nyelven találok az adott szövegben a legtöbb valid szóelőfordulást.

Szerintem nem érdemes ennél tovább finomítani a dolgot, mert ez is (hacsak nem nagyon rövid és nagyon trükkös a szöveg) halálbiztos eredményt ad. Magyarul a nyelvfelismerés egy triviális feladat pl. a fordításhoz képest.
Esetleg a morfológiai elemzés sebességigénye miatt gondolkodnék valami kevésbé megbízható, de gyorsabb megoldáson. Vagy ha nem lenne szótáram és morfológiai elemzőm. (ekkor karakter n-esek statisztikájával dolgoznék)

más:
Egyébként nem tudja valaki, hogy a 'google translate' az teljesen tisztán statisztikai módon működik? Még morfológiai modelljük sincsen? (Mármint nem a nyelvfelismerésre gondolok most, hanem a fordításra.)
Én amúgy a szabálybázisú rendszerek felmelegítésében/újragondolásában/reneszánszában hiszek, vagy legalábbis a hibrid rendszerekben. Míg a mainstream most a statisztikai megközelítés.

Author:  R_Gabor [ 2008. May 31, Saturday, 14:11 ]
Post subject:  Re: Google translate

varasdi wrote:
R_Gabor wrote:
Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is.


Én is elsősorban karakter-n-esekre gondoltam -- azokat viszont nem nagyon nevezik "n-gráf"-nak, mert a "gráf" szó erősen foglalt (annak ellenére, hogy az "n-gráf"-ot etimológiailag talán még indokolható is lehetne esetleg a "graféma-n"-es értelemben használni).


Én karakter-ngramnak és ngráfnak egyaránt hallottam már, bár az utóbbit csak informális környezetben, de úgy többektől is :)

Author:  varasdi [ 2008. May 31, Saturday, 14:01 ]
Post subject:  Re: Google translate

R_Gabor wrote:
Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is.


Én is elsősorban karakter-n-esekre gondoltam -- azokat viszont nem nagyon nevezik "n-gráf"-nak, mert a "gráf" szó erősen foglalt (annak ellenére, hogy az "n-gráf"-ot etimológiailag talán még indokolható is lehetne esetleg a "graféma-n"-es értelemben használni).

Author:  R_Gabor [ 2008. May 31, Saturday, 13:38 ]
Post subject:  Re: Google translate

Én nem szó n-esekre, hanem karakter n-esekre gondoltam, azt hívják n-gráfnak, ha jól tudom. De nyilván lehet n-grammokkal is.

Author:  halmtomi [ 2008. May 31, Saturday, 13:14 ]
Post subject:  Re: Google translate

R_Gabor wrote:
tucyka wrote:
Egyelten egy szó alapján nyelvet azonosít! No comment.

Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá?
Én is úgy hallottam, hogy n-gramokkal működik, a Manning-Schützében van is ilyen házi feladat, ilyet írni.

Author:  varasdi [ 2008. May 31, Saturday, 13:13 ]
Post subject:  Re: Google translate

R_Gabor wrote:
Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak...


Nem "n-gramot" akartál véletlenül írni? A nyelvfelismerés egyébként egy speciális osztályozási feladat, így bármit be lehet vetni, amit annál.

Author:  tucyka [ 2008. May 31, Saturday, 13:12 ]
Post subject:  Re: Google translate

R_Gabor wrote:
tucyka wrote:
Egyelten egy szó alapján nyelvet azonosít! No comment.

Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá?


nem tudom, hogy pontosan hogy müködik, de kiprobáltam "mic" nélkül a mondatot és már nem ismerte fel románnak.

Author:  R_Gabor [ 2008. May 31, Saturday, 13:05 ]
Post subject:  Re: Google translate

tucyka wrote:
Egyelten egy szó alapján nyelvet azonosít! No comment.

Biztos, hogy így működik? Nem csak egy feature a sok közül? Valamikor még úgy hallottam, hogy a nyelvfelismerők többnyire n-gráfokkal dolgoznak... De nincs itt valaki, aki ért hozzá?

Author:  tucyka [ 2008. May 31, Saturday, 12:59 ]
Post subject:  Re: Google translate

R_Gabor wrote:
Én csak azt szeretném mondani, hogy ellopták a lovainkat!
Image

:D :D :D

"mic" román szó.
Egyelten egy szó alapján nyelvet azonosít! No comment.

Page 1 of 2 All times are UTC + 1 hour
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/