NYELVÉSZ

Nyelvészeti vitafórum
It is currently 2024. March 28, Thursday, 9:55

All times are UTC + 1 hour




Post new topic Reply to topic  [ 43 posts ]  Go to page Previous  1, 2, 3  Next
Author Message
 Post subject: Re: Gépi fordítás
PostPosted: 2008. May 11, Sunday, 9:50 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Foglalkozott már valaki azzal a jelenséggel, hogy a magyar névutók helyett pontosan mikor használunk/használhatunk igekötőt?

Arra gondolok, hogy a következő mondat:

Winston slipped through the doors

Ehelyett:

Winston surrant az ajtókon át.*

Erre fordul:

Winston átsurrant az ajtókon.

De pl.

Winston slipped into the room through the door

Az meg így fordul:

Winston besurrant a szobába az ajtón át

(Részletesebben a blogom legutóbbi bejegyzésében filózok erről.)


Top
 Profile  
 
 Post subject: Re: Gépi fordítás
PostPosted: 2008. April 29, Tuesday, 22:52 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Indítottam egy blogot a gépi fordító rendszeremről.
Már három bejegyzés megvan, ebből már láthatjátok, hogy miről fog szólni és milyen stílusban.
Szerintem sok érdekes nyelvészeti kérdés fog előjönni mintegy 'magától', szóval mindenkit szívesen látok:

http://cybertrans.blog.com

(Kicsit lassú ez a blog.com, de előbb utóbb azért le szokta hozni az oldalt.)


Top
 Profile  
 
 Post subject: Re: Gépi fordítás
PostPosted: 2008. March 5, Wednesday, 19:29 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Kössz, rákerestem a "File Change Semantics"-ra a weben, és amit eddig látok belőle az tényleg ugyanazt a témát feszegeti!


Top
 Profile  
 
 Post subject: Re: Gépi fordítás
PostPosted: 2008. March 4, Tuesday, 22:15 
Offline

Joined: 2004. November 10, Wednesday, 21:53
Posts: 2548
nadam wrote:
Azt is szívesen olvasom, hogy melyik spanyolviaszt találtam ki éppen! :)
Nem annyira spanyolviasz, csak hogy tudd, a dinamikus szemantika egyik változatát találtad ki. Azon belül is az Irene Heim által 1982-ben kitalált File Change Semantics egyik változatát, ha jól látom.


Top
 Profile  
 
 Post subject: Re: Gépi fordítás
PostPosted: 2008. February 24, Sunday, 15:36 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Írtam egy kis cikket arról, amin mostanában gondolkodom:

http://nadamhu.extra.hu/cilcikk.html

Akinek konstruktív javaslata/kritikája van, az ne kíméljen!
Azt is szívesen olvasom, hogy melyik spanyolviaszt találtam ki éppen! :)


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 16:51 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
gaborkata wrote:
Nagyon nem értek egyet azzal, hogy a magyar-angol irány könnyebb. Nem a szemantika, hanem a szintaxis miatt szerintem elképesztően nehéz a magyar mint forrásnyelv

Nekem is úgy tűnt, hogy a szintaktikai elemzés nehezebb magyar-angol irányban, bár én még csak a másik irányt próbáltam... Viszont, ha egyszer a szintaktikai problémák nagyrészt megoldódnak, és már a szemantika lesz a szűk keresztmetszet - amire szerintem van esély - akkor szerintem a magyar-angol irányban kevesebb lesz a fordítási hiba, mert mintha általában kevesebb lenne az 'ambiguity' a magyarban. De ez csak egy vélemény, könnyen lehet, hogy tévedek...


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 15:04 
Offline

Joined: 2007. June 1, Friday, 9:04
Posts: 8
Location: Budapest
Kösz a megjegyzéseket!

Szemantika: kb egy tucat szemantikai jegyet használtunk (élőlény, ember, absztrakt, ilyesmik), azokat viszont kimerítően. Már ez is meglepően látványos eredményt tud produkálni - de persze csak akkor, ha a mondatelemzés többi része is jó.
Nagyon nem értek egyet azzal, hogy a magyar-angol irány könnyebb. Nem a szemantika, hanem a szintaxis miatt szerintem elképesztően nehéz a magyar mint forrásnyelv, bár én az angol-magyarban (ebben) nem dolgoztam.

A tulajdonnevek és az időhatározók sokat rontanak, ezt tudjuk, tervezzük is, hogy még idén foglalkozunk vele. És hosszú távon lehet, hogy szofisztikáltabb szemantikát is fogunk használni, bár a mostani hibák egyelőre nem elsősorban a gyér szemantikából adódnak.


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 13:40 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Még egy teszt, ez már nem hibajelentés, inkább csak próbálom feltérképezni, hogy hogyan működik a rendszer, illetve mit tud.

Variációk egy témára (aposztrófok között a fordítások.)

'Vedd el a pénzemet! - Take away my money.'
Tök jó!

'Vedd el a lányt! - Marry the girl.'
Nagyon jó, van itt kezelve a szemantika kérem!

'Vedd el Juliskát! - Marry Juliska.'
Ez még jobb! Azt hiszem, hogy a tulajdonnevet személynek veszi, és személy esetén a 'Marry' a fordítás!

'Vedd el a pénzem! - Marry it my money!'
Itt csak az volt a probléma, hogy szintaktikailag nem ismerte fel a mondatot, mert nincs ott az explicit tárgy rag; két részletben pedig így sikerül fordítani.

'Azt vedd el, aki a legjobban tetszik! - Marry it, who in the best one likes!'
Itt már túl bonyolult volt a szintaktikai szerkezet.

'Kedves lány! - He is a kind girl!'
Itt elég nagy hiba, hogy a rendszer nem figyel a nemek egyeztetésére!


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 13:02 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
szigetva wrote:
nadam wrote:
Még apróbb dolog: felkiáltójelet úgy látom mindig lenyeli, míg pl. a kérdőjelet nem
Nem azért, mert az angol felszólító mondatokat nem felkiáltójellel írják, a kérdőket viszont kérdőjellel? (Általában.)

Ok, ezt akkor visszavonom.


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 12:47 
Offline

Joined: 2004. November 10, Wednesday, 18:20
Posts: 2183
nadam wrote:
Még apróbb dolog: felkiáltójelet úgy látom mindig lenyeli, míg pl. a kérdőjelet nem
Nem azért, mert az angol felszólító mondatokat nem felkiáltójellel írják, a kérdőket viszont kérdőjellel? (Általában.)


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 11:53 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
Egyébként nem tudom, hogy erről mi a véleményetek, de nekem meggyőződésem, hogy (túllépve a szintaktikai problémákon, amik talán nehezebbek ebben az esetben) magyarról angolra könnyebb fordítani, mint angolról magyarra. Szerintem a magyar szövegekben átlagosan kevesebb a szemantikai többértelműség. Nem tudom, hogy volt-e erre valami tudományos mérés, de nekem nagyon így tűnik, hogy így van.
Viszont az angol-magyar gépi fordításnak nagyobb szerintem a piaca: nem véletlen, hogy ti is azzal kezdtetek.


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 11:13 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
gaborkata wrote:
Elkészült és online kipróbálható a MorphoLogic, a Nytud és az SZTE közös fejlesztésű magyar-angol fordítója:

http://www.webforditas.hu

Mindenféle megjegyzés welcome!

gk


Ígéretes.
A bonyolult nyelvtani szerkezetekben előforduló problémákról nem írok, ezeket nagyon jól tudom, hogy milyen nehéz kezelni.

Csak egyszerű mondatokról írok észrevételeket: gondolom ezeket az észrevételeimet könnyen kezelni tudjátok:

Bizonyos explicit ige nélküli kérdőszavas kérdéseknél úgy látom nem ismeri fel a nyelvtani szerkezetet:

Miért félénk az a kutya? - Why shy that dog?
Miért szép ez a kép? - Why beautiful this picture?
Hol a kulcs? - Where the key?

Apróság: A módhatározószó az ige elé kerülhetne az angol mondatban.
A kutyák mindig ugatnak. - The dogs bark always.

Még apróbb dolog: felkiáltójelet úgy látom mindig lenyeli, míg pl. a kérdőjelet nem:
Hagyd el a termet! - Leave the hall.

A következő egyszerű mondatnak nagyon furcsa a fordítása, nem tudom mi lehet az oka:
Úgy hívják, hogy Jókai Mór. - It is called in that manner, that Jókai Mór.

Tulajdonképpen a fordítható szavakat tartalmazó tulajdonnevek tesztelésétől jutottam ide:

Úgy hívják, hogy Nagy Ádám. - It is called in that manner, that big Ádám.

Itt fel lehetne ismerni, hogy a Nagy-t nem kell lefordítani. (Ha biztosra mentek, és nem akartok a nagybetűkből kiindulni, akkor legalább a leggyakoribb kereszt és vezetéknevek adatbázisával megoldható.)

És akkor még ez is megoldható: (Ez azért trükkösebb, mert az első nagybetű lehetne a mondatkezdés is.)
Nagy Ádám vagyok.- I am big Ádám.

Érdekes, hogy az 'elhagyom'-ot nem mindig ugyanúgy fordítja. Van valami szemantikai heurisztikátok? Mondjuk itt nem jól működik:

Elhagyom a cigarettát. - I leave the cigarette.
6 órakor hagyom el a várost. - 6 clocks I give up the city.

Mondjuk a szemantika nehéz probléma; az utóbbi esetben inkább a '6 órakor' fordítási hibája az, ami talán könnyen kezelhető lenne.


Last edited by nadam on 2007. June 21, Thursday, 13:03, edited 2 times in total.

Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 21, Thursday, 9:36 
Offline

Joined: 2007. June 1, Friday, 9:04
Posts: 8
Location: Budapest
Elkészült és online kipróbálható a MorphoLogic, a Nytud és az SZTE közös fejlesztésű magyar-angol fordítója:

http://www.webforditas.hu

Mindenféle megjegyzés welcome!

gk


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 16, Saturday, 13:58 
Offline

Joined: 2007. May 3, Thursday, 20:24
Posts: 27
varasdi wrote:
Ez egy főállású kutatócsoportnak is elég munka lenne. Nem akarlak lebeszélni róla, de azért gondold át, nem lenne-e érdemesebb valami már meglévővel próbálkozni... :)

Azon most elgondolkodtam, hogy a wordnet-ből induljak ki legalább a kategóriák terén... Bár még így is reménytelenül sok munka, csak egy komolyabb korpuszt csinálni is... Nem is gondolom, hogy egyedül véges időn belül végeznék. Én csinálom, mert nagyon érdekel, és reménykedem, hogy eljutok majd olyan állapotba, amikor már mások is érdemesnek látják a becsatlakozást.

Egyébként melléktermékként van egy szerintem nagyon elegáns magyar morfológiai generátorom. Azt lehet, hogy nyílt forrásúvá teszem.


Top
 Profile  
 
 Post subject:
PostPosted: 2007. June 16, Saturday, 13:30 
Offline

Joined: 2004. November 11, Thursday, 12:46
Posts: 1080
nadam wrote:
Ha jól értem varasdi szavait, az Arisztotelészi kategorizálás az önkényes, míg a természetes kategorizálás az valamilyen jól meghatározott tudományos kritériumok alapján térképezi fel a hierarchiát. (Javítsatok ki, ha rosszul értem.) Ebben az esetben tehát valószínűleg érdemes nekem is ezeket a természetes kategóriákat felvennem.


Nerm mondanám, hogy az egyik helyes, a másik nem: a célod dönti el, melyiket érdemes alkalmaznod. A WN annak idején egyébként éppen a gépi fordítást megkönnyítendő lett elképzelve, de ma már minden másra is használják (de persze word-sense disambiguation-re is).

nadam wrote:
Készítek egy jó nagy korpuszt, ami emberek választásait tartalmazza, hogy mely mondatok esetén melyik értelmezést választották... És akkor megpróbálok valami gépi tanuló (vagy inkább evolúciós) módszert kitalálni, ami éjjel nappal fut a számítógépemen, és megpróbálja apránként változtatgatni mind a kategóriahierarchiát, mind az erre alapuló sémákat. És akkor talán az én önkényes ontológiám elindul lassan az optimális irányban... Vagy nem, mert pillanatok alatt beáll valami lokális optimumba. Hamarosan kiderül... Illetve nem hamarosan, mert borzasztóan lassan haladok egyedül, szabadidőmben.


Ez egy főállású kutatócsoportnak is elég munka lenne. Nem akarlak lebeszélni róla, de azért gondold át, nem lenne-e érdemesebb valami már meglévővel próbálkozni... :)


Top
 Profile  
 
Display posts from previous:  Sort by  
Post new topic Reply to topic  [ 43 posts ]  Go to page Previous  1, 2, 3  Next

All times are UTC + 1 hour


Who is online

Users browsing this forum: No registered users and 2 guests


You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot post attachments in this forum

Search for:
Jump to:  
cron

Figyelem!
A faliújságon megjelentek nem képviselik többek közt a következő szervezetek hivatalos véleményét:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group