NYELVÉSZ
http://seas3.elte.hu/nyelveszforum/

MNSz kérdés
http://seas3.elte.hu/nyelveszforum/viewtopic.php?f=5&t=725
Page 1 of 1

Author:  prezzey [ 2007. October 22, Monday, 17:35 ]
Post subject: 

Titoktartási kötelezettségem van :P De hamarosan kiderül.

Author:  fejes.lászló [ 2007. October 22, Monday, 10:37 ]
Post subject: 

És nem osztod meg velünk, h mire kell? Naaaaa...

Author:  prezzey [ 2007. October 22, Monday, 0:25 ]
Post subject: 

Quote:
Ehhez az összes találatra van szükséged, amiből vmi szkript kiszámolja az allmorfok eloszlását.


Igen, egy ilyet szerettem volna, csak nem sikerült végrehajtani.

gyarmz megoldása működik, valóban 'kicsit' lassú, de lefut (közben vele mailben is futottunk pár kört). Ezer hála és köszönet mindkettőtöknek!!

Author:  peeta [ 2007. October 21, Sunday, 23:14 ]
Post subject:  Re: MNSz kérdés

Ha jól értem az allomorfok gyakoriságára vagy kiváncsi. Ez az MNSZ-ben nincs explicit benne, hiszen "csak" morfológiailag vannak az alakok elemezve, allomorfológiailag (fonológiailag) nem. Ehhez az összes találatra van szükséged, amiből vmi szkript kiszámolja az allmorfok eloszlását. (Közbe látom, gyarmz válaszát, elvileg annak jónak kell lennie, bár meghalasztjuk vele a corpust...)

Azért megnéztem: a webkorpuszban van 109082 superessivussal taggelt alak, amiknek csak az utolsó két betűjét vizsgálva ez adódik (a nem -on, -en, -ön végűek vagy más toldalékot is tartalmaznak, vagy -n allomorfúak, ezeket össze kell adni, valamint a teggelés itt nem olyan pontos, mint az MNSZ-ben és nincs egzértelműsítés sem):

Code:
  36930 on
  25610 en
  15930 án
  10013 én
   9591 in
   5168 ön
   3242 ón
   1955 őn
    270 űn
    196 ún
     99 un
     19 ün
     13 -n

Author:  gyarmz [ 2007. October 21, Sunday, 23:06 ]
Post subject:  Re: MNSz kérdés

Hát nem egy felh.-barát, de végül ez asszem megcsinálja (pl. -ön SUP-ra):

- szóalak
- (.*)ön
- névszó jellegü
[...]
- eset: -n

Author:  prezzey [ 2007. October 21, Sunday, 22:17 ]
Post subject:  MNSz kérdés

Hiperbéna vagyok, szóval a mai sokpontos kérdés a következő:

hogyan nyerhetem ki az MNSz-ből azoknak az alakoknak a gyakoriságát, amik különböző superessivusi (vagy akármilyen más esetbeli, de most legyen ez a példa) toldalékokkal vannak, egyenként, tehát pl hány db -on végű van, hány db -ön, stb.

Nem az kell, hogy hány db simán -on-ra végződő szó van (az megvan) és nem is az, hogy hány db superessivusra végződő szó van összesen (az is megvan). Hanem hogy a konkrét alakokból hány db van (ugye a simán *ön végű szó keresése azért nem jó, mert pl "Ödön" is -ön-re végződik). Miután szépen be van taggelve az egész, ezek után gondolom, hogy valahogy a felületen is képesnek kellene lennem ilyen kereséseket csinálni, de nem sikerül, a GYIK alapján se, mást megkérdeztem és neki se, stb. Mindig vagy "0"-t kapok, vagy pedig belevesz a keresés olyanokat is, amik nem SUP-ra végződnek.

Page 1 of 1 All times are UTC + 1 hour
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/