OFF
varasdi wrote:
Komlósy például következetesen puszta heurisztikus eszközöknek tartja őket, és --- ha jól értem --- meggyőződése, hogy pusztán a korpuszból nem lehet egy konzisztens nyelvtant "gépitanulni", mert nem homogén az adatállomány. Az adatorientált szemléletű számítógépes nyelvészek viszont nem feltétlenül gondolják így. Na, ez is egy jó kis téma lenne....
ON
De végül is az embergyerek is nemhomogén adatállományból tanul nyelvet, nem? A szülők, rokonok mind-mind más idiolektust beszélnek, nem ritkán más dialektust, és a gyerkőc mégis konzisztens nyelvtant sajátít el. (Vagy nem?)
(Sőt, talán ezzel lehetne adni egy elvileg tesztelhető kritériumot arra, hogy két nyelvváltozatot külön nyelvnek, vagy egy nyelv két dialektusának tekintünk-e:
Def: A és B nyelvváltozatot egy nyelv két dialektusának tekintjük akkor és csak akkor, ha az A-nak és B-nek kitett gyerkőc egy darab konzisztens nyelvtant sajátít el belőlük.
Egy francia apa és olasz anya gyereke valószínűleg két nyelvet fog elsajátítani, míg egy budapesti anya és egy kolozsvári anya gyermeke egyet.)
ON