2010. június 7.

Van-e (számítógépes) nyelvészeti paradigma?

Kuhn paradigma fogalmát nem tudjuk a társadalom- és humán tudományokra egy az egyben ráhúzni, és egy kicsit értelmetlennek tűnhet ezt erőltetni amikor a nyelvészet maga is úgy tűnik hogy ezer megközelítést fogad el. Azonban (szerintem) megmozdult valami!

Akit érdekel jobban mi is az a paradigma, az olvassa el Kuhn A tudományos forradalmak szerkezete c. kiváló művét. Én nagyon hevenyészett módon így jellemezném a fogalmat:
  1. szabályok egy tudományterület problémáinak vizsgálatára
  2. kommunikációs protokollok (hogyan mutatunk be egy problémát, tálaljuk annak megoldását, milyen folyóiratokat járatunk, konferenciázás stb)
  3. indokrinációs utak (kit tekinthetünk az adott tudomány művelőjének?, mit fedjen egy-egy képzési szint az egyetemeken stb)
Ez persze nem egy pontos definíció, de fogadjuk el most egy kicsit. A nyelvészetben szerintem az első pontban nem tudunk megegyezésre jutni. Annyi megközelítés létezik, ahány nyelvész, de legalábbis ahány tanszék. Szerintem ez önmagában nem lehet probléma, hiszen a fizika vagy a természettudományok is rengeteg kis részterületre "estek szét" és talán nincs senki aki egyben tudná látni már a "tudományt". De akkor mi adja ki azt hogy valakit egyszerűen fizikusnak titulálunk és nem terjedelmesen részecske- vagy vagy szilárdtest- nano- stb. fizikusnak. Persze, sokszor ezt a hosszú terminust is alkalmazzuk, de a közembernek csak simán fizikusok.

Én a kettes és hármas pontokban látom azt ami összeköti őket. Egyrészt az indokrináció bevett, a világban szinte mindenhol elfogadott tankönyveken alapul, a tantervek kb. azonosak (eltérés az adott tanszéken oktató emberek kutatási területéből adódik, hiszen választható és magasabb stúdiumok nyilván ebből az irányból lehetségesek csak). De a közös alap megteremti a közös kommunikációs csatornákat, és persze ez visszafelé is igaz.

A nyelvészet területén azonban szerintem más a helyzet. Persze vannak nagy nyelvészeti konferenciák, lehet menni nyári egyetemekre, fasza folyóiratok is akadnak amik nem szűkítik le magukat egy-egy alterületre, és mindenki kedvence a LINGUIST List tényleg mindenről beszámol minden területről (nyelvfilozófiától a fonetikáig tényleg mindenről).

De mi a helyzet az indokrinációval? Nos ez zűrösebb terület! Vannak ugye a nyelvszakosok (ide értve a magyarosokat is), meg a sima nyelvészeket. De vannak akik pszichológiát tanulnak vagy számítástudományt és aztán lesznek nyelvészek. Szerintem ez gyönyörű dolog! De nem szabad elfelejteni hogy ennek veszélyei is vannak!

Ahhoz hogy megtaláljuk a közös hangot, kell egy közös alap. A tudomány nem csak a tudás összehalmozása, hanem kultúra is. De lehet-e ebben a szépséges káoszban rendet rakni? Kell ez nekünk? Az én válaszom egy határozott igen. Nem kell elsorvasztani a sokszínűséget, de egy minimumot meg kell határozni. Ez persze lehet bővíteni (pl alap- mester és PhD képzésre bővítgetni), de ez nem szükségszerű, sőt néhány részt felesleges ahogy egyre jobban szakosodunk.

Itt az én listám:
  1. Alapvető valószínűségszámítás és statisztika
  2. Gráfelméleti alapok
  3. Logika és naiv halmazelmélet
  4. Minimális programozási ismeretek egy OO nyelvben
  5. Korpusznyelvészet és nyelvészeti adatbázisok ismerete
  6. Kísérleti nyelvészet
  7. Szakmai ismeretek (kutatás etika, a szakma szerepe, szakmai szervezetek stb)
Ezt persze ki lehet egészíteni szintaxissal és szemantikával. Vagy éppen egy adott nyelv történeti leírásával, tipológiával stb. De ne felejtsük el hogy egy olyan minimumot keresünk amit egy képzeletbeli pszichológia szak "pszicholingvisztika specializációját" ill egy számítástudomány szak "számítógépes nyelvészet" szakirányát is képviselhetik. Nyilván nem lehet egyszerre bepasszírozni ennyi mindent egy már meglévő szakba, de erről a palettáról lehet válogatni.

Úgy gondolom amíg nincs meg legalább egy minimális közös alap, vagy amíg mindenki magának szedegeti azt össze, addig nem beszélhetünk paradigmáról (az én használatomban). Hogy ez baj-e, azt nem tudom, csak érzem. A poszt végén ajánlott két cikk rámutat ennek hiányára és hátulütőire.

A poszt megírását az alábbi két írás ihlette:
Ted Pedersen: Empiricism Is Not a Matter of Faith, Computational Linguistics September 2008, Vol. 34, No. 3: 465–470.
Stefan Th. Gries: Methodological skills in corpus linguistics: a polemic and some pointers towards quantitative methods

Nincsenek megjegyzések: