2010. október 30.

Matematika és logika nyelvészeknek

A számítógépes nyelvészet területére két irányból szoktak érkezni az emberek. Az egyik típus az informatika vagy a matematika irányából. Számukra a nyelvészeti/nyelvtani arzenált kell pótolni. A másik típus az, aki a bölcseleti irányból érkezik. Számukra az informatikát és a matematikát kell pótolni. Most az utóbbiaknak szeretnék egy kis segítséget, olvasnivalót ajánlani a kezdéshez.



Általános nézet, hogy akik bölcseleti irányból érkeznek, nekik nehezebb dolguk van, mert az informatika és a matematikai lemaradásokat kell pótolniuk. Szemben az első típussal, mert a jelenlegi nyelvészeti kutatások többsége már kiválóan használja és alkalmazza a teljes formalizmust. A generatív nyelvészeti irányzatok már egyre több simán képletbe foglalható nyelvi sajátságot tudnak a kezünkbe adni. A megfelelő képletek segítségével kvázi nyelvészeti tudás nélkül is automatikusan felhasználhatóak egy gépi elemzés során. Például a helyesírási rendszerek kiépítésére a szabályalapú megközelítés nagyon használható, de a statisztikai rendszerek is kiváló eredménnyel dolgoznak ('Big data' és nyelvészet á la Google). Ahogy a nyelvdetekciónál, a nyelvfelismerésnél is a Rejtett Markov Modellek a divatosak és eredményesek. Mindkettő olyan terület, amely eredetileg nyelvészeti eszközökkel igyekeztek megoldani, de a technika rohamos fejlődése mellett már a szabályalapú technikákat megelőzték az inkább mérnöki meggondolások. – Amikor az első próbálkozások voltak, hogy igénybe vegyük a számítógépet nyelvészeti problémák megoldására, akkoriban nagyon lényeges volt a számítási kapacitás figyelembevétele. Ez kedvezett a szabályalapú megközelítéseknek. De onnantól kezdve, hogy ez már szinte lényegtelen – a sebesség még fontos szempont természetesen -, már nem volt hatalmas probléma az, ha több számítást kell végezni azonos eredményhez. A gépparkok már a rendelkezésünkre állnak, hogy ezt a megnövekedett kapacitásigényt kiszolgálják.

Négy könyvet szeretnék ajánlani azok számára, akik bölcseleti irányból érkeznek a pályára. Mind a négy általam is sokat használt, forgatott könyv. Ezek csupán ajánlások, mert rengeteg jó könyvet lehet találni, amivel elindulhat az ember.

Először is Alberti Gábor Matematika a természetes nyelvek leírásában című könyvét ajánlom. A könyv két kötetből áll. Az első része a matematikai alapokkal foglalkozik. Míg a második rész, szorosan az elsőre támaszkodva megismerkedhetünk a formális nyelvtan definiálásával, a Chomsky-féle nyelvhierarchiával, a különböző szinteken megjelenő formális nyelveket mutatja be folyamatosan párhuzamba állítva az azonos típusú automatákkal. A második kötet globális kohézióját a formális nyelvek tartják egyben, de közben olyan kitérőkkel is találkozhatunk, mint a k-vezérlés (c-command) és az m-vezérlés (m-command) formális definíciója, és különbsége. A második kötet az igazán izgalmas, ahol nyelvészeti ismereteink lap-lap után felelevenítődnek. Az első része a könyvnek pedig tartalmazza az összes olyan fogalmat, amire szükségünk lehet, ha idő közben elfelejtettük volna.

A könyvnek csak olyan hátránya van, ami a könyv céljából kifolyólag kimaradt a tárgyalásából. Például a logika és a statisztika. Illetve a könyvben sokat reklámozott Algebrai kötet, ami sajnos, azóta sem jelent meg nyomtatásban. Az algebra alapjait elsajátíthatjuk, de az algebrai struktúrákat már nem tárgyalja. Ha ez a három terület is bővebben érdekel bennünket, akkor egy másik könyv után kell néznünk.

A következő számomra sokat segítő könyv a Mathematical methods in linguistics. Itt már sem algebrából, sem logikából nincs hiány. A matematikai alapok körülbelül fedik az Alberti könyvet, de külön érdekessége a háromszerzős műnek, hogy az alapokat áttekintve egy konkrét nyelvi elemzésbe, az angol, mint formális nyelv elemzését tárgyalja a könyv. Pontos nyelvi alkalmazásokkal találkozhatunk egy argumentum-konfigurációs nyelv esetében. Ez a rész különösen hasznos mindenki számára. Az argumentum-konfigurációs nyelvek iskolapéldája általában az angol nyelv, de az itt feltárt eredményeknél az univerzalitás fontos szempont, így más – azonos paraméterű – nyelveknél is felhasználható.

Következő kedvencem a Introduction to Montague Semantics. A Mathematical methods-ban logika területén csak az elsőrendű predikátumlogika kerül tárgyalás. Montague szemantikájának – a formális szemantika alapítójának – viszont az alapja már a típusos logikák. Akik szeretnének a jelentéssel is foglalkozni, azok számomra alapmű Montague munkássága, de ajánlom ezt a munkát előtte. Ez a didaktikailag megszerkesztett mű sokat segíthet a kezdeti lépések megtételében. Vagy magyar nyelven a Formális szemantika könyv a Bölcsész Konzorcium gondozásában. – Az informatikában járatosabbaknak tudom még ajánlani Sebestyén Gábor szemantikával kapcsolatos anyagait. Itt például már az is előkerül, hogy egy logikai fordítást hogyan tudjuk implementálni például Assembly nyelvre. – Az általam ajánlott könyvek pedig inkább a szintaxissal való kapcsolat, a szintaxissal párhuzamosan felépíthető formális szemantikát hangsúlyozzák.

Ha a jelentés mellett szeretnénk olyan eszközöket is megismerni, amelyek segítenek kiszűrni egy társalgásból a kigyűjthető információkat, akkor a következő lépés lehet Enikő dinamikus episztemikus logika felhasználásáról szóló posztja, ahol bemutatja, hogy a nyelvi redundancia miként használható fel például a társalgások elemzése során, a felek közti megállapodás mérésére.

Végül egy utolsó ajánlás egy füzet. A kis, csupán 125 oldalas kis összefoglaló Baranyai Károly munkája Matematika nyelvészeknek címen. Én egyszer megpróbáltam megszerezni, de egy hét után feladtam a dolgot. Ehhez mindenképp könyvtárhoz kell fordulnunk, hogy beszerezhessük. (A többi ajánlás is elérhető az egyetemi könyvtárak többségében!) Önálló feldolgozásra nem javaslom. A Pázmányon tartott matematikai bevezetőhöz készült, hogy segítse a diákokat. Ezért inkább összefoglaló jellegű, amely didaktikus keretet az előadással és a szemináriummal együtt nyer. Nagyon jól lehet használni összefoglalóként. Logikát nem tartalmaz, de cserébe a gráfok és a statisztika is bekerült a könyvbe.

Mi maradt ki a tárgyalásból? A statisztika. Baranyai munkáján kívül egyik sem tárgyalja ezt a témakört, pedig sokat utaltunk már rá a blogon is - e posztban is előkerült -, hogy a statisztikai elemzések egyre nagyobb teret hódítanak a szabályalapú megközelítéssel szemben. – Ebben a témakörben Zoli Valószínűség, statisztika és nyelv posztjához irányítom az olvasót.

Nincsenek megjegyzések: