2010. december 14.

Könyvismertető: McEnry - Wilson; Corpus Linguistics An Introduction

Napjainkban a korpusznyelvészeti módszertan reneszánszát éli, azonban sajnos a hazai felsőoktatásban még nem vált általánossá oktatása (habár vannak biztató jelek). Talán ezért kérték sokan hogy ajánljunk olyan könyveket melyeket önállóan is feldolgozhatnak az érdeklődők. McEnry és Wilson műve egy alapos és átgondolt bevezetés azok számára akik már rendelkeznek egy minimális háttérrel (azaz hallgattak már egy nyelvészeti bevezető tárgyat, vagy olvastak bevezető jellegű műveket - akik ezt még nem tették meg, Nyelvészet - csak röviden posztunkban találhatnak információt arról hol érdemes elkezdeni a témával való ismerkedést). Augusztusban bemutattuk Meyer English Corpus Linguistics művét, ami egy áttekintést ad a témáról, az informatika területéről érkezők számára ajánljuk hogy olvassák el azt a rövid bevezető munkát mielőtt belekezdenek ebbe a komolyabb munkába, nyelvész és egyéb bölcsész olvasóinknak pedig ajánljuk hogy statisztikai ismereteiket elevenítsék fel, vagy ha ezen a téren nem járatosak, olvassák el Statisztikai túlélőkészlet posztunkat ami talán segíthet elindulni a területen.








A könyv felépítése
A kötet erőssége hogy nagyon logikusan építkezik, az egyes fejezetek lineárisan egymásra épülnek. A hét fejezet összességében egy átfogó képet ad a korpusznyelvészetről, ha az olvasó aktívan dolgozza fel (azaz elgondolkodik a feladatokon és veszi a fáradságot hogy utána nézzen a kapott információknak) akkor a gyakorlatban is használható tudásra tehet szert. Az első fejezetben alaposan körüljárják a szerzők a korpusznyelvészet történetét és angol nyelvű könyvektől szokatlanul kitérnek más nyelvekre is. Külön hangsúlyt kap hogy a korpusznyelvészetet mint kutatási módszert mutassák be és ennek során az elméleti viták bemutatásától sem idegenkednek. Számomra ez a legizgalmasabb fejezete a könyvnek, hiszen valljuk be nem egy kalandregény egy ilyen bevezető mű. A második fejezetben arra kapunk választ hogy mi is az a korpusz, hogyan néz ki és mi van benne. Itt szükséges az aktív feldolgozás, hiszen a szerzők értelemszerűen nem mutatják be részletesen az egyes markup nyelveket, hanem gyakorlati problémákat és lehetséges kezelésüket mutatja be. Érdemes nem csak elolvasni a szöveget, hanem az interneten rákeresni az egyes projektekre és egy kicsit olvasgatni a témában. A harmadik fejezet elvileg a kvantitatív adatelemzésről szól, de itt is csak arra szorítkoznak a szerzők hogy a technikai részletek mellőzésével bemutassanak pár fontos módszert. Habár ez is érdekes önmagában, de annak aki nem rendelkezik statisztikai ismeretekkel, ez kínainak hangzik. Azonban ez a szerzők tudatos döntése, hiszen a részletes statisztikai bevezetés szétfeszítené a kötet kereteit. Annak aki tübbet szeretne tudni az elemzési módszerekről, forduljon Oakes Statistics for Corpus Linguistics könyvéhez (amivel egy sorozatban jelent meg a most bemutatott könyv) amiről hamarosan közlünk egy ismertetőt. A negyedik fejezetben megismerhetjük miképp használhatók a korpuszok a különböző nyelvészeti aldiszciplinákban. Ezek után egy külön fejezetben mutatják be a szerzők hogy a számítógépes nyelvészet miképp  hasznosíthatja a korpusznyelvészet eredményeit (ezt a részt sok szakmabelinek ajánlanám). A hatodik fejezet egy esettanulmányon keresztül mutatja be "élesben" a munkát a hipotézis megformálástól a korpuszfeldolgozásán keresztül a konklúziók levonásáig.

Kiknek ajánlható?
Első sorban azoknak ajánljuk a könyvet akik, ahogyan azt már említettük, rendelkeznek bizonyos előismeretekkel. A legtöbbet akkor tudjuk kihozni belőle ha a testvér kötettel együtt tanulmányozzuk, valamint kiegészítjük Stefan Th Gries Quantitative Corpus Linguistics with R: A Practical Introduction könyvével. Sajnos (vagy szerencsére?) nincs egyetlen átfogó mű a területről mivel annyira szerteágazó lett hogy mára lehetetlen egy ilyen megírása. De kellő kitartással az előbb említett hármas jó alapokkal szolgálhat. Önmagában a Statistics for Corpus Linguistics értelmetlen, a most bemutatott kötet helyezi kontextusba, Gries könyve pedig megismertet minket a nyelvi elemzés technikai oldalával. Azonban nem szabad elfelejteni hogy az ilyen művek nem regények, nem várhatjuk hogy passzív elolvasásukkal bármit is elsajátítunk. A kitűzött feladatok megoldása, saját mini projektek készítése, a problémákon való gondolkodás elengedhetetlen része a tanulásnak. Így senki ne gondolja hogy a rövid, két-háromszáz oldalas kötetekkel hamar végezhet, jó esetben is egy évre elegendő anyagot jelent ez ha valaki belevág. Viszont kifizetődik az intellektuális kalandok során szerzett élményekkel és azzal hogy egy manapság egyre divatosabb és keresettebb szakma alapjait sajátíthatja el az erre vállalkozó. Egyre több cég jelenik meg a piacon akik adatokat gyűjtenek, rendszereznek vásárlóik számára, ezek a cégek pedig előszeretettel vesznek fel nyelvészeket is (l. pl. a Factual karrier oldalát!), mivel lassan standard hogy értenek ehhez a dologhoz, hiszen korpuszokkal dolgoznak.

Nincsenek megjegyzések: