2010. december 17.

Könyvismertető: Oakes; Statistics for Corpus Linguistics

Az előző posztban bemutatott kötet szervesen kapcsolódik össze a most tárgyalt művel. Azonban előre kell bocsátanom hogy ez a kötet nem egy "bevezetés a statisztikába nyelvészeknek", hanem a statisztikai módszerek alapos és érthető bemutatása a korpusznyelvészet területén. Így elsősorban azoknak ajánlom akik már rendelkeznek a szükséges ismeretekkel megértéséhez.


  • Michael P. Oakes: Statistics for Corpus Linguistics
  • Edinburgh University Press 1998
  • 272 oldal









A kötet felépítése
"I would encourage readers to get the most out of this book by using it primarily as a reference book, where relevant sections or chapters are consulted as necessary." - mondja Oakes az előszóban és valóban ebben rejlik a kötet erőssége. Azonban természetesen lineárisan is olvasható a könyv, én a szerzővel ellentétben erre bátorítanám az érdeklődő olvasókat no meg persze az egyes fejezetek végén található feladatok megoldására. A második fejezet egy gyorstalpaló statisztikából, akkor is érdemes elolvasni ha jó alapokkal rendelkezik az olvasó. A második fejezet egy gyöngyszem! Az információelmélet korpusznyelvészeti alkalmazásával kevés helyen foglalkoznak, még kevesebb forrást találhatunk ilyen színvonalon. A kölcsönös információ elemzése napjainkban ismét kezd divatossá válni, ismerete praktikus okokból is jól jöhet. A következő fejezet a klaszteranalízissel (klasztering ill klaszterizáció néven is fut a magyar szaknyelvben) foglalkozik, majd elérkezünk a hagyományos témákhoz. Az ötödik fejezetben kiderül a konkordanciák, kollokációk és egyéb finomságok milyen szép módszerekkel elemezhetőek. Ez az a része a könyvnek, ami a "hagyományos" iskola híveinek is fontos. A hatodik fejezet címe nagyon találó, Literary detective work, a stilometria rejtelmeibe nyújt betekintést. A kötet végén függelékben megtalálhatók a fontosabb tesztek és eloszlások ismertetései, valamit a feladatok megoldásaihoz is találhatunk fogódzókat.

Jó ha tudod
Ez a könyv nagyon fontos, tulajdonképpen a maga nemében egyedül álló. Azonban nem kezdőknek való! Sokakat elbátortalanít hogy szükséges egy minimális statisztikai és adatelemzési készség a korpusznyelvészethez. Szeretnék megnyugtatni mindenkit hogy az alapokat könnyen el lehet sajátítani, és a középiskolai horrorral ellentétben élvezetes lehet a matek ha van mihez kötni. Szerencsére jó minőségű, egyedül, önképzésre is használható könyvek állnak rendelkezésre, melyeket következő posztunkban fogunk az olvasók figyelmébe ajánlani (mégpedig a Head First Labs Statistics, Data Analysis és SQL köteteit). A matekundor legyőzhető! Viszont az angol nyelv elsajátítása nem kerülhető meg! Megértjük hogy sok olvasónk szeretne anyanyelvünkön bevezetődni szeretett tudományunk rejtelmeibe, de ez több okból is lehetetlen melyek tárgyalásától most eltekintenénk. Barátkozzunk meg a ténnyel, hogy a tudomány és a nemzetközi gazdasági élet nyelve az angol, ha szeretnénk kapcsolódni a világban zajló eseményekhez, alkalmazkodnunk kell.

Kapcsolódó olvasmányok
Mind McEnry és Wilson műve, mind a most tárgyal kötet az Edinburgh University Press Edinburgh Textbooks in Empirical Linguistics sorozatában jelent meg. A sorozat sajnos szünetel, mivel egyik tagja sem lett bestseller, még a nyelvészei szakkönyvek eladási számait tekintve sem. Azonban ez nem színvonaluk miatt alakult így, egyszerűen megelőzte korát a sorozat úgy tíz évvel. Most nagy érdeklődés kíséri a sorozatban felvetett problémákat, tíz vagy tizenöt évvel ezelőtt azonban még gyerekcipőben járt ez az irányzat. A technika azonban gyorsan fejlődik és a sorozat többi tagján bizony fogott az idő vas foga. Ez nem jelenti azt hogy nem érdemes olvasni pl a nekünk nem rég interjút adó Oliver Mason Programming for Corpus Linguistics: How to Do Text Analysis with Java című könyvét, de kezdőknek nem ajánlom, mivel megjelenése óta a Java nyelv sokat változott és a példákat ehhez hozzá kell igazítani olvasás során.  Barnbrook Language and Computers kötete is remek, ha az olvasó képes különböző forrásokkal kiegészíteni.

Nincsenek megjegyzések: