2011. május 11.

Kalandozások a számítógépes nyelvészet területén - olvasóink élménybeszámolói

Három olvasónk vállalkozott arra hogy megosztja mindenkivel kalandozásait a számítógépes nyelvészet területén. A személyes tapasztalat reméljük segít másoknak is elindulni, végig gondolni saját hátterét és igényeit. Több út vezet a Nirvánába, ezt nem szabad elfelejteni, a beszámolók célja megmutatni milyen lehet ez az út egyes konkrét esetekben, Zoli Legyél te is számítógépes nyelvész posztja pedig jó kiindulópont ha már tisztában vagy magaddal. A levélrészleteket megszerkesztettük, az szerzőkről csak annyi információt közlünk amennyit engedélyeztek. Anna, Kátya, Bence - Köszönjük!




Anna - budapesti mérnök hallgató

A matek képzés elvileg jó azon az egyetemen ahol tanulok, de a diplomamunkámra készülve szembesültem azzal hogy fel kell frissítenem tudásomat. Ebben nekem a Head First Statistics és Head First Data Analysis könyvek sokat segítettek [ezeket itt imutattuk be - a szerk.]. Mivel a szövegbányászathoz elengedhetetlen bizonyos szintű nyelvészeti háttértudás, én Zoli tanácsára Kornai Mathematical Linguistics kötetét dolgoztam fel önállóan és bátran ajánlom mindenkinek aki matekból kellő szinten áll.

Saját tapasztalatom az hogy a túl kevés alkalom nyílik arra hogy összekapcsoljuk az elméletet a gyakorlattal. A HF könyvek ebben tényleg sokat segítenek, praktikus személetükkel nem csak tudásom felfrissítésében segítettek, hanem "alkalmazott" személetmódot adtak.

Bence - villamos mérnök hallgató, Miskolc

Villamos mérnökként én sokat foglalkozom matekkal, ezért nekem a legtöbb "levelezővel" ellentétben ezzel nem volt sok gondom. A számítógépes nyelvészettel azért kezdtem foglalkozni mert TDK és szakdoli témám a beszédfelismerés. Nekem sokat segített Gósy Mária Fonetika könyve és Siptár Fonológiája. A nyelvészetbe úgy általában Pinker A nyelvi ösztöne és a blogon is bemutatott Szilágyi N. Sándor Világunk, a nyelv könyve. vezetett be [Nyelvészet-csak röviden írásunkban további információkat találhatsz kezdőknek szóló anyagokról, Szilágyi könyvét pedig itt mutattuk be - a szerk.]. Anna ajánlására elkezdtem feldolgozni Kornai Mathematical Linguistics könyvét, és a blogon sokszor említett NLTK-val is sokat foglalkozom manapság (ha valaki ismer már egy "hagyományosabb" nyelvet pl Java és/vagy C++, akkor nagyon gyorsan meg fogja tanulni a Python-t!). Annyira megszerettem a témakört hogy mesterképzésre biztos erre a területre fogok jelentkezni.

Kátya - anglisztika szakos MA hallgató Pécs

Nyelvszakos vagyok, ezért a nyelvészet különösen közel áll hozzám. Eredetileg a lexikológia érdekelt, de átnyergeltem korpusznyelvészetre, azon belül pedig az érdekel mennyire produktív egy-egy nyelvi szerkezet, hogyan változik ez időben és milyen különbségek adódnak az egyes regiszterek között. Ehhez viszont le kellett győznöm a sokat emlegetett matek undort, amivel én kora gyerekkorom óta meg vagyok áldva (verve?).

Nekem ez koránt sem ment olyan könnyen, ezért amolyan időutazást tettem mivel az a kötet amit először előkaptam túl nehéznek bizonyult, kerestem egy szájbarágósabbat, de az is túl magas volt, ezért kellett keresnem egy totál hülyéknek valót... Először a Statistics for Corpus Linguistics könyvvel kezdtem, de totál nem értettem [a könyvről szóló ismertetőnket itt olvashatod]. Ekkor fordultam a Head First Statistics könyvhöz, de ebbe is beletört a bicskám. Hosszas keresgélés után találtam rá a Manga Guide to Statistics-re, ami végre tényleg az én szintemen magyarázta el az alapfogalmakat. Persze nem egy gyakorlatias könyv ez, sokkal ikább arra való hogy egy átfogó képed legyen arról mi is az a statisztika. Ekkor vissza szerettem volna térni a HF Stats könyvre, de a valószínűségszámításról szóló résznél elakadtam. Ismét kutakodtam és a Cartoon Guide to Statistics-ben találtam meg azt ami a Manga Guide és a HF könyv közötti szinten van. Ismét felhívom a figyelmet arra hogy ez a könyv sem tanít meg téged a statisztikára, csak egy alaposabb képet ad. Ezek után megint visszatértem a HF könyvhöz, de a valószínűségek kifogtak rajtam... Ekkor Zoli tanácsára a Probability Demystified könyvet beszereztem és végigdolgoztam. Nem egy kalandregény, de nagyon praktikus és érthető! Sok-sok feladattal, kvízzel stb találkozol a könyvben, és lehet vele haladni ha van időd. Ezek után átrágtam magam a HF könyvön végre! Én egy kicsit megbántam hogy megvettem, nekem nagyon idegenek a feladatok benne és szerintem nem totál kezdőknek való. A valószínűségszámítás könyv viszont bejött, ezért megvettem a Statistics Demystified könyvet is és az tényleg bevállt. Én azt javaslom hogy először kezdje a Manga és Cartoon Guide-dal, ezek után a Demystified sorozat darabjait vedd végig. Ha van kedved, pénzed és időd, a HF Stats nagyon jó arra hogy további magyarázatot adjon egy-egy témához.

Most már végra a Statistics for Corpus Linguistics könyvet forgatom :D Nem bánom hogy vissza kellett mennem az alapokhoz mert végre élvezem amit csinálok. Gries Quantitative Corpus Linguistics with R könyvével kiegészítve vissza lehet térni a "nyelvészethez" és az eszközök (mind a statisztika, mind az R nyelv) már nem probléma, hanem eszköz. Tervbe vettem hogy a nyáron megtanulom az SQL alapjait, ezzel remélem teljes lesz a fegyvertáram a kutatáshoz.

Nincsenek megjegyzések: