2012. február 29.

Könyismertető: Huff - How to Lie with Statistics

Ahogy egy kedves olvasó csipkelődve megjegyezte a minap, lassan statisztika bloggá válik a Számítógépes nyelvészet. Ettől nem kell félni, de tény hogy tudományunkban egyre nagyobb szerepe van a statisztikának, sőt a "hagyományos" nyelvészetben sem mehetünk el mellette. Ez a kis könyv nem ígér mást mint hogy megmutatja hogyan vezethetnek minket félre a statisztika leplébe öltözött jelenségek. Minimális matematikai ismeretek (kb. általános iskolai szint) és közepes angol nyelvtudással követhető az írás és habár önmagában is megáll, legjobban talán mint amolyan motiváló elő- vagy kiegészítő olvasmány szolgálja a tudásra éhes tömegeket.

2012. február 27.

Könyvismertető: Drew Conway & John Myles White - Machine Learning for Hackers

Andrew Ng online kurzusa nagyon népszerű volt és a "big data" őrület a gépi tanulást nagyon népszerűvé tette. Akik beharangozó posztunkon fellelkesedve (vagy más okból) feliratkoztak Ng óráira mára már bizonyára megkapták az újabb késésről szóló levelet. Az eltökélt tanulni vágyók számára ez a könyv ideális! Nyelvészeknek kifejezetten ajánlott, hiszen viszonylag sok szövegfeldolgozás van benne és az R rejtelmeibe is bevezeti az olvasót. Vigyázat! Ahogy a címe is mutatja nem kezdőknek való könyv!

2012. február 24.

Lapszemle - 8. hét

Itt a péntek lehet örülni és nem kell fáradozni a rekreációs olvasmányok keresgélésével mivel mi ezt megtettük. Hirtelen felindulásból és a tények előtt meghajolva felhagytunk Tumblr blogunkkal, de @sznyelveszet Twitter fiókunkat és Facebook oldalunkat követve továbbra is közzé tesszük a minket érdeklő híreket. Elérhetőségünk pedig szamitogepes.nyelveszet(kukac)gmail.com

2012. február 23.

Adatbázis modell újratervezése: Django és South

Ebben az írásban egy módszert fogunk bemutatni, amely lehetővé teszi adatbázisunk modelljének gyors és könnyű fejlesztését, valamint gyors és biztonságos újratervezését. Ehhez a Django webes keretrendszerbe beépített ORM-et fogjuk használni. Tudását kiegészítve és bővítve a South adatbázis migrációkkal.

2012. február 22.

Fordítási plágiumok

Plagizálni nem szép dolog, ezért mi rögtön leszögezzük hogy posztunk Pataki Máté Fordítási plágiumok keresés című tanulmányán alapul ami a VIII. Magyar Számítógépes Nyelvészeti Konferencia kötetében jelent meg (és szerencsére szabadon letölthető!). Egyre bevettebb dolog a fordítási plágium, az egységesülő Európában szerencsére nem ritka hogy valaki hazáján kívül végzi felsőfokú tanulmányait részben vagy egészben. A szemfüles diákok pedig rájöttek hogy otthon is akadnak okos kutatók, az ő műveiket részben vagy egészben lefordítani pedig költséghatékony módja egy dolgozat vagy akár egy diplomamunka letudásának. Ez a nyugati tudományosságban azonban nem comme il faut, a plágium szoftvereket alkotó kollégák keresik a megoldást az ilyen trükkökre is. (Persze tudjuk, néha egy szemfüles újságíró is megteszi...)

2012. február 21.

Mindennapi nyelvészet: beszédszintetizálás

Egy egyszerű felvett hangfájltól fogunk eljutni a TTS-el támogatott, ragozott mondatok kezeléséig. Az egyszerű felvétel, ennek megvágás, a változó információk kezelése, valamint az egész mondatalkotás automatizálása és hangzó szöveggé alakításáról lesz szó. Az eszmefuttatás pedig az alapja annak a mindennapi élménynek és tapasztalatnak, ahogy egy telefonközpont vagy egy utastájékoztató a napjainkban is működik.

2012. február 20.

Könyvismertető: Pierce; An Introduction to Information Theory

A beszédfeldolgozás terén már elterjedtek az információelméleti módszerek és a sokáig egzotikusnak tartott korpusznyelvészetből lassan de biztosan átszivárog ez a megközelítés a fősodorba is (olyannyira hogy már nem csupán a számítógépes nyelvészek számára illik tudni valamit erről a területről hanem a pszicholingvisták, fonetikusok/fonológusok, kognitivisták is egyre jobban foglalkoznak a témával). Pierce klasszikusa a szó legnemesebb értelmében vett ismeretterjesztő mű ami segít betekinteni a területre, megérteni az alapfogalmakat és mérlegelni hogy mit tudnánk hasznosítani.

2012. február 17.

Lapszemle - 7. hét

Lassan a szemeszter kezdési őrület is elvonul felettünk. A félév is rendesen elkezdődik és minden a normális kerékvágásba kerül. Addig is, itt egy újabb péntek, egy újabb Lapszemle. - De továbbra is olvashatjátok a naponta frissülő Twitteres és Facebookos csatornáinkat.

2012. február 14.

Kettő

Két évvel ezelőtt indult a blog. Az "egyemberes" játékból azóta öt szerzős vállalkozássá nőtte ki magát az én játszóterem ami már nem is az enyém elvégre mostanában döntöttünk úgy hogy a blog külseje is változzon egy kicsit. Mostanában sokat szabadkozunk mivel megcsappant a posztok száma, a kedves olvasó reméljük megértő velünk ha az ünnep alkalmából összefoglaljuk az okokat.

2012. február 10.

Lapszemle - 6. hét

Továbbra is takaréklángon üzemelünk, de megnyugtatjuk a Nyájas Olvasót: nem tűntünk el, szerzőink szorgalmasan dolgoznak és képzik magukat. Twitteres és Facebookos csatornáinkon továbbra is zajlik az élet, valamint változatlanul nagy szeretettel várunk vendégposztokat és új szerzőket is!

2012. február 3.

Lapszemle - 5. hét

Még mindig tart téli álmunk, de Facebook oldalunk, @sznyelveszet Twitter fiókunk és Tumblr blogunk áll az információra éhes olvasók rendelkezésére. Szerzőnek jelentkezni a szamitogepes.nyelveszet(kukac)gmail.com címen lehet, szintén itt lehet velünk kapcsolatba kerülni.