2010. szeptember 29.

Wordle: a logónk története

Ezúttal bemutatásra kerül a logónk elkészítésének módja. A posztban nem a logó megszületésén lesz a hangsúly, hanem igyekszem rámutatni azokra a jellemző problémákra és akadályokra, amelyek szinte minden alkalommal előkerülnek, amikor az ember egy szógyakorisági táblát kíván saját kezűleg előállítani. Hogy ez esetben nem csak táblát, hanem egy ebből készült grafikát is kapunk eredményül, ez csupán a logó, mint cél eredménye. De természetesen mindenki könnyedén előállíthatja a bemutatott minta, a saját szógyakorisági táblája alapján.

2010. szeptember 28.

Könyvajánló: Logika és tudományelmélet mindenkinek

Szépfalussy Enikő vendégposztja
Amennyire szép és hasznos dolog a logika, annyira nehéz is. Mi logikusok szeretjük azt hinni hogy pofon egyszerű és nem értjük miért olyan nehéz akár természettudományos háttérrel rendelkező embereknek is megérteniük a legalapvetőbb logikai fogalmakat is. Ahelyett hogy az oktatás színvonalát okolnánk inkább arra kellene koncentrálnunk miképp tehetnénk hozzáférhetőbbé és érthetőbbé tudományunk alapjait és eredményeit. Nagyon örültem amikor rátaláltam Zoli blogjára, és hasznosnak találtam logikai könyvajánlóit, csak egy dolgot hiányoltam, az abszolút kezdők számára íródott könyveket.

2010. szeptember 23.

The life of a computational linguist I - Interview with Jason Adams

This week we conducted an interview with Jason Adams, a computational linguist who is working on sentiment analysis at Systino. He holds a BS degree in Computer Science from the University of South Carolina, and an MS in Language Technologies from the Carnegie Mellon University. You can find Jason on Twitter as @ealdent. He's got a blog, The Mendicant Bug, where you can read about nlp, ruby and other stuffs.

2010. szeptember 18.

Retro programozás

A funkcionális programozás napjainkban egyre nagyobb teret nyer, habár már nagyon régen velünk van. Az egyik legöregebb programozási nyelv a LISP, ami bizonyos körökben éppen reneszánszát éli. Számunkra azért fontos ez a remek nyelv, mert a korai mesterséges intelligencia és számítógépes nyelvészeti kutatások paradigmatikus alkalmazásait LISP-ben írták, és területünk klasszikus műve, Norvig Paradigms of Artificial Programming könyve, (nagyrészt) erről a nyelvről szól.

2010. szeptember 14.

Az adatok megmagyarázhatatlan természete

"For those who were hoping that a small number of general rules could explain language, it is worth noting that language is inherently complex, with hundreds of thousands of vocabulary words and a vast variety of grammatical constructions. Every day, new words are coined and old usages are modified. This suggests that we can’t reduce what we want to say to the free combination of a few abstract primitives." Halevy, Norvig, Pereira: The unreasonable Effectiveness of Data

Előző posztjaimban az adatok tudományával foglalkoztam és a visszajelzések alapján sokak érdeklődését felkeltettem. Mielőtt azonban a szögre akasztanánk megszokott eszköztárunkat, egy kicsit gondolkozzunk el az adatok természetéről.

2010. szeptember 10.

A New York Times és a Guardian API-k használata

Ahogy az előző posztokban említettem sokan reménykednek abban hogy a neten összegyűlt hatalmas adat mennyiség betekintést nyújthat abba hogyan is működik a nyelv. Habár sokat segíthet ha rengeteg adattal rendelkezünk, ennek vannak határai - ahogy erre pl Kilgariff is rámutatott. Nem is beszélve a technikai és jogi korlátokról.

2010. szeptember 4.

Az adatok tudománya és a nyelvtudomány - olvasnivaló

Sokan kérdezték az előző poszt kapcsán hogy hogyan is indulhatnak el "data science" ügyben. Itt egy kis összefoglaló következik, mit érdemes olvasni, merre érdemes keresgetni, és egy kicsit ajánlani fogom korábbi posztjaimat is. Tehát most sorra vesszük hogy egy nyelvész mit tehet hogy 1) betekintést nyerhessen az adatok tudományába 2) eszköztárába illeszthesse a nyelvi adatok elemzésére alkalmas módszereket.