2011. február 24.

Student Session ESSLLI 2011 Call for Papers

The Student Session of the 23rd European Summer School in Logic, Language, and Information ESSLLI will take place in Ljubljana, Slovenia on August 1-12, 2011. The Student Session is held under the auspices of ESSLLI 2011, which will feature a wide range of foundational and advanced courses and workshops in all areas of Logic, Language, and Computation. Consult the main ESSLLI website at http://esslli2011.ijs.si/ for further information, including registration information and course listings.

2011. február 23.

Watson!

"When you have eliminated the impossible, whatever remains, however improbable, must be the truth." (Sir Arthur Conan Doyle)

Sherlock Holmes mondása különösen igaz az IBM Watson rendszerére amiről szerencsére a magyar híradásokból is tudjuk hogy legyűrte a népszerű Jeopardy vetélkedő legjobb játékosait. Érdemes megnézni magát a vetélkedőt is, legtöbb nagy videómegosztó oldalon megtalálható. Most csupán arra vállalkozunk hogy áttekintjük a Watson mögött rejlő fontosabb technológiai megoldásokat és egy kicsit értelmezzük hogy mit jelent ez a győzelem.


2011. február 17.

JFLAP: formális nyelvek és automata elmélet

Következő posztunkban a modern nyelvelméleteket megtermékenyítő és később rájuk visszaható témákhoz kívánunk egy kis segítséget adni. Nem az elméletekhez, nem a témák megalapozásával fogjuk ezt elérni. Ezekhez csupán szakirodalmat adunk. Inkább egy eszközre hívjuk fel a figyelmet. A szakirodalom alapján pedig az eszköz, a JFLAP segítségével pedig el lehet indulni a felfedezés, az önálló felfedezésen alapú elsajátítás felé.

2011. február 15.

Lean startup II.

"Essentially, all models are wrong, but some are useful" (George Box)



Előző posztunkban körüljártuk hogy mi is az a lean startup, mi köze van a számítógépes nyelvészethez és hogyan kapcsolódik az adatvezérelt és kutatás orientált kezdeményezésekhez. Most körüljárjuk hogy mit jelent az hogy "adatvezérelt" és "kutatás orientált". Nem kell semmi nagyra gondolni, csupán a tudományos kutatások és a szoftvermérnökség praktikáit próbáljuk meg összekapcsolni.



2011. február 13.

Írástudók hajnala: innováció a médiában II. - Az adatok kora

Sorozatunk első részében megpróbáltuk felhívni a figyelmet arra hogy az újmédia területén alapvető változások történnek és olyan, eddig magától érthetőnek vett dolgokat kell átgondolnunk mint a szótár. Láttuk hogy a Wordnik a média legegyszerűbb építőköveiről a szavakról próbál meg minden lehetséges információt összegyűjteni és elérhetővé tenni (érdemes ezzel kapcsolatban a Wordnik kutatási igazgatójával, Jeremy Kahn-nal készített interjúnkat is elolvasni). A digitális platform nem csak azt tette lehetővé hogy az információ konvertálható legyen különböző hordozókra, de egyben azt is hogy az információra mint adatra tekintsünk amiből újabb információ nyerhető ki.

2011. február 9.

The Life of a Computational Linguist VI - Interview with Jeremy Kahn (Director of Research, Wordnik)

Are you keen on words? You'll love Wordnik "the place for all the words, and everything known about them". Jeremy Kahn the director of research at Wordnik was so kind and answered our questions. Jeremy got his AB in Linguistics from Brown University and recently defended his PhD thesis at the University of Washington. He is a very active member of the linguistics community on Twitter, where you can find him as @trochee.


2011. február 8.

Könyvismertető - The Foundations of Statistics: A Simulation-based Approach

Sokakat tántorít el a tény hogy manapság a (számítógépes) nyelvészet bizony nagyon matematizált. Ezen a tényen nem tudunk változtatni, már Eukleidész is megmondta I. Ptolemaiosznak hogy a matematikához nem vezet királyi út. Azonban nem kell félni, az alapos ismeretek a mi területünkön inkább gyakorlatiak (persze el lehet menni egészen "durva" területekre is) és gyakran köthetők alkalmazott problémákhoz. A most ismertetett kötet ebben segít, az alkalmazásra teszi a hangsúlyt és ebben segítségül hívja az R statisztikai programozási nyelvet.








2011. február 4.

Nyelvi relativizmus, avagy hatással van-e nyelvünk gondolkodásunkra II.

A sorozat előző részében körül jártuk a nyelvi relativizmus gyökereit és rámutattunk arra hogy ennek gyakorlati vetületei is van a számítógépes nyelvészetben ahova a sztochasztikus vs. szabály alapú megközelítés vitájaként került át. Napjainkban a relativizmus erős változatát szinte mindenki elveti, azonban Lera Boroditsky eredeti kísérletekkel próbálja meg bemutatni hogy bizonyos területeken igen is nagy hatással van nyelvünk gondolkodásunkra, Daniel Everett pedig rámutat arra hogy a nyelvi képességek nagyban kulturálisan determináltak (és talán a nyelv független elménk rekurzív képességeitől is). Természetesen ezek a kutatások önmagukban is érdekesek (mivel sok dolgot elárulnak rólunk), azonban van egy gyakorlati vetületük is, hiszen rávilágítanak arra hogy talán nem kezelhetők a nyelvek egy egységes keretben, továbbá az interakciódizájn területén is figyelmet érdemel az a tény hogy nyelvünk hatással van arra miképp érintkezünk a minket körülvevő világgal.


2011. február 1.

Könyvismertető - Mining the Social Web [frissítve]

A közösségi média rengeteg adatot generál és szerencsére a különféle API-okon keresztül ezekhez bárki hozzáférhet. Azonban nem olyan egyszerű belevágni ezek elemzésébe. Matthew A. Russel könyve ehhez nyújt praktikus segítséget, rengeteg példával és jó minőségű kóddal támogatva mely saját elemzéseink kiindulópontjául is szolgálhat. Mindent összevetve a kötet remek, azonban bármennyire is próbál egyszerű lenni, nem árt ha az olvasó jártas a programozás terén (python), ismeri a legalapvetőbb számítógépes nyelvészeti alapfogalmakat (még jobb ha az nltk-t is), valamennyire ismeri a szemantikus webet és egy kicsit az átlagosnál többet tud a közösségi oldalakról.