2011. június 30.

Knight - Mozilla Learning Lab

Ahogyan arról már hírt adtunk örömünkben, beválogattak minket a Knight Foundation és a Mozilla Foundation közös kezdeményezésében rendezett Learning Lab-be. Szóval a nyár egy részét szorgos munkával és tanulással fogjuk tölteni (és egy kicsit kevesebbet is fogunk posztolni).  A cél pedig nem más mint az adatújságírás terén elérni valamit.

2011. június 27.

Korpusznyelvészet - a korpuszkészítés alapjai 1.

Az előző korpusznyelvészeti posztban láthattuk hogy milyen elméleti megfontolásokat kell figyelembe vennünk mielőtt korpuszt használunk. Ezeket figyelembe véve érdemes tudnunk hogy milyen elvek mellett épül fel egy jó korpusz. Most a legalapvetőbb vezérelevekt és ajánlásokat vesszük sorra.

2011. június 24.

Lapszemle

Hétvégi ajánlatunkban igyekeztünk összeszedni pár érdekességet a kedves olvasóknak, ha valami úgy érzed kimaradt, a szamitogepes(pont)nyelveszet(kukac)gmail.com címre nyugodtan elküldheted és a következő Lapszemlében közzétesszük. De addig is követhetsz minket a @sznyelveszet név alatt a Twitteren, és böngészheted a szamitogepesnyelveszet.tumblr.com oldalunkat.

2011. június 21.

Korpusznyelvészet – elméleti megfontolások

Mi is az a korpusznyelvészet? Sokan úgy tekintenek a korpuszokra mint a nyelvi adatok egyetlen lehetséges forrásaira, mások azt hiszik hogy ez valami nagyon új irányzat, de szeretnénk lehűteni a kedélyeket – a korpusznyelvészet ugyanis egy módszertani irányzat, se nem több, se nem kevesebb. Sajnos azonban ezt az irányzatot is „megfertőzte” a szokásos irány és szeretik a korpusznyelvészek is Chomskyval szemben meghatározni magukat. Vizsgáljuk meg egy kicsit közelebbről a két legelterjedtebb ködképet a korpusznyelvészetről.


2011. június 18.

Dzsudzsák a Twitteren!

Először egy népszerű oldal  Twitter feedjét szerettem volna elemezni, jobban mondva hogy mennyi RT-t kap egy-egy hír, de úgy tűnik a magyar felhasználókat nem kapta el a Twitter láz és nem lehet elég adatot találni egy-egy hírre. Így hát váltottam a nyest.hu Hol van az a Mahacskala cikkétől inspirálva első körben begyűjtöttem pár Dzsudzsákról szóló csiripelést, mivel mostanában sok hír kering(ett) leghíresebb futballistánk körül és a hab a tortán hogy nem csak magyarul! Így a begyűjtött tweeteken sok-sok dolgot bemutathatunk :D Figyelem, ez egy technikai poszt, Python kóddal, pip_/easy_install használatát lehet hogy nem úszod meg.

2011. június 17.

Lapszemle

Eltelt egy hét, ismét összeszedtük hogy mit érdemes olvasgatni két posztunk között. Ha valamit szeretnél megjelentetni ajánlókban, küld el a linket pár soros ismertetővel a szamitogepes.nyelveszet(kukac)gmail.com címre. Ha nem tudsz meglenni hírek nélkül, akkor kövess minket Twitteren @sznyelveszet néven vagyunk fent, ill. böngészd a szamitogepesnyelveszet.tumblr.com oldalunkat is.

2011. június 14.

Gondolkodó gépek 1.

A népszerű Jeopardy vetélkedőn aratott sikere után Watson bekerült a médiába és lassan mindenkinek van róla véleménye. Előkerültek ismét a gépek képességeit firtató kérdések, tényleg lehetnek-e annyira intelligensek mint az ember, vagy túlszárnyalhatják-e és a cyberpunk alkotásokban megjövendölt poszthumán jövő már itt jár a keretek alatt. A dolog pikantériáját az adja hogy az MIT nagyágyúi egy nem rég megrendezett szimpóziumon éppen azon keseregtek hogy valahol letértek az aranykorban kijelölt útról és újra kell indítani a mesterséges intelligencia kutatásokat. Akkor hogyan is állunk ezzel? Miért kesergünk, ha Watson nyert, a jövő pedig már itt is van.

2011. június 12.

Python és az SQLite – adatbázis, lájtosan

Előbb vagy utóbb eljön az a pillanat, amikor az ember úgy érzi: az addig értelmes és szép adathalmaz túl nagyra hízott, kaotikus, átláthatatlan, kezelhetetlen és lassú. Igen, ilyenkor kell egy adatbázis. A Python programozásban az a szép, hogy egyszerű mégis elegáns, és szerencsére a beépített adatbázis-modulja is ilyen: a SQLite a széleskörben elterjedt SQL szabványon nyugvó relációs adatbázisok kistestvére. Használata hasonlít hozzájuk, viszont kellemes előnye, hogy nincs szükség külön adatbázis-szerverre (az SQLite egyébként egy C-könyvtár, és nem csak a python használja; a szinte szabványos SQL szintaxis miatt a későbbi esetleges váltás nagyobb adatbázisokra sem túl fájdalmas).


2011. június 10.

Lapszemle

Ismét itt a hétvége, megint összeszedtünk pár linket hogy legyen mit böngésznie kedves olvasóinknak. Ha valami kimaradt, a szamitogepes.nyelveszet(kukac)gmail.com címre írd meg bátran, ha töbet szeretnél olvasni, kövesd szamitogepesnyelveszet.tumblr.com oldalunkat.


2011. június 9.

Könyvismertető: Introduction to Linguistic Annotation and Text Analytics

Sokak számára nehéz belépni a számítógépes szövegelemzés világába, legyenek akár nyelvészek (akiknek pl. nem volt alkalmuk programozást és/vagy formális módszereket tanulni) vagy informatikusok (akik pl. nem tanultak specifikusan számítógépes nyelvészetet, nem találkoztak eddig nyelvészeti elemzéssel). A most bemutatásra kerülő könyv nekik nyújt támogatást, és habár nem mentes a hibáktól, jelenleg nem ismerek jobbat a piacon.


2011. június 7.

Könyvismertető: Data Analysis with Open Source Tools

Az adatelemzés lassan de biztosan a (számítógépes) nyelvészeti munka részévé válik, azonban sajnos még nincs külön kialakult szakirodalma a területnek. Janert könyve azonban nagyon hasznos technikákkal és ami még fontosabb szemléletmóddal gazdagítja az olvasót és egy kis kreativitással ami területünkre is alkalmazhatóak a bemutatott módszerek. Azonban alapos előismeretek szükségesek ahhoz hogy haszonnal tudjuk forgatni a kötetet.







2011. június 4.

Lapszemle

Továbbra is várjuk észrevételeiteket és ha egy jó hírre bukkantok, nyugodtan küldjétek el nekünk a szamitogepes(pont)nyelveszet(kukac)gmail.com címre. Hét közben a szamitogepesnyelveszet.tumblr.com oldalon megosztunk mindent újdonságot, érdemes ott is követni minket.

2011. június 1.

On Computational History - an interview with William J. Turkel

We interviewed William J. Turkel (associate professor, University of Western Ontario) on computational history. You can learn more about William at his home page, his discontinued Digital History Hacks blog is full of interesting posts, and you can find him on Twitter as @williamjturkel.