2011. november 28.

Road-map – or n+1 steps to enlightenment (or loonybind)

This post has been cross posted on Clojurelx

As we expressed in our previous post, we'd like to experiment with Clojure. Let us emphasis again, we are NOT developing a new library, we just believe that using Clojure in linguistic computing might be fruitful. In order to prove this assumption (or refute it), we are going to try some tools out, and summarize and share our experiences as blog posts. Here is our tentative road-map.

2011. november 23.

Kereső Mobilvilág

Elkészült végre a Kereső Mobilvilág ekönyv! A Kereső Világ posztjaira alapozva, felkért szerzők írásaival kiegészítve készítettünk egy kis tanulmánykötetet a mobil keresésre fókuszálva. A mű pdf és mobi formátumban is elérhető itt, ill. egy beharangozó posztot olvashattaok itt. Én itt szeretném megragadni az alkalmat hogy köszönetet mondjak azoknak akik segítettek nekünk egy-egy írással:

  • Tolnai Timi (blogunk szerzője)
  • Albeker András (a bitxəšï-史 blog szerzője) és neje
  • Dóczi Tamás  (a 豆腐块-欢迎欢迎! blog szerzője)
  • Vajda Gábor (a Kereső Világ szerzője)

Köszönöm továbbá munkatársamnak Tündének hogy mégsem őrültünk meg az elmúlt két hétben. Az érdem szerzőinké, minden hiba a miénk!

Jó olvasást mindenkinek!

2011. november 17.

scikit-learn: a gépi tanulás nltk-ja

A Natural Language Processing (nltk) keretrendszer a nem csak számítógépes nyelvészt iránt érdeklődők tömegeit vezette/vezeti be a szakma rejtelmeibe, hanem már a "való világban", üzleti alkalmazásokba építve is bizonyított. A nyílt forráskódú projektekre leselkedő veszélyt - hogy nem alakul ki a lelkes önkéntesek köre - elkerülte, és az "alapító atyáknak" hála egy jó minőségű, immár több nyelvre is fordított, szabadon hozzáférhető könyv vezeti be a szakma rejtelmeibe a nagyérdeműt. A scikit-learn valami hasonlóvá próbál kinőni a gépi tanulás területén - remélem így már érthető a cím :D

2011. november 16.

Why Clojure lx?

This post is cross-posted on clojurelx, a new project blog

 

The NLTK is a natural choice for students of linguistics and computer science. It has matured into a stable project, its users are very active, and it is now used outside of academia. Those who are into functional programming can use the Scheme Natural Language Toolkit, or learn from the Natural Language Processing for the Working Programmer, and those who needs the JVM can turn to ScalaNLP. So why brother with Clojure?

2011. november 10.

Könyvismertető: Personal Kanban

Talán az egyik legnagyobb problémája a XXI. század emberének az hogy nem tud mit kezdeni a rászakadt információval. Hírek, szakirodalom, család, barátok, munka, tanulás stb mind egy időben szakad ránk és egymással "versenyez" az időnkért. Persze vannak akiknek nem okoz különösebb nehézséget kezelni ezt a helyzetet, de a maradék (szerintem többség) rászorul hogy valamilyen módon megszervezze életét, rendet rakjon a különböző kötelezettségek között. Rengeteg módszer létezik, ezek nagy része szerintem egyszerűen baromság, mások pedig jók, csak nem mindenre. A Personal Kanban - habár szerintem túl hype-olt - egy egész jó megközelítés, ami ha nem is mindenható, de jól alkalmazható.

  • Jim Benson - Tonianne DeMaria Barry: Personal Kanban: Mapping Work | Navigating Life
  • CreateSpace, 2011
  • 216 oldal
  • Personal Kanban - a könyv és a módszer köré szervezett honlap (sok hasznos tanáccsal, az alapok ingyen elérhetőek, feltétlenül böngéssz itt mielőtt megvásárolnád a könyvet!)

2011. november 5.

Gépi fordítás -- a kétnyelvű korpusz feldolgozása 2

A számítógépes fordítás nagy kérdése, milyen szabályok alapján lehet átalakítani az egyik nyelven írt szöveget egy másik nyelvű szöveggé. A statisztikai alapú megközelítés ahelyett, hogy morfológiai és szintaktikai szabályok mentén dolgozná át a szöveget, a fordítás műveletére úgy tekint, mint egy fekete dobozra, amely működését meg kell jósolni. Minél jobban kiismerjük, annál jobban előrejelezhetjük, vagyis: magunk is tudunk fordításokat előállítani. A probléma az, hogy a nyelv annyira bonyolult rendszer, hogy nagyon nehéz egyértelmű, "hu=t(en)" szerű szabályokat megfogalmazni.

2011. november 3.

Könyvismertető: The Lean Startup

A legtöbben úgy képzeljük hogy egy startup pár flanelinges srác ötleteléséből születik egy kollégiumi szobában, aztán a srácok keményen dolgoznak és egyszer csak multimilliomosok lesznek. A történet akár igaz is lehet, de szeretjük elfelejteni hogy a történet gyakrabban ér véget azzal hogy vagy nem sikerül elég befektetést felhajtania a fiatal srácoknak, vagy elhasználnak (elégetnek) minden pénzt a zseniális ötletre, anélkül hogy sikerülne életképes üzletet létrehozniuk. Eric Ries Lean Startup módszere megpróbál segíteni abban hogy az ötlet életképessége mihamarabb kiderüljön és jól hasznosuljon a befektetett tőke.


  • Eric Ries: The Lean Startup – How Today's Entrepreneurs Use Continuous Innovation to Create Radically Successful Business
  • 2011, Crown Business
  • 336 oldal
  • a könyv honlapja