Raw data now! - szól Tim Berners-Lee jelmondata a sokak által kedvel TED előadáson. Már többször foglalkoztunk azzal hogy elárasztanak bennünket az adatok ami egyrészt jó, másfelől arra késztet minket hogy átgondoljuk eddigi metodológiánkat és felvegyük a lépést a korral, de egyben a demokráciákat is nagy feladat elé állítja ez a változás. Az Open Knowledge Foundation ezekre a változásokra próbál válaszokat találni és posztunkban ezeket mutatjuk be, annak apropóján hogy blogunk alapítója Zoli csatlakozott az alapítvány Open Data in Linguistics munkacsoportjához.
Az Open Knowledge Foundation-ről
Az OKFN-t Rufus Pollock, Martin Keegan és Jo Walsh alapította 2004-ben azzal a céllal hogy nyílt tudást, tartalmakat és adatokat támogassák és elterjesszék. A nyíltság meghatározását az Open Definition oldalon találhatja meg a kedves olvasó (szerencsére magyarul is). Az alapítvány tevékenységei nagyon szerteágazóak ezért projektek köré és munkacsoportokba szerveződnek az önkéntesek. Itt a számunkra érdekes kezdeményezésekből szemezgetünk:
- Working Group on Open Data in Linguistics
- Working Group on Open Resources in the Humanities
- Working Group on Open Data in Science
- Where Does My Money Go
- Comprehensive Knowledge Archive Network
A digitális bölcsészet megjelenése és elterjedése nagyban függ attól hogy hozzá tudunk-e férni digitális formátumban a szükséges adatokhoz ill. hogy elérhetők-e olyan elemző eszközök melyek a könnyen használhatóak a nem-szakemberek számára is. A Humanities munkacsoport kezdeményezései természetesen az angol források köré csoportosulnak, de akad már szerencsére német nyelvű forrásokkal foglalkozó projekt is. Könnyen belátható hogy profitorientált alapon nem lehetséges kialakítani a szükséges infrastruktúrát, és habár nagy erőfeszítéseket tesznek pl az egyes EU tagállamok hogy digitalizált formában elérhetővé tegyék kulturális örökségüket, nagyon vontatottan haladnak ezek a projektek és gyakran küzdenek pénzhiánnyal. Az olyan projektek mint pl az Open Shakespeare egyrészt bemutatják hogy nem csak a forrásokat kell elérhetővé tenni, hanem azok feldolgozásában is segíteni kell a felhasználókat. Továbbá igazolják hogy önkéntes alapon, a szabad-szoftver mozgalomhoz csatlakozva minőségi "mashup"-okat készít maga a közösség is.
A munkacsoportok ún pilot projekteket indítottak és az ún. best practice modelleket keresnek és ajánlanak a közösség figyelmébe, ami lehet hogy nem a leglátványosabb munka, de nagyon fontos a jelenlegi átmeneti időszakban amikor még nincs kikristályosodva a hogy hogyan tegyük elérhetővé az adatokat és milyen bevett eljárásokkal dolgozzuk azokat fel (a jogi, etikai és társadalmi kérdések is nagyon fontosak az alapítvány számára, ám ezen kérdések kívül esnek kompetenciánkon). Ennek legjobb példája az Open Data Manual, mely ajánlásokat fogalmaz meg azok számára akik nyílt adatokat szeretnének publikálni.
Where Does My Money Go
A projekt elnevezése is mutatja hogy célja hogy könnyen követhetővé tegye mire megy el az adófizetők pénze. Az Egyesült Királyság adataira alapozva indították el a kezdeményezést, azonban jelenleg nemzetközi szintre szeretnék emelni (és igen, magyar verzió is lesz!). Itt is kettős cél figyelhető meg, egyrészt a kormányok még a legjobb szándék ellenére sem tapasztaltak ezen a területen, ill. nagyon nehéz fentről kitalálni hogy a köz milyen adatokra és elemzésekre kíváncsi, így egy aktív közösség példát tud mutatni. Azt sem szabad elfelejtenünk hogy a sajtó hagyományos formái nem alkalmasak arra hogy emészthető formában tálalják ezeket az információkat, így egyfajta közösségi adatújságírásnak is felfoghatjuk a projektet.
Comprehensive Knowledge Archive Network
A legnépszerűbb adat forrás napjainkban az Infochimps, hiszen szinte mindenre találhatunk ott adatokat. Sajnos azonban ezek az adatok gyakran fizetősek... A CKAN ellenben a nyílt adatok egyre bővülő katalógusa. (néhány zárt forrás is belekerült, de sokkal egyértelműbben jelzi ezt mint az Infochimps) Ha még nem is találunk mindenre adatot az oldalon, egyre bővül a jegyzék. (Ha az olvasó ismer nyelvészeti adatokat - legyen az bármilyen - regisztráljon és jelentse be!) Az adatok feldolgozása során felmerülő kérdésekre pedig a Get the Data oldalon kaphatunk választ ahol amolyan a la Stackoverflow közösség van kialakulóban.
Nincsenek megjegyzések:
Megjegyzés küldése