2011. augusztus 30.

A közösségi tagelés nyelvész szemmel

Manapság a neten egyre többször találkozhatunk különféle oldalakkal ahol arra kérnek minket (vagy jobb esetben csak lehetőségként ajánlják fel) hogy tageljünk. A legegyszerűbb esete ennek egy blog (mint pl ez), ahol a meta-adatok segítenek képet adni arról miről is szól az adott poszt, a “related posts” szkript is ezek alapján találja meg a kapcsolódó írásokat. Ebből rögtön kitűnik hogy a tagelés remek információkezelő eszköz, de mennyire jó és milyen körben használható, mit kezdhetünk vele?

2011. augusztus 29.

Vigyázat(:) plágium!

A felsőoktatás elengedhetetlen velejárója a publikálás. Legyen szó szemináriumi dolgozatról vagy diplomamunkáról mindkét esetben szükséges a szakirodalom áttekintése és használata. Hogyan tehetjük ezt legális módon? Mikor beszélünk plágiumról és hogyan kerülhető ki? Erről lesz szó ebben a cikkben.


2011. augusztus 27.

Gépi fordítás – Fordítási modell 2

Előző, statisztikai alapú gépi fordítással foglalkozó posztunkban már beszéltünk a fordítási modell szerepéről. Most megmutatjuk, hogyan működik a dolog igazi számokkal és igazi szavakkal.

2011. augusztus 26.

Lapszemle

A Goldenblog versenyében sikerült 22 darab szavazatot összeszednünk, ez a 32. helyre lett elegendő, a 72 "fős" mezőnyben ez azért elmegy. Ha minden igaz ma megtudjuk kiket szeret a zsűri, de a lényeg hogy pár új olvasó beesett, már is nyertünk azzal hogy elindultunk. Az izgalmak levezetésére ezen a héten is összeállítottuk ajánlónkat.

2011. augusztus 25.

A 200. poszt - villám önfényezés

Sajnos anno lemaradtam arról hogy a századik poszt kapcsán kezdjek önfényezésbe, ezért a kétszázadik posztot használom fel erre. Villám önfényezésünk egy kis blogtörténetettel kezdődik, majd áttekintjük mi történt velünk az elmúlt bő másfél évben. Vágjunk bele!

2011. augusztus 22.

A tömegkommunikáció hatása az anyanyelv elsajátításának menetére 3. rész

Lássuk, hogy hol is tartunk a nyelvelsajátítás elméleti tanulmányozásában: áttekintettük a nyelvelsajátítás elméletének főbb tematikáját, s végkövetkeztetésként megállapítottuk, hogy minden ember rendelkezik a nyelvelsajátítás alapvető készségével, ám az, hogy a készség hogyan válik képességgé a nyelv használata közben, nagymértékben függ a környezettől. Az elméletek után ezt a bizonyos nyelvi környezetet vizsgáltuk meg tüzetesebben, magát a nyelvet, mint változó – változatlan rendszert, és viszonyrendszert. A továbbiakban azt a széles körben használt nyelvi formát vizsgáljuk meg, amely a tömegkommunikációban megjelenik.


2011. augusztus 20.

Bátran legyünk nyíltak - megéri

Sokak számára a nyílt egyet jelent a nyílt szoftverrel az IT világában. Sokan esküsznek a nyíltságra míg mások viszolyognak tőle. Egyesek szerint az egyetlen út a tökéletesség felé, mások szerint nem lehet minőségi eszközöket elérni egy nyílt környezetben. Azonban a furi flanelinges csókák mozgalmából akik egy saját ingyenes oprendszert szerettek volna, eljutottunk odáig hogy már nem csak a szoftverek szabadságát hirdetik egyre többen, hanem az adatokhoz való hozzáférést is. Nem mellesleg ezzel kapcsolatban felmerült egy halom (szerzői)jogi kérdés is. Milyen távlatai vannak a szabad szoftvernek, nyílt adatoknak és megengedő licenceknek?

2011. augusztus 19.

Lapszemle

Itt a hétvége, kicsit megkésve (amikor szabin van az ember lánya nehéz korán kelni) de összeszedtünk megint pár dolgot hogy legyen mint olvasni pihenés közben. Továbbra is lehet minket követni Twitteren @sznyelveszet név alatt vagyunk, és szamitogepesnyelveszet.tumblr.com oldalunkat is megéri figyelni a legfrissebb hírekért.


Bábel helyett kábel - avagy pár zavaró hiba a Figyelőben

A print Figyelőben Bábel helyett kábel címmel jelent meg egy írás. Sajna kommentelni csak előfizetőknek lehet. Akinek van papír Figyelője, vagy akad hozzáférése, erről a cikkről van szó.

2011. augusztus 15.

A tömegkommunikáció hatása az anyanyelv elsajátításának menetére 2. rész

Az előző részben áttekintettük a fontosabb nyelvelsajátítással kapcsolatos elméleteket, s megállapítottuk, hogy bár rendelkezünk a nyelv elsajátításához szükséges velünk született képességekkel, a környezetünknek is befolyással van a belső nyelvtanunk kialakításában. A következő kérdés, hogy a körülöttünk élő, és folyamatosan változó nyelvre milyen tényezők vannak hatással. Változik a nyelvünk, s ha igen mi és hogyan hat rá? Feltételezhetünk egyfajta interakciót, vagy a nyelv teljesen önkényes belső rendszer? Hogyan viszonyul a beszélő ezen változásokhoz? Ezekre a kérdésekre keressük a választ ebben a részben.


2011. augusztus 14.

Könyvismertető: Learning the Unix Operating System

Sok remek, ingyenesen elérhető *nix tutorial található a neten, a legtöbben ezek használatával tanultuk meg az alapokat, azonban ezeknek van egy kis "hibája"; nem felhasználóbarátok. Nem arról van szó hogy pontatlanságok lennének bennük, hanem épp ellenkezőleg, gyakran túl sok információt közölnek, nincs megszűrve az anyag és nem egységesek abban hogy milyen hátterű olvasónak szánták. A most ajánlott könyvön érződik a gondos szerkesztői munka, tényleg kezdőbarát és érthető, egyedüli problémája hogy bizonyos részei felett eljárt már az idő.


  • Jerry Peek, Grace Todino, John Strang: Learning the Unix Operating System, 5th edition
  • O'Reilly Media, 2001
  • 176 oldal
  • a kiadó oldala




2011. augusztus 12.

Lapszemle

Sok dolog történt ezen a héten, kicsit belehúztunk a blogolásba elvégre a Goldneblogon versenyben vagyunk ezért felvettük a kesztyűt :D Bővültünk is, sorainkat immár Tolnai Timi is erősíti - reméljük sokan követik majd az ő példáját és írnak nekünk, netán még csatlakoznak is kis csapatunkhoz. Természetesen továbbra is lehet minket követni a Twitteren @sznyelveszet néven és a szamitogepesnyelveszet.tumblr.com oldalunkat is érdemes figyelni.

2011. augusztus 10.

TeX/LaTeX: írás és feldolgozás II.

A poszt első részében ismertettük, hogy miért és hogyan használjuk a LaTeX dokumentumokat. A TeX leíró nyelvet nem érintettük komolyabban. Ez nem is volt szándékunkban. Helyette az írás miértjét emeltük ki. A második részben pedig a feldolgozás miértjére és a hogyanra keressük a választ és látjuk el tanácsokkal, ötletekkel az olvasót.

Nyelvi értelmező, házilag

r0ller vendégposztja

„A programok bemenetének általában van valamilyen szerkezete. Tulajdonképpen, minden program, amely valamilyen bemenetet vár, definiál egy saját nyelvet amelyen a bemenetet meg kell fogalmazni. A bemenet lehet akár olyan összetett mint egy programnyelv vagy egyszerű mint egy számsor.” Ahogyan az egyik legismertebb nyelvtani elemző, a Yacc rövid ismertetőjéből is kitűnik, az emberek többségének a problémája a számítógépeken futó programokkal az, hogy mindegyikhez meg kell tanulni azok sajátos nyelvét. Ahelyett azonban, hogy az emberek tanuljanak meg több tíz vagy akár száz programmal hatékonyan kommunikálni, az egyszerűbb feladatok esetén a számítógépet is felruházhatnánk az adott feladat megoldásához szükséges természetes nyelvi töredék megértésének képességével.

A fenti célkitűzés jelen szerző egy nemrég indult magánakciójának sajátja. A projekt az Alice nevet kapta és a githubon bárki tanulmányozhatja vagy akár kísérletezhet vele. A program jelenleg az alapvető fájlkezeléshez kapcsolódó szavakból összeállított szótár alapján megfogalmazott angol nyelvű utasításokat fogad el. Ilyenek például a ‘list all executable files in directory abc’ vagy a ‘delete all files’. A szótár jelenleg igen kicsi, legfőképp mert a projekt egyelőre még inkább csak egy megvalósíthatósági tanulmány, így nem a használhatóság kiterjesztése áll a középpontban. Az alábbiakban megpróbálom bemutatni, hogyan is lehet felépíteni egy ilyen természetes nyelvi értelmezőt, mind nyelvészeti mind technikai oldalról.

2011. augusztus 9.

A tömegkommunikáció hatása az anyanyelv elsajátításának menetére 1.rész

Napjainkban az anyanyelv elsajátítása során sokkal több hatás ér bennünket, mint a korábbi generációkat. Az információszerzés forrásai bővültek, az internet, és a média hatásai minden emberre kihatnak. Három részes írásomban ezt a folyamatot mutatom majd be részletesebben. Ahhoz, hogy az anyanyelv elsajátításának kérdéseit vizsgálhassuk, és a kritikus pontokat körbejárhassuk, érdemes egy kis kitérőt tenni, s belekukkantani a grammatika (nyelvészet), a szociolingvisztika (társadalomnyelvészet), nyelvtörténet tudományos eredményeibe, s ha nem is mélyedünk el benne, a felszínét megkotorgatva kicsit élesebb képet kapunk majd a kérdéskör problematikájáról. Hogyan sajátítjuk el anyanyelvünket? Vannak-e kritikus periódusai? Mennyire befolyásolja a nyelvelsajátítást az a virtuális világ, melybe beleszületünk (közösségi oldalak, online kommunikáció – msn, chat)? Változik-e a nyelvünk, s ha igen hogyan, s mi hat rá? Lássuk!

2011. augusztus 8.

[Frissítve!] Elindult a Goldenblog...

... és lehet ránk is szavazni itt az IT kategóriában. Végigbogarászva a mezőnyt sok érdekes új blogra találtam. Úgy tűnik hogy az IT-b belül a mobilos és a kütyü blogok vannak többségben, az egyéb kategóriákban pedig igazi gyöngyszemekre akadtunk. Természetesen örülünk ha ránk szavazna a kedves olvasó, azonban úgy gondoljuk érdemes másokra is felhívni a figyelmet.

2011. augusztus 7.

Könyvismertető: Számítógéppel emberi nyelven

Tolnai Tímea vendégposztja

Mi történik akkor, amikor találkozik a mérnöki szakértelem és a nyelvészi tudás? A bonyolult algoritmusok hatására a számítógép „megérti” az emberi nyelvet, lekódolja saját nyelvére, s így képessé válik a szöveggel kapcsolatos műveletek elvégzésére: keres, ellenőriz, elemez, fordít. Az elsőre bonyolultnak tűnő témakört a szerzők a laikusok számára is könnyen érthető nyelven rengeteg ábrával és gyakorlati példával teszik még befogadhatóbbá az olvasottakat. A hétköznapi felhasználó által nap mint nap alkalmazott számítógépes programok nyomán teszik érthetővé a keresés, fordítás illetve helyesírás-ellenőrzés menetét.


  • Prószéky Gábor – Kis Balázs: Számítógéppel emberi nyelven. Intelligens szövegkezelés számítógéppel
  • Szak Kiadó, Budapest, 1999






2011. augusztus 5.

Lapszemle

Nos sűrű hetünk volt posztok terén, de a hétvége itt van a kertek alatt, rendes olvasóink ilyenkor Lapszemle rovatunkból szemezgetve töltik az idejüket :D És mindenki tudja már hogy Twitter lehet követni a @sznyelveszet fiókot, a szamitogepesnyelveszet.tumblr.com oldalunkon pedig jobbnál-jobb híreket olvashat minden nap.

Legyél te is adat!
Kedves ismerősünk szemináriumi dolgozatához szükség van a Te segítségedre is. Ha középiskolás vagy, vagy jártál középiskolába és akad öt szabad perced, arra kérünk hogy a tudománynak áldozva töltsd ki a következő anonim kérdőívet: http://www.kerdoivem.hu/kerdoiv/466149338/

2011. augusztus 4.

Könyvismertető: Az Üveghegyen innen

Tolnai Tímea vendégposztja

Az érdeklődők számára egy olyan könyvet kínálok lapozgatásra, mely nem csupán nyelvészek, pedagógusok hasznos társa lehet, hanem szülőknek, diákoknak, határon túl élő magyaroknak, egyszóval mindenkinek, aki törődik anyanyelvének ápolásával. A könyvet – határon túli kiadás lévén – nyomtatott formában talán nehézkes lehet beszerezni, ám a Magyar Elektronikus Könyvtárból bárki számára könnyen és gyorsan elérhető itt.


  • Csernicskó Istávn - Kontra Miklós (szerk.): Az üveghegyen innen - Anyanyelvváltozatok, identitás és magyar anyanyelvi nevelés
  • PoliPrint, II. Rákóczi Ferenc KMF, 2008
  • Elektronikus verzió a Magyar Elektronikus könyvtár oldalán: http://mek.oszk.hu/08100/08144/cimkes.html



2011. augusztus 3.

Korpusznyelvészet - Unicode; a korpuszkészítés alapjai 2

Az előző posztban végig vettük Leech maximáit, melyek segítenek minket abban hogy használható korpuszt készítsünk. Mivel egy korpusz általában szöveges (de nem szükségszerűen, hiszen már vannak audio korpuszok is) szükségünk van arra hogy a szöveget alkotó karaktereket is egységesen kezeljük, ez teszi lehetővé hogy igény szerinti formában jelenítsük meg, vagy hasonlítsuk össze az egyes korpuszokat. Ez nem csak az eredmények és adatok megosztását, de feldolgozását is megkönnyíti. Sajnos azonban ez nem mindig volt magától értetődő elv, szerencsénkre azonban a dolog változik és a Unicode szabvány terjedőben van. A posztban nem törekszünk arra hogy bemutassuk teljesen magát a szabvány, csupán a mögötte rejlő elveket vesszük sorra és egy kis eligazítást adunk hol tanulhat többet az érdeklődő olvasó (aki kényes a pontos megfogalmazásra és szeretne komolyabban elmerülni a témában, az inkább csak az ajánlott irodalmat fussa át).

2011. augusztus 2.

Nyelvi modell és fordítási modell a gépi fordításban

Folytatjuk az utazást a statisztikai alapú gépi fordítás világába, útikönyvként továbbra is Kevin Knight bevezetője szolgál. Ebben a posztban a fordítási modell szerepéről lesz szó.

Digitális bölcsészet - új blog indult

Kalcsó Gyula,  a Digitális bölcsészet blog szerzőjének vendégposztja

Az, hogy az utóbbi években a nemzetközi tudományos életben felmerült az igény a különböző bölcsészettudományi területeken használt számítástechnikai eszközök közös kutatására, valamint a közös módszertan kidolgozására, sőt: önálló területté fejlesztésére, nyilván annak köszönhető, hogy a mennyiségi növekedés átcsapott minőségibe. Annyi új eszközt, eljárást, módszert dolgoztak már ki ezen a területen, hogy elkezdett önálló életet élni, és a korábban nyelvészként, irodalmárként, könyvtárosként tevékenykedő kutatók egyre inkább DH-szakembernek számítottak, akik már nem is annyira az eredeti tudományterületük, hanem az új "transzdiszciplína" (l. lejjebb) szakértői lettek. Kialakult a digital humanitiesnek (DH) nevezett terület.

2011. augusztus 1.

Legyél te is szerző a Számítógépes nyelvészet blogon!

Valahogy a nyáron megszaporodnak azok a levelek melyekben arról érdeklődnek a kedves olvasók miképp írhatnának a blogra. A dolog nagyon egyszerű, dióhéjban: írj egy posztot, küld el nekünk, megbeszéljük, ha kész felkerül - két-három vendégposzt után jogosultságot kapsz és szabadon posztolhatsz nálunk. A lényeg hogy HA ÍRNI SZERETNÉL NÁLUNK, SZERETETTEL VÁRUNK! A továbbiakban egy kicsit bővebben is írunk erről.