2010. december 22.

Könyvismertető: Statisztika és adatelemzés kezdőknek (Head First Statistics, Head First Data Analysis, Head First SQL)

Az előző két könyvajánlók azoknak szólt akik már valamennyire járatosak a statisztika és az adatelemzés világában. Most három olyan könyvet ajánlunk ami segít elsajátítani az alapokat. Ezek "belépő" szintű könyvek, azaz átlagos középiskolai műveltséggel és jó angol nyelvtudással önállóan is feldolgozhatóak. Habár külön-külön is olvashatóak és nincs közöttük semmilyen sorrendiség, az olvasó akkor jár a legjobban ha szépen egymás után az itt bemutatott sorrendben dolgozza fel mindegyiket.







Most három kötetet ajánlunk egyszerre. Mindhárom könyv a O'Reilly kiadó Head First Labs "fiókjából" került ki. A sorozat Kathy Sierra és Bert Bates Java kötetével indult, és máig ez a bestsellere a labornak. Sierra és Bates remek párosa több éves tapasztalattal rendelkezik a tanítás területén és saját bőrükön is tapasztalták milyen nehéz erre a területre belépnie a "nem hagyományos hátterű" tanulóknak. Ezért fordultak a kognitívtudomány, a pszichológia, pedagógia és egyéb viselkedéstudományok eredményeihez. Ebből született egy nagyszerű sorozat, amit azonban nem csodaszer. Nem azt vállalják az alkotók hogy könnyen, gyakorlás nélkül, rövid idő alatt profi szakember lehet aki elolvas egy Head First könyvet. A sorozat darabjain dolgozni kell, a feladatok nem opcionálisak és a végeredmény nem egy profi szakember, hanem a biztos alapok. Ezt fontos észben tartani. Aki egy Head First könyvet komolyan vesz a kezébe, annak az a célja hogy belépjen egy területre és tudja hogy az igazán komoly munka akkor kezdődik amikor befejezte az olvasást. Így álljunk hozzá tehát az itt bemutatott címekhez és ne várjunk csodát kemény munka és áldozatok nélkül.




A kötet alapvetően jó, kellő mélységben tárgyalja a statisztika alapjait. Fontos megjegyeznünk hogy nem törődik az egyes tételek bizonyításával és alapos bemutatásával! A gyakorlati alkalmazásra helyezi a hangsúlyt és nem ígér többet mint hogy megmutatja mire lehet jó ez a szép tudomány. Ezt tökéletesen el is éri. Viszont nem árt figyelmeztetni hogy a kötetnek a valószínűségről szóló fejezetek elnagyoltak, szerintem nem elég szemléletesek és talán túl gyorsan haladnak. Az aki veszi a fáradságot hogy többször is neki fusson a negyediktől a hatodik fejezetig tartó részen, minden bizonnyal elsajátítja az ott tárgyalt dolgokat, de ez a kötet alapelveivel ellentétes. Én ajánlom hogy más forrást is használjon bátran az olvasó, hiszen ez nagyon fontos alap, nem szégyen ha több helyről sajátítjuk el.





Ha már elsajátítottuk a statisztika alapjait, nem árt egy kicsit megnéznünk mire is lehet használni ezt. Ehhez nyújt segítséget ez a könyv, mindezt pedig nagyon alaposan és gyakorlat orientáltan. Érdemes ezt a kötetet közvetlenül a Head First Statistics után feldolgozni mivel az ott tárgyaltak nagy részét megerősíti ill. mélyebb kontextusba helyezi. Itt már az adatelemzés "szakmaibb" oldalával is találkozhatunk, pl miképp érdemes prezentálni eredményeinket. Megismerkedhetünk az elemzés technikai oldalával is, pl az Excel vagy az Open Office használata, az R nyelv és a relációs adatbázisok (SQL) is bemutatásra kerülnek. Persze ezek önmagukban is megérnek egy-egy külön kötetet, de bevezetésnek épp elég az amit itt kaphatunk.


Sokan temették már a relációs adatbázisokat, sőt egy új mozgalom van feljövőben az ún. noSQL. Azonban ez korántsem jelenti azt hogy értelmetlen megtanulni az SQL használatát! Még nagyon sokáig velünk lesznek a relációs adatbázisok, részben mert őket mindenki ismeri, részben pedig azért mert maga a noSQL mozgalom sem állítja hogy jobbak az új adatbázisok, csupán azt hogy vannak területek ahol akadnak jobb eszközök. A korpusznyelvészet területén és az adatelemzéshez pont megfelel az SQL, különösen kezdőknek. Fontos azt is megjegyezni hogy a legtöbb nem-relációs adatbázist tárgyaló könyv ma még feltételezi hogy az olvasója ismer egy SQL implementációt és tudja milyen egy adatbázis. Ha másért nem, hát ezért érdemes végighaladni ezen a köteten. A kötet tartalmával nem lehet kötekedni, szépen, logikusan építkezik, a megfelelő iramban halad az egyszerű alapoktól a bonyolultabb adatbázisok tervezéséig. Sajnos azonban a könyvhöz tartozó letölthető példák nem konzisztensek, gyakran más van a letöltött adatbázisban mint a könyvben, sőt még az is előfordul hogy nem az az adatbázis neve amit a könyv ír. További probléma hogy a fájlok csupán az SQL-lel folytatott parancssori párbeszédek mentett változatai, kontroll karakterekkel és néha bizony hibákkal együtt. Azonban józan ésszel és egy kis extra időráfordítással túl tudja tenni magát ezen az olvasó.

Nincsenek megjegyzések: