Peter Elias 1958-as IRE szekesztői írása, Two Famous Papers, remek humorérzékkel mutatja be, mennyire rá tudnak kattani a kutatók egy-egy új elméletre. Ez akkoriban épp az információelmélet volt, de Norvig hírhedt esszéje nyomán tudjuk, ez ma sincs másképp. Persze ne legyünk igazságtalanok, hisz tudjuk, Shannon neves tanulmányában is szerepelnek nyelvi példák. De az adatok tényleg az elméletek végét jelentik, ahogy az Chris Anderson gondolja?
Pókok, zene és kategóriaelmélet
Vegyünk először egy példát teljesen más területről. A pókháló régóta izgatja a tudósok fantáziáját, mivel rendkívül erős anyag. A pókot tekinthetjük egy függvénynek, ami proteineket képez le proteinkre (a bemenete a táplálék, a kimenete a pókháló). A mesterséges pókháló megalkotása során a TR cikke szerint (amit erősen ajánlok az olvasók figyelmébe) általában próba-hiba módszerre alakítják át a proteineket. Gondolom azért a kutatók intuíciója és a kísérleti adatok erősen behatárolják, hogy hol alakítanak a proteineken. Markus Buehler csapata más utat választott. A kategóriaelmélet keretében írja le a pókok működését (a "pók függvényt"). Így katak egy általános absztrakt nyelvet. Ezek után az eddigi megfigyelésekre alapozva kiválasztották a legígéretesebb struktúrákat, majd arra kértek zenetudományi szakembereket, hogy komponáljanak melódiákat a meghatározott kategóriákra alapozva. Észrevették hogy bizonyos mintázatok erős, mások gyenge mesterséges pókhálóhoz vezetnek és az ezekhez kapcsolódó zenei mintázatokban is szisztematikus különbség fedezhető fel. A következő lépésben arra kérték a zenészeket, hogy az erős hálókra jellemző mintázatok felhasználásával írjanak variációkat. Az eljárástól azt remélik, hogy a művészek kreativitása sok kipróbálásra érdemes mintázatot generál, olyanokat is melyekre a mérnökök és a matematikusok nem is gondolnának.
"Marginal Improvements"
Az adatok korában hihetetlen dolgok történnek, ez nem kétséges. De vegyük észre, nem történik minőségi változás a felhasznált elméletkben. Persze egyre több terület válik adatvezérelté és ott, ahol ez bekövetkezik ez forradalminak hat. De mennyire jó ma egy POS-tagger, egy NER rendszer? Minden paper min. 85%-os pontosságot ígér, de a 98-99% sem ritka - persze ipari alkalmazás közben gyakran kiderül hogy nem ennyire rózsás a helyzet.
A legtöbb fejlesztés ma nem más mint kaparás egy-két százalékért. Ezt nem szabad lebecsülni, az ilyen marginális fejlődések nagyon fontosak. Tim Harford Pop-Up Enconomics podcastjában nagyon szemléletesen mondja el miképp szerzett olimpiai aranyakat a UK-nek Matt Parker és csapata avval, hogy odafigyelt minden kis apróságra ami javíthatja a versenyzők eredményeit. (Kicsit bővebben erről a The Independent-en) De meddig vihető el az ilyen aprólékos munka?
Physics envy
A legtöbb tudomány nem tud elszakadni a fizikától. Az az igazi tudomány, ami összekapcsolja az elvont matematikát a való világgal - minden magára adó tudósnak követnie kell ezt az utat. Nincs is ezzel semmi baj, nem árt ha inspirálódunk máshonnét. A manapság divatos data science és úgy általában az adatfüggők azonban le vannak maradva, a mai fizikában nem annyira comme il faut amit ők csinálnak.
Lassan, de biztosan kifejlődőben van egy új irányzat, ami a kvantumfizika és a kategóriaelmélet fogalmi hálójával próbál megmagyarázni bizonyos jelenségeket. Őket még nem fenyegeti az Elias által kifigurázott túláltalánosítás veszélye (de ha sikerül átjutniuk a mainstream-be, akkor lefogadom ez is megtörténik) és rendkívüli kreativitás szabadítanak fel interdiszciplináris megközelítésükkel. A minőségi ugrást most tőlük várjuk.