-
1. ábra
|1|
-
2. ábra
|2|
-
3. ábra
|3|
-
4. ábra
|4|
-
5. ábra
|5|
-
6. ábra
|6|
-
7. ábra
|7|
-
8. ábra
|8|
-
9a. ábra
|9|
-
9b. ábra
|10|
-
10. ábra
|11|
-
11. ábra
|12|
-
12. ábra
|13|
-
13. ábra
|14|
-
14. ábra
|15|
-
15. ábra
|16|
-
16. ábra
|17|
-
17. ábra
|18|
-
18. ábra
|19|
-
19. ábra
|20|
-
20. ábra
|21|
-
21. ábra
|22|
-
digitális formában őrződnek. A költő szavaival:
|1|
-
filmet készített, melyen időben kísérhetjük figyelemmel az észak-amerikai kontinens polgári légiforgalmát néhány napon át.
|2|
-
animáción
|3|
Kertész János
Digitális lábnyomokat követve
I. Bevezetés
Reggel a telefonébresztő kelt fel, autómat a garázsból belépőkártyával hozom ki, munkába menet mobiltelefonon elintézek néhány ügyet. Bent először az elektronikus levelezésemet nézem át, majd a webkereső segítségével az interneten utánanézek néhány dolognak. Délután kivizsgáláson kell résztvennem, majd onlájn vásárlással mozijegyet veszek. Hazafelé tankolok és bevásárolok - szépen gyűlnek a pontok a törzsvásárlói kártyámon. Mozi után egy vendéglőben vacsorázunk, természetesen bankkártyával fizetek. Hétköznapi tevékenységeink, munkánk, szórakozásunk számszerűsített lenyomatai digitális formában |1}| őrződnek. A költő szavaival:
"Beírtak engem mindenféle Könyvbe
és minden módon számon tartanak."
(Kosztolányi Dezső)
Valójában a helyzet sokkal rosszabb, mint azt az érzékeny költők képzelték. Nem "porzó-szagú, sötét hivatalokban", hanem elektronikus adathordozókon tartják számon tevékenységünket, ízlésünk és érdeklődésünk jellemzőit, egészségi állapotunk mutatóit. Mindez annak ellenére hátborzongató, hogy szigorú jogszabályok korlátozzák az adatok tárolását és felhasználását. Most azonban a kérdésnek nem az etikai-jogi vonatkozásaival szeretnénk foglalkozni, hanem azzal, hogy hogyan használható fel ez a hatalmas adatmennyiség tudományos célokra.
Természetesen nemcsak személyünkre vonatkozó adatok gyarapodnak szédületes ütemben. A magyar gazdaság szereplőinek fontos adatait az APEH tárolja. Ma már az egyszemélyes vállalkozások is számítógépes könyvelést folytatnak, de nagyobb vállalatok minden tevékenységének nyilvántartása (és gondos őrzése is) digitális formában történik. A web pontos méretét senki nem ismeri, csupán becslések vannak arról, hogy több mint tízmilliárd weboldal. De ha hatalmas adatmennyiség feldolgozására gondolunk, mindenképpen meg kell említenünk a kimondottan tudományos céllal összegyűjtött nagy adatbázisokat - itt talán elég a humán genom projektre (az emberi örökítőanyag komplett feltérképezésére) utalnom.
A felsorolt példákhoz kapcsolódó digitálisan tárolt adatok rendkívül összetett jelenségekből, ill. tevékenységekből származnak: komplex rendszerek digitális vetületei. A komplex rendszerek jellemzője, hogy az egész több mint alkotóelemeinek összessége. Az emberi test, a gazdaság, a társadalom - mind-mind komplex rendszer. Ezek megértéséhez nem elég azonosítani az alkotóelemeket és a kölcsönhatásokat. A fizika sokat foglalkozott ezekkel a kérdésekkel és mára igen messzire sikerült eljutni. A huszadik század utolsó harmadában olyan eszközök kerültek birtokunkba, amelyek a komplex rendszerek megértéséhez elengedhetetlen kollektív viselkedés feltárásához segítenek hozzá, és ezek szemléletünket is átalakították. Kiderült, hogy gyakran nem is olyan fontos a kölcsönhatások finom részleteinek az ismerete! Látszólag nagyon különböző rendszerek meglepően hasonlóan, univerzálisan viselkednek - csak éppen a megfelelő kérdéseket kell a természetnek feltenni. A komplex rendszerek vizsgálata az utóbbi 15-20 évben látványos fejlődésnek indult. Ez részben az interdiszciplináris erőfeszítéseknek, részben pedig a számítógépek által nyújtott, korábban elképzelhetetlennek tartott lehetőségeknek köszönhető. Sokan szeretik az évszázadokat egyes tudományokhoz kötni: nos, a 21. század minden bizonnyal a komplex rendszerek tudományának százada lesz.
A komplex rendszerek vizsgálatában áttörést hozott a hálózati szemlélet elterjedése. Érdekes, hogy a hálózatelmélet, vagy a matematikában szokásos elnevezéssel, a gráfelmélet fejlődéséhez és alkalmazásához egy sor magyar tudós adott lényeges hozzájárulást: Rényi Alfréd, Erdős Pál, Bollobás Béla, vagy sorolhatnék néhány korábbi Mindentudás Egyeteme előadót is, mint pl. Lovász László, Barabási Albert-László, Vicsek Tamás és Csermely Péter. És ha már a Mindentudás Egyeteme előadóit említjük, meg kell jegyezni, hogy a hálózatkutatás egyáltalán nem új téma a Mindentudás Egyetemén; a teljesség igénye nélkül álljon itt egy lista olyan előadókról, akik előadásukban hálózatelméletre hivatkoztak: Barabási Albert-László fizikus, Bodó Balázs közgazdász, Csermely Péter biokémikus, Horváth Attila orvos, Máray Tamás informatikus, Nyíri Kristóf filozófus, Pléh Csaba pszichológus, Pongor Sándor bioinformatikus, Vicsek Tamás fizikus, Vint Cerf informatikus.
Akik figyelemmel kísérték a ME előadásait, megtudhatták, hogy az említett univerzalitás jelensége megfigyelhető a természet és az ember alkotta hálózatok jelentős részében, vagyis nagyon különböző rendszerek hálózatai hasonló vonásokkal rendelkeznek. A következő néhány ábrán (1-5. ábra) példaként néhány ilyen hálózat látható.
Az utóbbi években megállapították, hogy a természetes és ember alkotta hálózatok széles csoportjában három érdekes tulajdonság figyelhető meg: az első az ú.n. kis világ tulajdonság (vagy 6 lépés távolság), amely szerint a földkerekség egy tetszőlegesen kiválasztott emberétől egy tetszőleges másik emberig az ismerősök hálózatán (ismerősök ismerősei, azok ismerősei, stb.) meglepően kevés lépésben lehet eljutni. A másik fontos tulajdonság a széles fokszám-eloszlás vagyis az, hogy a kapcsolatok száma széles határok között változik. A társas hálózatok harmadik fontos tulajdonsága, hogy a háromszögek száma nagy, ami valami olyasmit jelent, hogy a barátom barátjával én is könnyen barátkozom.
- |6|
II. Súlyozott hálózatok
Visszatérve a repülőgép-járatok hálózatának ábrájára (5. ábra), nyilvánvaló, hogy annak megalkotásakor a rendelkezésre álló adatoknak csupán töredékét használták fel. Az adatok teljesebb felhasználásával egy művészi hajlamú kolléga, Aaron Koblin érdekes filmet |2}| készített, melyen időben kísérhetjük figyelemmel az észak-amerikai kontinens polgári légiforgalmát néhány napon át.
Sajnos az utóbbi években megtanultuk, hogy a világ "összezsugorodása", a közlekedés fejlődése, a globális hálózatok kialakulása veszélyeket is rejt magában (gondoljunk csak a SARS járvány terjedésére, vagy a számítógépeket megtámadó virtuális vírusokra).
- |7|
- |8|
III. Gazdasági hálózatok elemzése
A gazdaság hihetetlen mennyiségű adatot termel. A rendszer komplexitását több oldalról is lehet hálózatok segítségével jellemezni. A tulajdonosi adatok a részvénytársaságok esetében nyilvánosak és igen tanulságos ezek súlyozott hálózatként történő ábrázolása. Az ilyen hálózatok tanulmányozása, különösen az időbeli változások követése igen tanulságos; pl. sokat elárul a tőkekoncentrációról. Erre mutat páldát a 9a és 9b ábra: az előbbi a német tőkepiac egyik vezető szereplőjének tulajdonosi hálózatát mutatja 1996-ban, majd ugyanezt a szereplőt látjuk 2000-ben egy leegyszerűsödött tulajdonosi környezetben.
Nagyon érdekes lenne a gazdaság működésével szoros kapcsolatban lévő kereskedelmi kapcsolatok hálózatát felderíteni. Ide tartoznak a "végfogyasztó" oldalon a bevezetőben említett "pontgyűjtő kártyák", ill. az ott szereplő adatok, de ezeket - mint ahogy általában a kereskedelmi partnerekre vonatkozó adatokat - titkosan kezelik. A vásárlásokról szóló információ ugyanis értékes. Pl. a nyolcvanas évek óta közismert, hogy a sör- és a papírpelenka-fogyasztás között erős korreláció van, ezért ezeket a termékeket az áruházakban célszerű egymáshoz közel elhelyezni (ugyanis rendszerint az apukákat küldik el pelenkát venni). Az elektronikus árverések adataihoz könnyebb hozzáférni, ahogyan ezt koreai és német kollégák egymástól függetlenül meg is tették. Figyelemre méltó megállapításokat tettek mind az ajánlattevők, mind pedig a kalapács alatt lévő tárgyak csoportosulásaira. Két tárgy között akkor van kapcsolat (kötés a hálózatban), ha valaki mindkettőre licitál, a kötés súlya pedig a licitálók számából adódik. Az ilyen adathalmazból meg lehet határozni a kapcsolódások hierarchikus hálózatát. A 10. ábra egy ilyen hálózatot (dendrogramot) mutat. A megvalósult kötések eltérése a tervezetthez képest ékes bizonyítéka annak, hogy az adatok elemzése mennyire nélkülözhetetlen.
- |12|
A tőzsde önmagában is óriási adatforrás: az ú.n. ajánlati könyvben szerepel, hogy ki, mikor, milyen lejárattal, milyen papírra milyen mennyiségben, milyen áron tesz vételi vagy eladási ajánlatot. Ha az ajánlat csak két másodpercig él, elektronikusan akkor is nyoma van! Az ajánlati könyv a tőzsde mikroszkopikus dinamikájának lenyomata. Az újságokból jól ismert árfolyam-görbék tehát csak töredékét tartalmazzák az elvben rendelkezésre álló információnak. A 11. ábra három óriásvállalat részvényárfolyamát mutatja azonos időszakban. Ezek közül kettőnek, a két vezető kólagyártó cégnek a változása hasonló, míg a mobiltelefon piacon vezető harmadik cégé egészen különböző. Ez az információ nagyon fontos a portfolió összeállításánál. A befektetők akkor érezhetik magukat biztonságban, ha nem hasonlóan viselkedő részvényekbe helyezik a pénzüket, hiszen balszerencsés esetben ezek árfolyama egyszerre zuhanhat. A portfolió diverzifikálását úgy kell megoldani, hogy adott kockázat mellett maximális legyen a várható haszon. A feladat matematikai megfogalmazásáért és egy (bizonyos feltételek mellett érvényes) egyszerű megoldásáért Harry M. Markowitz 1990-ben közgazdasági Nobel-díjat kapott. Az elmélet alapvető mennyisége a hasonlóság kvantitatív jellemzésér szolgáló korrelációs együttható, amit az adatok statisztikai kiértékeléséből lehet nyerni.
- |13|
Ha a New York-i tőzsdén (NYSE) szereplő, mintegy 3500 részvényből szeretnénk összeállítani a portfoliónkat, akkor a hasonlósági adatok egy 3500X3500-as számtáblázatba, ú.n. korrelációs mátrixba foglalhatók, amiben nagyon nehéz kiismerni magunkat. Ráadásul a mátrix elemei komoly statisztikus hibákat tartalmaznak, így nem világos, hogy azokat mennyire lehet komolyan venni. E ponton segíthet a hálózati szemlélet: legyenek a részvények egy hálózat csomópontjai, és induljunk ki abból, hogy minden lehetséges él be van húzva, súlyként pedig tekintsük a korrelációs együtthatókat! Egy kusza, áttekinthetetlen hálózatot kapunk, de a kötések nagy része csak zajnak felel meg. Hogyan lehet ettől a zajtól megszabadulni és csak a fontos részt megőrizni? Rosario N. Mantegnának, a Palermoi Egyetem professzorának támadt az az ötlete, hogy készítsük el ennek a hálózatnak a "maximális feszítő fáját", vagyis egy olyan hálózatot, amelyben nincsen zárt hurkok ("fa"), minden pontot út köt össze ("feszítő fa") és az élsúlyok összege maximális ("maximális feszítő fa"). A fogalmat egy egyszerű gráfon szemlélteti a 12. ábra.
- |14|
- |15|
Megvizsgáltuk, hogyan változik a részvényfa időben, és azt tapasztaltuk, hogy meglehetősen robusztus. Ha azonban olyan megrázkódtatás éri a piacot, amely minden szereplőre hat - mint az 1987. október 19-i "fekete hétfő", amikor a történelem legnagyobb árfolyamesése következett be -, hirtelen együtt mozognak az árfolyamok, ami drámai hatással van a részvényfára (14. ábra).
Más hálózati megközelítést is lehet alkalmazni a korrelációs mátrix tanulmányozására. Először csupán a csomópontok legyenek jelen és helyezzük el az éleket egymás után, a csökkenő korrelációknak megfelelő sorrendben. Az animáción |3}| jól látszik, hogy az egyes ágazatok vállalatai közötti kapcsolatok, korrelációk erőssége ágazatonként változik (a csomópontok elhelyezkedése a 13. ábrán látható elrendezést követi). A legerősebb az energia-szektor "összetartása", a legszerteágazóbbak a pénzügyi cégek kapcsolatai. Az ilyen típusú vizsgálatokból a korrelációs mátrix elemeinek információtartalmára is következtetni lehet.
IV. Óriás szociális hálózatok digitális adatokból
Ebben a fejezetben a személyes digitális adatok tudományos célú felhasználásáról lesz szó. A szociológusok hagyományos adatgyűjtési eszköze a kérdőív, melynek előnye, hogy a vizsgált jelenségre célzottan rá lehet kérdezni, egyszerre több szempontú vizsgálatot lehet folytatni - hátránya viszont, hogy viszonylag korlátozott méretű mintával lehet csak foglalkozni, és a válaszok gyakran pontatlanok, szubjektívek. Ezért a hagyományos kérdőívek módszerével aligha lehet a társadalom egészének szerkezetére vonatkozó hipotéziseket ellenőrizni.
Az új évezred az empirikus szociológia új korszakának nyitánya. Az olyan óriás digitális adatbázisok, mint az elektronikus levelezéskor és a telefonáláskor automatikusan rögzített feljegyzések, vagy az iwiw-hez hasonló internetes csoportosulások valódi aranybányának bizonyulnak, ha a társadalom egészéről szeretnénk állításokat megfogalmazni. A telefonbeszélgetéseknek különös jelentőséget ad, hogy ott a kapcsolat a hálózat két csomópontja között jelentkezik, míg elektronikus leveleket lehet sok címzettnek egyszerre küldeni.
- |16|
- |17|
- |18|
Mit jelent a megfigyelésünk a társadalom szerkezetére vonatkozólag? A társadalom közösségekből áll, amelyeken belül intenzívek a kapcsolatok és erős a hálózat "huzalozottsága". Ezeket az erős kapcsolatokkal összefűzött közösségeket egymással gyenge kötések kapcsolják össze, amint azt a 17. ábra mobiltelefonálási hálózata is szemlélteti.
A lokális szerkezetnek érdekes globális következményei vannak. Tekintsük a következő gondolatkísérletet: megszüntetjük a gyenge kapcsolatokat. Azokat, akikkel nagyon ritkán telefonálunk, kitöröljük a telefonkönyvünkből. Ha ezt fokozatosan tesszük, kezdve a leggyengébb kapcsolatokkal, akkor a kötések kb 80%-ának eltávolítása után a korábban az egész társadalomra kiterjedő hálózat atomjaira esik szét (18. ábra). Ezek az atomok az egymással erős kapcsolatban álló közösségek.
Egy még abszurdabb gondolatkísérletben a legerősebb kötéseket szüntetjük meg először. A szívünkhöz legközelebb állóval kezdjük, majd a következővel és így tovább. Az eredmény természetesen az, hogy elpusztítjuk a közösségeket, de meglepő módon a teljes hálózat egy számottevő hányada egészen végig összekötözött marad (19. ábra).
Ezeket a megfigyeléseket a fizikában régóta ismert perkolációelmélet segítségével kvantitatívvá lehet tenni. Kiderült, hogy a gyenge kötések kioltása egy fázisátmenet-szerű, éles átalakulást eredményez, míg az erős kötésekkel kezdve a ritkítást, az átalakulás elmarad.
Milyen hatása lehet a hírek (vagy pletykák, járvány, stb.) terjedésére az itt feltárt társadalmi szerkezetnek? A kérdés megválaszolásához egy modell-vizsgálatot végeztünk. Feltételeztük, hogy a hírek véletlenszerűen terjednek, és egy informált személy a hírt a kapcsolat intenzitásával arányos valószínűséggel adja át a partnerének. A 20. ábrán az látszik, hogy a hír megreked a közösségekben, amitől a terjedési görbe lépcsőzetes lesz. Sok kiindulópontról indított terjedésnek megfelelő görbét figyelembe véve megkapjuk az átlagos terjedési viselkedést. Ha figyelmen kívül hagyjuk, hogy a hálózaton az átadási sebességek különbözőek és feltételezzük, hogy minden kapcsolaterősség egyforma (homogén), akkor a 21. ábra piros görbéjének megfelelő terjedési görbét kapunk, amelyre az jellemző, hogy a fertőzöttek száma meredeken emelkedik, míg be nem következik a telítődés. Szembeötlően lassúbb a terjedés, ha figyelembe vesszük, hogy a közösségeket összekötő kapcsolatok gyengébbek (inhomogén kapcsolaterősség, a 21. ábra kék görbéje). Ez persze előny járványterjedésnél, de hátrány lehet az információ terjesztésénél.
A rémhírek is járványként terjednek. Emlékezhetnek: hogyan vitte 1996-ban a Postabankot a csőd szélére egy futótűzkent terjedő sms, vagy 2003-ban miként terjedt el óvódás gyerekek beszélgetése alapján a paksi erőmű felrobbanásáról szóló rémhír (ez utóbbi esetben szerencsére a rendőrség és a média gyors közbelépése révén a fertőzöttek köre néhány közösségre korlátozva maradt).
A hatalmas digitális adathalmazok tudományos feldolgozásának az elején tartunk. Felgyorsult világunkban várható, hogy az eredmények visszahatnak majd magára a rendszerre. Lehetőség nyílik az eredményekkel való visszaélésre, elég ha csak a marketingre, vagy a politikai manipuláció lehetőségére gondolunk. E kérdés kapcsán kiemelkedő felelősség hárul a társadalomkutatókra, a tudósokra.