Jan Velát - Analýza struktury vztahů mezi vědnímí disciplínami

12.01.2011 18:20

Záměr

Svá data jsem si vybral tak, abych mohl zběžně sledovat, nakolik se navzájem prolínají a ovlivňují jednotlivé více či méně vědecké disciplíny a některé obecné pojmy, které se dotýkají jejich předmětu (dále oboje označuji uzly).

Operacionalizace

Rozhodl jsem se operacionalizovat vzájemné prolínání a ovlivňování jako počty knih, které patří k oběma uzlům. Tedy přesnějí mají oba dva uzly uvedeny mezi svými klíčovými slovy. Kniha je vyhledána pod nějakým klíčovým slovem, pokud je obsaženo v názvu nebo je dané knize přiděleno knihovníkem.

Data

Data jsem sesbíral z katalogu knihovny UK (https://ckis.cuni.cz ) a to tak, že jsem vždy nechal vyhledat dva uzly společně a zapsal, v kolika knihách se společně vyskytují. Pro názornost je nazvu uzly A a B. Tento společný výskyt A a B jsem pak dal do poměru s celkovým počtem knih vyhledaných pro A, abych určil sílu vazby od B k A a následně obráceně. Pomocí následujícího vzorce jsem sílu vazby vyjádřil v procentech:

                                    (A průnik B / A) x 100 = Síla vazby od B k A

Interpretace vazeb

Pokud by tedy byla například síla vazby od filozofie k historií 10, znamená to že deset procent knih označených jako o historii, je zároveň označeno jako knihy o filozofii. Odchozí vazby od nějakého uzlu tedy znamenají, jestli a jak moc se knihy přířazené tomuto uzlu zároveň podílejí (nacházejí) na knihách přiřazených k uzlům jiným. Příchozí vazby vyjadřují, jestli a jak moc se knihy přiřazené k jiným uzlům, podílejí na knihách přiřazených k tomuto uzlu.

Míry centrality

Poznámka: Úvodem je potřeba zmínit jeden problém s interpretací měr centrality v případě, kdy zde používám vážená data. V mých datech existují dva případy velmi silných vazeb, které jsem takříkajíc arbitrálně vytvořil tím, jaké pojmy pro uzly jsem zvolil a jaké nikoliv. Jeden typ vazby je mezi disciplinou a pojmem, který označuje víceméně objekt jejího zkoumání. Tyto silné vazby nastávají především mezi historií a dějinami a mezi politologií a politikou. Druhý případ nastává mezi disciplínou a jinou disciplínou, která se dá označit za její pod-disciplinu. Takto silné vazby nastávají například mezi filozofií a etikou nebo mezi fyzikou a astrologií či mechanikou. Všechny tyto vazby se samozřejmě promítají do měr centrality, a tím můžou částečně zkreslovat významnost jednotlivých disciplín. Na druhou stranu lze jako podporu mého výběru uzlu uvést to, že jsem tento výběr provedl z mnohem většího množství na základě počtu knih, které pod nimi byly vyhledány. Tedy jinak řečeno jsem vybral především ty, které měly hodně knih (většina víc než 5000) a jevily se mi tedy významné. U přírodních věd je také obtížné nacházet nějaké obecné pojmy, které by vymezovaly jejich objekt zkoumání a často takové pojmy nebývají užity jako klíčové pojmy při označování knih (například pojem příroda je klíčové slovo v knihovně UK pro 1371 knih, pro srovnání dějiny jsou klíčové slovo pro 93 006 knih)

OutDegree a InDegree

Díky tomu, že síla vazeb je kódována jako procento podílení, stává se pro nás OutDegree sumou procent, kterými se daný uzel podílí na uzlech jiných a obráceně InDegree sumou procent, kterými se jiné uzly podílejí na daném uzlu.

 

Z tabulky je zřejmé, že v OutDegree uzly obecných pojmů vedou spolu s filozofií a fyzikou, což odpovídá tomu, že se jedná o discipliny s velkou obecností. Naopak discipliny s velmi specifickým objektem zkoumání jako je botanika či archeologie se nacházejí na opačné straně spektra. Trochu nás může překvapit pozice matematiky ve skupině uzlů s nejmenším podílením na uzlech ostatních, ale zde se jen objevuje problém obsažený ve způsobu operacionalizace. Totiž fakt, že to že se v nějaké knize (potažmo disciplíně) využívá matematiky, ještě nikterak nezaručuje, že takové knize (potažmo knihám teto disciplíny) bude přiřazeno jako klíčové slovo matematika.

V InDegree vedou historie, etika a politologie, především diky tomu jak moc se společně vyskytují s dějinami, filozofií a politikou. Nízký InDegree především u chemie a geologie (ale i u jiných) by se možná dal interpretovat jako určitá samostatnost discipliny a zároveň opět fakt že například podíl fyziky na chemii je natolik samozřejmý, že se v knihách o chemií potom fyzika jako klíčové slovo neuvádí.

Největší rozdílnost mezi OutDegree a InDegree vykazuje estetika, která sama se podílí na ostatních uzlech málo, ale na ní samotné se hodně podílí většina uzlů obecných pojmů a filozofie.

Closeness

Pro výpočet Closeness jsem použil symetrická data, kde na to, aby mezi uzly vznikla vazba, byla stanovena úroveň významnosti minimálně 4 (tento výpočet chápe vazby jako 0 nebo 1). Tato úroveň je nejvyšší, která v grafu nevytváří izoláty a přitom vyplňuje graf ze 13% všech možných vazeb, což se jeví jako pořád dobrá výpovědní hodnota. Symetričnost jsem zvolil, protože mi nepřišlo důležité, kterým směrem po vazbách mezi uzly postupujeme (od discplin které se podílejí k disciplnám na kterých se podílejí či opačně), neboť oba představují smyslupný důvod blízkosti jednoho uzlu k druhému.

 

Zde je vidět, že krom obecných pojmů, kde se to dalo očekávat, se dostalo navrch významné množství humanitních věd (filozofie, historie, sociologie, politologie). To by mohlo vypovídat o jejich vzájemném propojení, stejně jako jejich propojení se mnou zvolenými obecnými pojmy. Na druhé straně spektra se nacházejí některé specializované přírodní vědy, matematika a statistika a trochu překvapivě biologie a chemie, jako v zásadě obecné přírodovědné discipliny. Pokud bych to měl interpretovat, asi bych řekl, že přírodní vědy, ač jsou vzájemně úzce provázané, mají zároveň mnohem přesněji definované hranice a jejich průniky v podobě společných knih jsou tak menší.

Betweeness

Zde jsem použil stejně upravená data jako pří výpočtu Closeness, víceméně ze stejných důvodů.

 

Z výpočtu betweeness se zdá, že některé uzly, které se jinde jeví jako okrajové, zde dostávají jistou důležitost jako zprostředkovatelé, například se jedná o výše zmíněnou chemií a biologií, ale například i matematiku a demografií. Velmi významnou se zde stává ekologie, protože vede vazby mezi přírodními vědami a politikou a právem. Historie, fyzika a filozofie dostávají své vysoké postavení díky tomu, že jsou navzájem propojeny a vedou tak vazbu mezi podskupinami přírodních věd, humanitních věd a obecných pojmů. Naopak z humanitních věd psychologie a ekonomie zde nevedou žádnou nejkratší vazbu. Uzly některých obecných pojmů zde ustupují do pozadí, pravděpodobně protože především dějiny a částečně politika zajišťují kratší vazby mezi uzly než ony.  

Podskupiny a struktura grafu

Pro výpočet Closeness jsem použil usměrněná data, kde na to, aby mezi uzly vznikla vazba, byla stanovena úroveň významnosti minimálně 4 (tento výpočet převádí graf na neváženou verzi a chápe vazby jako 0 nebo 1). Jako metodu určení podskupin jsem použil components pro usměrněná data s nastavením na strong ties. Tato metoda vyhledává v grafu izolované podskupiny s tím, že jako vazbu mezi uzly bere pouze vazbu oboustrannou (strong tie), která tedy vede jak z uzlu A do B tak z uzlu B do A. Zvolil jsem tuto metodu, protože zvýrazňuje informaci, která není v původním celkovém grafu tak zřetelně viditelná. Navíc rozdíl mezi jednostrannou vazbou (weak) a oboustrannou vazbou (strong) zde má podle mě jistý interpretační význam. Na to, aby vznikla oboustranná vazba, je mezi uzly potřeba určitý stupeň vzájemnosti (společných knih) a také určitá rovnost (poměr celkového počtu knih jednoho a druhého). Z toho se dá předpokládat, že mezi disciplínami či pojmy dochazí k určité interakci nebo prolínání. Naopak jednostranná vazba vždy značí nerovnost mezi uzly (v celkovém počtu knih) a podobá se spíše vazbě nadřazeného pojmu či disciplíně k podřazenému.

 

Výsledkem byly 4 podskupiny a 9 izolovaných uzlů (tedy uzlů, které nemají žadnou oboustrannou vazbu):

 

Hlavní podskupina 1 – dějiny, etika, filozofie, historie, kultura, náboženství, politika, politologie, právo, psychologie, sociologie, společnost, teologie

Podskupina 2 – astronomie, chemie, fyzika, mechanika

Podskupina 3 – biologie, ekologie, fyziologie

Podskupina 4 – matematika, statistika

Izolované uzly – antropologie, archeologie, botanika, demografie, ekonomie, estetika, geologie, lingvistika, lékařství

Konkrétní struktury grafu těchto podskupin jsou vidět na následujícím obrázku.

 

Interpretace

Hlavní podskupina 1 – Zřetelně jde o humanitní a společenskovědní disciplíny a pojmy. Jde o největší podskupinu a nabízela by se interpretace, že je to díky tomu, že v humanitních a společenských vědách dochází k většímu prolínání a ovlivňování disciplín. Když se však blíže podíváme na graf této podskupiny, uvidíme, že jejím centrem a vzájemným pojivem jsou obecné pojmy (dějiny, kultura, politika, společnost a náboženství). Kdybychom je vyloučili, vznikly by pouze dvě jiné podskupiny a) etika, filozofie, teologie a b) psychologie a sociologie. Jde tedy říct, že v tomto výzkumu jsou specifikem humanitních a společenských disciplín právě ty obecné pojmy (předměty zkoumání), které je vzájemně pojí, jinak by jejich situace nebyla nijak zvlášť odlišná od disciplín ostatních. Jak už bylo řečeno výše, pro ostatní disciplíny nebylo možné najít takové obecné pojmy, které by na ně měly vazby a zároveň by se hojně užívaly jako klíčová slova u knih.

Podskupina 2 – V centru této podskupiny je fyzika, na kterou jedinou mají všechny ostatní uzly svou vazbu. Další specifickou vlastností uzlů v této podskupině je, že se jedná o disciplíny, jejichž účelem je formulování vysoce abstraktních zákonů často operujících s ideálními podmínkami uzavřeného sysému a podobně.

Podskupina 3 – Zde oba dva ostatní uzly mají svou oboustrannou vazbu pouze k biologii. Jedná se o disciplíny, které se víceméně zabývají živými organismy, a tedy jsou oproti podskupině 2 i blíže člověku.

Podskupina 4 – Zde se nachází dvě čistě abstraktní formální disciplíny.

Závěr

Metoda SNA aplikovaná na klíčová slova u knih, se zdá být docela funkční a přínáší i některé zajímávé výsledky, například poměrně silný zjištěný vztah mezi filozofií a fyzikou, který navíc funguje jako jedna ze spojnic mezi vědami humanitními a přírodními. Hlavní omezení pak spočívá především ve způsobech, jakými jsou klíčová slova knihám přiřazována, což může zásadně ovlivnit výsledek a také omezit, která klíčová slova lze a která nelze (díky nedostatku přiřazených knih) použít.

—————

Zpět