Analýza dat explorační

analýza dat explorační1. přístup zahrnující metody a postupy vyhledávání vztahů v datech (mezi objekty, mezi proměnnými, mezi objekty a proměnnými) a formulování závěrů o struktuře datového souboru (jeho homogenních částech a jejich charakteristikách). A.d.e. chápaná v tomto smyslu je založena na postupném studiu vlastností datového souboru a na postupném odhalování platných závěrů včetně s-gické interpretace. Nevychází z předem striktně stanovených s-gických či statist. hypotéz, ale je postavena na vhodné posloupnosti otázek, na něž jsou z dat hledány odpovědi. Každá odpověď vede k tvorbě nové otázky (hlubší, přesnější, komplexnější či pátrající po dalších vztazích). Postup pokračuje tak dlouho, dokud není vytvořen konzistentní a pro cíle výzkumu zajímavý a důležitý závěr, nebo dokud není vyčerpána informační hodnota datové báze. V tvorbě s-gických závěrů má výsledek většinou status hypotézy nebo podkladové informace. Úskalí postupu: a) disponibilní data, která nepokrývají obsahově celý problém, mohou vést k dílčímu pohledu a k závěrům založeným na jednostranné a neúplné informaci; b) počáteční představa a první fáze analýzy může mylně orientovat další posloupnost kroků a tím i minout závažné vztahy; c) analýza může odrážet nahodilé vztahy, zkreslení vzniklé nereprezentativností souboru apod., obtížně identifikovatelné a přitom mnohdy podstatné (např. korelace zkreslené pozorováními vychýlenými či chybnými a závěry z nich). Typickými metodami a.d.e. jsou: znaménkové schéma, dekompoziční analýza reziduí, faktorová analýza, seskupovací analýza, lineární dekompoziční analýza reziduí (LINDA), asociační spojování kategorií (COLLAPS), GUHA, korespondenční analýza a analýza hlavních komponent. Typické pro a.d.e. je využívání různých způsobů grafického zobrazení dat a datových vztahů.

2. A.d.e. se rozumí též spec. metodika, kterou zavedl J. W. Tukey a která je založena na uspořádaných statistických řadách. Je charakteristická snahou zjednodušit popis a proniknout jím hlouběji do dat (slouží k tzv. rychlé analýze dat). K hlavním charakteristikám a postupům Tukeyho a.d.e. patří: medián, opěrné body, kvartily, oktily, sedecily, vnější a vnitřní hradby, schéma větvení (lodyha, listy), diagram rozptýlení (krabičkový graf), vyhlazování řad a tabulek, transformace proměnných, analýza reziduí. Typické je také využívání mnoha různých grafických prostředků a obrázků různých typů (největší hodnotou obrázku je, že nás nutí všimnout si toho, co nikdy neočekáváme). Metodika není uzavřena, je však jedním z nejvlivnějších směrů působících na prezentování dat v publikaci i na rozvoj metodologie analýzy dat.

exploratory data analysis analyse exploratoire des données Explorationsdatenanalyse analisi explorativa dei dati

Literatura: Řehák, J.: Data, statitika a sociologie. Sociologický časopis, XVII, 1981; Tukey, J. W.: Exploratory Data Analysis. Reading, Mass. 1977.

Jan Řehák