Data

data – obecně formální systematické záznamy informace pomocí čísel a symbolů, ve statist. analýze záznamy o hodnotách proměnných a o stavech jednotlivých objektů (případů), chápaných jako realizace náhodných veličin a náhodných jevů, spolu s informací o způsobu vzniku a sběru (výběrový postup, způsob měření, schéma experimentu, geneze), příp. též spolu s modelem určujícím jejich pravděpodobnostní chování (viz statistická analýza dat). Souhrn objektů, o nichž je veden záznam, tvoří soubor. Záznamy mohou být řazeny též pořadím vzniku nebo časově. Proměnné, jejichž hodnoty jsou v záznamech zapisovány, reprezentují vlastnosti objektů. Záznamy o hodnotách proměnných jsou prováděny v přímé číselné formě, určením pořadí objektu v souboru, pomocí kódů vyjádřených číslicemi, písmeny, názvy, jmény, znaménky, grafickými útvary a obrazci, pomocí textů nebo v převedeném (transformovaném) číselném tvaru (logaritmované, standardizované, normované hodnoty, indexy atp.). Proměnné se dělí do typů, které se liší jak způsobem záznamu, tak (především) způsoby a metodami zpracování: spojité číselné proměnné, nespojité (diskrétní) číselné proměnné, kategorizované proměnné (nominální, ordinální, kardinální, zobecněné), pořadí. Souhrn všech údajů o souboru objektů tvoří statistickou řadu (pro jednu proměnnou), datovou matici (tabulka záznamů, v níž řádky odpovídají objektům a sloupce proměnným) nebo na počítači datový soubor. D. poskytují informaci buď přímo (informace o objektech), nebo po sumarizaci v tabulkách a grafech (informace o souboru objektů), nebo po matem.-statist. zpracování (informace o struktuře souboru objektů, vztazích mezi proměnnými, zobecnění náhodné složky dat).

Datový soubor lze charakterizovat tím, že: a) má význam sám o sobě, jako soubor informací o daných objektech, b) vypovídá o širším souboru objektů (výběrový souborzákladním souboru), c) vypovídá o dalších, přímo neměřených vlastnostech (predikce, odhad, diagnostika, klasifikace, latentní proměnné). Data vznikají: 1. systematickým záznamem podle připraveného projektu (sociologický výzkum, pravidelné pozorování); 2. systematickým záznamem podle vzniku (hlášení) demogr. jevů; 3. spontánně s následným sytematickým shrnutím (statistiky trhu, záznam historie, časové řady); 4. zjišťováním výsledků plánovitého vzniku určitých údajů (experiment, pseudoexperiment).

data données Daten dati

Jan Řehák