Zpracování sociologického výzkumu strojové (MSgS)

zpracování sociologického výzkumu strojové (MSgS). Ke strojovému zpracování se při sociologické výzkumné akci hodí zejména dvě po sobě následující operace, třídění a statistické vyhodnocení. Vstupní informací pro třídění jsou hodnoty kódovaných znaků pro každého jedince ve sledovaném vzorku, např.: příjem prvého jedince je kódován číslem 15, příjem druhého jedince je kódován číslem 16 atd. Odpovídá to např. nekódovaným údajům, že příjem prvého jedince je mezi 1450 a 1500 Kčs atd. Výstupní informací třídění (a zároveň vstupní informací statistického vyhodnocení) jsou absolutní četnosti prvého stupně i vyšších stupňů, odpovídající provedenému třídění podle jednoho nebo více znaků. Výstupní informací statistického vyhodnocení jsou statistické charakteristiky, např. hodnota koeficientu korelace apod. Statistického vyhodnocení z netříděných hodnot se v sociologickém výzkumu užívá zřídka.

Strojové zpracování může být mechanizované (pomocí děrnoštítkových strojů) nebo automatizované (pomocí samočinného číslicového počítače). Mechanizované zpracování je výhodné zejména pro třídění, zatímco statistické vyhodnocení bývá na děrnoštítkových strojích obtížnější (kromě zvlášť jednoduchých případů). Automatizované zpracování je vhodné zejména pro statistické vyhodnocení, zatímco při třídění nebývá samočinný počítač ekonomicky využit (kromě vzorků se zvláště malým počtem jedinců).

Mechanizované zpracování pomocí strojů na děrné štítky představuje ekonomicky účinné vyhodnocení informací. Princip práce spočívá v přenosu údajů na děrný štítek, který je základem celého zpracování. Děrný štítek je nositelem informace a jeho pomocí je zprostředkována technika práce na děrnoštítkových strojích. Děrný štítek má tvar obdélníku, je vyrobený ze speciálního kartónu a jeho vlastnosti musí odpovídat ČSN 88 5601 ze dne 1. dubna 1955. Rozměry: 187,3 mm (± 0,15) × 82,47 mm (± 0,07 mm) × 0,17 (± 0,15 mm). Štítek je v levém horním rohu seříznut pro rozlišení správné polohy při vkládání štítku do stroje.

Děrné štítky jsou devadesátisloupcové a osmdesátisloupcové. Strojně početní stanice jsou většinou vybaveny děrnoštítkovými stroji čs. výroby ARITMA ‒ systém devadesátisloupcového děrného štítku. Vedle těchto našich strojů pracuje řada zahraničních značek na osmdesátisloupcovém systému.

Na děrný štítek můžeme ukládat informace numerické i alfanumerické. Uložení těchto znaků se děje pomocí kulatých otvorů, vyražených do štítků děrovacím strojem. Číselné znaky jsou děrovány v kódu Powers, kde nula a liché číslice jsou vyznačeny jednou dírkou v řádce pro tyto číslice vyhražené, sudé číslice pak ještě dalším druhým děrovaným otvorem — devítkou. Příklad:

1 = 1

2 = 1 a 9

3 = 3

4 = 3 a 9

Pro stroje alfanumerické (abecedně číslicové) je určen speciální kód ARITMA, kde písmeno velké abecedy — celkem 29 — se děruje jednou až čtyřmi dírkami.

Příklad:

[math]A[/math] je složeno ze znaků 1 a 7

[math]B[/math] je složeno ze znaků 5, 7, 9 atd.

Stroj pracuje jen s číselnými znaky a abecední znak je rovněž převeden na číselný.

Děrný štítek má 90 děrných sloupců a je rozdělen na dvě poloviny, od sloupce 1—45 do sloupce 46—90. Do každého sloupce lze umístit jeden číselný znak od nuly do devítky nebo jedno písmeno. Rozmístěním údajů na děrný štítek se zabývá projekt návrhového děrného štítku. Zpracované údaje na děrném štítku jsou třídící — indikační a hodnotové. Různé údaje a pojmy, které chceme zpracovat pomocí strojů na děrné štítky — a to zejména údaje slovní a kvalitativní — je nutno vyjádřit pomoci vhodných číselných symbolů. K převedení údajů na děrné štítky se používá číselných klíčů. Číselný klíč představuje čísla, uspořádaná určitým způsobem podle předem stanovených zásad. Jde o číselnou soustavu, kterou vyjadřujeme řadu či skupinu pojmů. Číselné klíče se člení na pořadové, skupinové, desetinné a kombinované. Tvoření klíčů je závažnou prací, neboť dobře sestavený číselný klíč ovlivní rychlé zpracování údajů ve strojně početní stanici. Klíče musí být úplné, vhodné a především jednoduché, tj. srozumitelné a snadno zpracovatelné. Hlavním úkolem klíčů je odlišení jednoho pojmu od druhého, aby stroje automaticky vytvářely v sestavách souhrny, které by bylo možno doplňovat a měnit na nové znaky. Správně uspořádaný klíč musí plnit funkce odlišovací, kontrolní, seřazovací a skupinové. Číselné klíče jsou zahrnuty do číselníku a vytvářejí tak soupis číselných klíčů, seřazených v určitém pořádku a s určením doby platnosti.

Číselný znak je konkrétní číslo, které označuje jednotlivý pojem. Kód představuje technický způsob zachycení a vyjádření čísel nebo písmen na děrném štítku, děrné pásce apod.

Celé zpracování probíhá prostřednictvím děrných štítků na základní soupravě strojů: děrovač typ 140 nebo 150 (tj. číselný nebo abecední), přezkoušeč 600 nebo 610, třídič 200 nebo 220, tabelátor 310 nebo 320 a na dalších strojích podle druhu zpracování výsledků. Tyto doplňkové stroje zprostředkují matematické vyhodnocení výsledků: počítač typ 520 (zpracuje všechny základní matematické i složené početní úkony), opakovač ARITMA 710, zakládací reproduktor ARITMA 720, popisovač ARITMA 700 a zakladač ARITMA typ 730. Nově zkonstruovaný malý děrnoštítkový samočinný počítač DP 100 byl v praktických zkouškách vyhodnocen jako nejvýhodnější stroj děrnoštítkové techniky pro zpracování informací.

Strojové zpracování dotazníků na děrných štítcích musí předcházet jednání se strojně početní stanicí a dohodu o postupu zpracování. Tiskopis dotazníků musí být upraven pro strojové zpracování tak, aby odpovídal technickým možnostem jednotlivých strojů. Před zpracováním musí být předložen kompletní požadavek na konečné výsledky. Na základě sjednaných dohod vypracuje odpovědný pracovník strojně početní stanice ideový projekt, který bude konzultován se zadavatelem úlohy a teprve po jeho schválení je sestaven organizačně technický projekt. V řádném oponentním řízení se dosáhne souhlasu v postupu i v dosažitelných předpokládaných výsledcích, navrhovaných v řešení projektu.

Samočinných číslicových počítačů se užívá nejčastěji s programem, sestaveným (s pomocí standardních podprogramů) pro konkrétní sociologickou akci. Takový program, pokud je jeho sestavení ekonomicky únosné, je obvykle nejrychlejší a je akci nejvíce přizpůsoben. Nebývá těžké upravit ho pro akce podobné. Pokud jsou k dispozici potřebné podprogramy, jež provádějí všechny požadované operace s tímtéž vstupem a požadovaným výstupem, může jejich použití ušetřit práci programátora. Jiným možným postupem je užití univerzálního programu, který pracuje takto:

Sociolog předá výpočetnímu středisku zadání ve formě dvou částí. Prvou částí jsou údaje o každém jedinci (např. kódované dotazníky). Druhou částí je souhrn požadovaných instrukcí s údajem, na kterých znacích se má instrukce provést. Tak např. se požaduje výpočet odpovídající příkazu „Proveďte výpočet lineární korelace mezi znakem č. 19 (frekvence návštěv divadla) a znakem č. 7 (věk).“ Podle seznamu instrukcí v návodu přepíše se příkaz např. na tvar KORELACE A (19,7). Podobně se vypíší ostatní požadované instrukce, které dohromady tvoří druhou část zadání. Obě části zadání přepíše perforátorka (pracovnice výpočetního střediska) na děrné pásky, které se vloží do samočinného číslicového počítače. Spolu s nimi vloží se páska, obsahující univerzální program pro všechny sociologické výzkumné akce, vyčíslované popisovanou technikou. Samočinný počítač si nejprve sám sestaví prováděcí program k vyčíslení konkrétní sociologické akce, která mu byla zadána. Podle prováděcího programu pak vyčíslení provede a výsledky vytiskne ve formě protokolu v přirozeném jazyce, jehož vybrané části mohou např. tvořit součást zprávy o úkole. Ve většině případů je z ekonomických důvodů výhodnější provést třídění na děrnoštítkových strojích. Potom tvoří prvou část zadání (místo údajů o každém jedinci) souhrn absolutních četností, vypočítaných na děrnoštítkových strojích. Druhá část zadání (souhrn instrukcí) a výstupní protokol zůstávají stejné.

Automatizace vyčíslení má umožnit sociologovi, aby se mohl soustředit na důležité problémy meritorní (zajištění validní informace o jednotlivých jedincích, volba vhodných statistických technik a jejich interpretace) a ušetřit mu starost s numerickým prováděním vyčíslení. Užití popsané techniky nároky na sociologa nesnižuje, ale přesouvá a zároveň zvyšuje.

S tím souvisejí i některá rizika, spjatá s automatizací vyčíslení. Validitu a ekonomičnost vyhodnocované akce je třeba zajišťovat už od sestavování projektu akce důsledným respektováním pravidel, platných pro kvantitativní metodu. Zpracování nevalidních údajů na počítači by vedlo opět k nevalidním výsledkům, které by laika mohly klamat svou zdánlivou „vědeckostí“. Zadávání je poměrně pohodlné; to by mohlo v některých případech vést k plýtvání strojovým časem, jehož je u nás nedostatek.

Helena Janišová
Zuzana Perglerová