Škály a škálování (MSgS)

škály a škálování (MSgS). Škála je druh kvantitativního znaku. Škálování je vytvoření škály ze dvou nebo více znaků, které mohou být kvalitativní nebo kvantitativní.

Tak např. při měření postoje k práci padá v úvahu padesát otázek, na něž lze odpovědět „ano“ nebo „ne“. Vhodnou škálovací technikou se vybere pět těchto otázek. Škála „postoj k práci“ je pak kvantitativním znakem, jehož hodnotou u určitého jedince je např. počet otázek, na něž tento jedinec odpověděl kladně (tedy čísla 0, 1, 2, 3, 4 nebo 5). Škálování je operací vyžadující hodně času, znalostí a zkušeností.

Pokusy vytvořit škálu bez uváženého použití některé vyzkoušené techniky vedou takřka vždy ke ztrátě validity škály samotné a tím i části výzkumného úkolu.

Některé základní pojmy, potřebné pro pochopení významu škálování, jsou uvedeny pod heslem kvantifikace; pojem jednorozměrného kontinua lze přibližně vysvětlit dalším příkladem.

Předpokládejme (jako druhý příklad), že máme zjistit matematické znalosti souboru jedinců pomocí čtyř zkušebních otázek, jejichž řešení lze vždy jednoznačně klasifikovat „znal“ nebo „neznal“. Otázky jsou ze sčítání, násobení, základů algebry a základů integrálního počtu. Předvýzkum potvrdí samozřejmý předpoklad, že každý, kdo zná základy integrálního počtu, vyřešil i ostatní příklady; dále každý, kdo zná základy algebry, umí sčítat i násobit; podobně každý, kdo umí násobit, umí sčítat. Znaku „matematické znalosti“ můžeme pak u každého jedince přisoudit hodnotu 0, 1, 2, 3 nebo 4 podle toho, na kolik příkladů znal jedinec správnou odpověď. Lze si představit, že znak „matematické znalosti“ je spojitý čili kontinuální (tj. že může nabýt velmi velikého počtu hodnot) a že všechny jedince populace lze seřadit podle hodnoty tohoto jednoho znaku. Uvažovaná zkouška se čtyřmi otázkami umožňuje rozdělit řadu na 5 tříd, kterým byla přiřazena celá čísla od 0 do 4.

Kdybychom (jako další varianty škálování) vybrali z uvažovaných otázek kterékoli dvě nebo tři, rozdělila by se předpokládaná souvislá řada jedinců na jiné třídy, řadu samotnou by však nebylo nutno měnit; má-li jedinec Karel (při dělení populace např. na čtyři třídy podle znalostí) lepší matematické znalosti než jedinec Jan, nemůže mít např. při dělení na tři třídy horší znalosti než jedinec Jan.

Jako třetí příklad předpokládejme vytvoření podobné škály „výsledky studia“ podle správností odpovědí na otázky: a) ze znalosti základů algebry; b) základů integrálního počtu; c) chemických značek nejdůležitějších prvků; d) organické chemie. Formálně lze vytvořit podobnou škálu jako v druhém příkladě. Předpoklad o možném jednokontinuálním charakteru této škály a myslitelném řazení jedinců do jediné řady nemá zde však smysl. Kdybychom jako variantu třetího příkladu provedli třídění pouze podle prvých dvou otázek (které se týkají matematiky), dostali bychom výsledné rozdělení kontinua na „dobré studenty“ a „spatné studenty“ výhradně z hlediska matematického. Kdybychom jako jinou variantu třetího příkladu užili pouze otázek z oboru chemie, rozdělili bychom studenty opět na „dobré“ a „špatné“, ale zcela jinak než z hlediska matematického. Student, který je „dobrý“ matematik, by lehce mohl být „špatným“ chemikem a naopak.

(Souvisí to v našem příkladě s tím, že např. znalost integrálního počtu nepředpokládá znalosti organické chemie.)

Uvedený rozdíl má závažné gnoseologické důsledky. V druhém příkladě předpokládáme existenci škály (jednorozměrného kontinua) a volba otázek může pouze umožnit zařazení jedinců s větší nebo menší přesností (podobně jako např. čas lze udat pouze v hodinách, nebo v hodinách a minutách, nebo i ve vteřinách).

Naproti tomu v třetím případě zařazení jedince závisí na tom, které otázky byly pro škálování zvoleny. Protože všech myslitelných otázek (a jejich stylizací) je nekonečné množství, záleží v případech, kde nejde o jednorozměrné kontinuum, na libovůli výzkumníka, které otázky zvolil a jaký bude výsledek škálovací operace.

V uvedených zjednodušených příkladech bylo možno logickou analýzou lehce předpovědět, zda jde o jednorozměrné kontinuum. Ve třetím příkladě je na první pohled patrné, že jde o dvě skupiny otázek. Takové případy se však v praxi nevyskytují. Tak např. v prvém příkladě nebude možné prověřit předpoklad jednorozměrného kontinua jinak než vhodným předvýzkumem s velkým počtem otázek na malém počtu jedinců. V praxi ukáže předvýzkum větší či menší odchylky od ideálních případů v příkladech druhém a třetím; podle těchto odchylek je třeba rozhodnout, zda je škálování účelné. Pokud se předvýzkum vynechá, lze význam škály chápat pouze ve smyslu „subjektivní názor výzkumníka na postoj sledovaného jedince k práci, daný odpověďmi na tyto otázky...“

Jsou případy, kdy i takto volně definovaný znak najde své uplatnění; většinou je však jeho další formální zpracování a interpretace z gnoseologických důvodů velmi obtížné, až nemožné.

Někdy se na prvý pohled zdá, že lze prověření hypotézy o jednorozměrném kontinuu vynechat tam, kde konstrukce škály plyne z teoretických předpokladů, jestliže prověrka těchto předpokladů není součástí úkolu. I v tomto případě je takový postup často nebezpečný. Teoretické předpoklady se obvykle týkají základních principů, nikoli přesné stylizace vstupních znaků. Je třeba vždy prověřit, zda vstupní znaky tvoří jednorozměrné kontinuum právě v použité stylizaci (např. zda výsledek škálování nebude příliš závislý na tom, jak byly stylizovány některé otázky v dotazníku).

Operace škálování, provedená podle druhého příkladu, transformuje informaci beze ztráty; jinými slovy to lze vyjádřit takto: známe-li postavení určitého jedince ve škálovaném kontinuu, můžeme jednoznačně určit, jaké byly hodnoty vstupních znaků tohoto jedince. (Tak např. jestliže jedinec Karel vyřešil tři příklady a jeden nevyřešil, pak jistě vyřešil právě prvé tři příklady a nevyřešil čtvrtý.) Požadavek nulové ztráty informace je pro existenci jednorozměrného kontinua postačující, ale není nutný (tj. je příliš přísný). Nejobecnější teorie škálování, analýza latentní struktury, vychází z tohoto myšlenkového pokusu: předpokládejme, že 1) jedince populace lze zařadit do jednorozměrného kontinua; 2) vstupních znaků každého jedince je libovolný počet a každý z nich může být kvalitativní nebo kvantitativní; 3) podle pozice každého jedince v kontinuu lze určit, jaká je pravděpodobnost, že určitý vstupní znak nabyl určité hodnoty. Předpokládejme jako příklad škálovací operaci se vstupními znaky „výše měsíčního příjmu“ a „jedinec byl vyznamenán“ a s výstupním znakem „postoj k práci“.

Potom pro určitého jedince lze z jeho pozice v kontinuu „postoj k práci“ určit, že jeden ze vstupních znaků, měsíční příjem, je např. s pravděpodobností 80 % větší než 2000 Kčs a že byl tento jedinec s pravděpodobností např. 90 % vyznamenán.

(V některých případech lze dokonce předpokládat kontinuum vícerozměrné. Tak v třetím příkladě si čtenář, který zná základy analytické geometrie, lehce představí ke každému jedinci přiřazený bod roviny, jehož vzdálenost od osy [math]Y[/math] doleva odpovídá znalostem chemie a vzdálenost od osy [math]X[/math] nahoru odpovídá znalosti matematiky. Řešením vícerozměrného kontinua, jež je poměrně složité, se zde nebudeme zabývat.)

Ve skutečnosti, na rozdíl od uvedeného myšlenkového pokusu, známe hodnoty vstupních znaků a hledáme hodnotu znaku výstupního. Teorie latentní struktury (Lazarsfeld) ukazuje, jak lze v konkrétních případech prověřit existenci jednorozměrného kontinua a jak lze škálování provést. Tato teorie vhodným způsobem popisuje obecně problematiku škálování. Mnohé škálovací techniky lze chápat jako speciální případy teorie latentní struktury. Naproti tomu některé techniky, které sám Lazarsfeld navrhl pro realizaci své teorie, jsou pro naše poměry pravděpodobně poněkud složité. Dosud jsme hovořili o technikách škálujících vzhledem k jedinci. Výstupním znakem byl vždy údaj charakterizující určitého jedince. Existují i jiné techniky škálující vzhledem k určitému sledovanému jevu.

V dalším textu vysvětlíme na zjednodušených příkladech několik typických škálovacích technik; podrobnější popis, určený k použití, je uveden v literatuře.

Při technice párových srovnání (Thurstone) snažíme se např. určit postoj jedinců vůči náboženství. Nejprve sestavíme skupinu dotazů typu „Považujete náboženskou výchovu dětí za nutnou?“ apod. Dále vybereme skupinu soudců, předložíme jim různé dvojice navržených dotazů a vyzveme je, aby určili, který z dotazů v každé dvojici ukazuje na příznivější postoj k náboženství. Podle odpovědí soudců pak rozhodneme, které dotazy jsou nevhodné (a ty vyřadíme) a každému z ostatních dotazů přiřadíme určitou hodnotu znaku „Postoj k náboženství“ (např. velmi nepříznivému dotazu hodnotu —10, velmi příznivému hodnotu + 10). Vybrané dotazy předložíme jedincům vzorku (tj. všem vyšetřovaným jedincům) a pro každého jedince najdeme hodnotu znaku „Postoj k náboženství“, která se rovná průměru hodnot všech dotazů, na které tento jedinec odpověděl kladně.

Technika zdánlivě stejných intervalů (Thurstone) může řešit např. podobný úkol jako technika párových srovnání. Skupině soudců se však v tomto případě dá velký počet dotazů, a to spolu s výzvou, aby všechny dotazy rozdělili např. do devíti kategorií od dotazů náboženství nejpříznivějších až k dotazům náboženství nejnepříznivějším. Rozdělení mají soudci provést tak, aby rozdíly v postoji mezi dotazy v jednotlivých kategoriích byly (podle subjektivního hlediska soudce) přibližně stejné. Tato technika obsahuje návod k dalšímu postupu (vyřazení a hodnocení dotazů), podobný postupu v technice párových srovnání. Výsledkem je opět znak, hodnotící postoj jedince k náboženství.

Další technika, skalogramová analýza (Guttmann), odpovídá problému řešenému ve druhém příkladě (zjištění matematických znalostí pomocí čtyř zkušebních otázek). Otázky jsou předloženy malému vzorku jedinců a podle výsledku jsou otázky seřazeny podle obtížnosti. Někdy (jako v našem případě) lze např. říci: každý jedinec, který zodpověděl správně na x-tou otázku, odpověděl také správně na všechny otázky předchozí. V takovém případě hovoříme o perfektní škále. Jindy lze otázky sice srovnat do pořadí, ale u některých otázek a jedinců jsou patrné určité odchylky proti perfektní škále; tehdy hovoříme o přibližné škále. Konečně některé otázky nelze srovnat ani do přibližné škály, kontinuum je neškálovatelné.

Guttmann navrhl kritéria pro určení, které kontinuum je ještě škálovatelné a různé způsoby provedení škálovací operace (numerickou, mechanickou apod.). Skalogramovou analýzu lze provést i tam, kde na každou otázku může být několik různých odpovědí (např. naprosto souhlasím; spíše souhlasím; nemám vyhraněné stanovisko atd.). (Není snad třeba zdůrazňovat, že příklady jsou ilustrací metody a že skalogramovou analýzou by bylo možno sledovat i např. postoj k náboženství.)

Všechny popsané techniky užívají předvýzkumu, při kterém jsou, na podkladě výzkumu malé skupiny jedinců (tzv. soudců), navrženy vstupní znaky pro další etapy práce. V některých případech jsou soudcové vybráni náhodně z populace, v jiných případech vybírají se experti pro sledovanou problematiku. Rozdíl není pouze technický, nýbrž i gnoseologický.

Před volbou techniky je tedy třeba specifikovat obě uvedená hlediska: zda škála shrnuje informace vzhledem k jedinci nebo jevu a zda soudci jsou vybráni náhodně nebo jako experti. Historický vývoj škálování je obrazem podmínek, které škálování vyvolaly. Již prvé škálovací techniky vznikly jako reakce na některé obtíže tehdejšího sociologického výzkumu, a to zejména na nedostatek exaktnosti, nemožnost účelné redukce informací a vlivy subjektivního postoje výzkumníka. Tyto okolnosti vyvolaly nejprve konstrukci jednotlivých technik, později (ve 40. letech) i souhrnné analýzy problematiky škálování z hledisek formálních (zejména matematických) i meritorních (Lazarsfeld, Guttmann).

Zároveň rostl počet aplikací jednotlivých technik a tím i zkušeností s jejich použitím a celková metodickotechnická úroveň jejich zpracování. Mnohé výsledky technického rázu mohou být pro československou sociologii, po pečlivém studiu a kritickém zhodnocení, užitečné a mohou pomoci překonávat některé vážné nedostatky.

Současně s rozvojem škálovacích technik objevilo se, zejména v USA, přeceňování možností operace škálování. Vznikly dva mylné předpoklady: předně, že škálování je nutnou a nejdůležitější součástí každé sociologické výzkumné akce; za druhé, že vhodná škálovací technika sníží nebo vyloučí potřebu sociologické teorie a kvalitativního poznání sledované reality. U nás, naproti tomu, považujeme kvalitativní poznání reality za nutnou etapu, po které může, ale nemusí následovat etapa kvantitativní, která může obsahovat i škálování. Představu, že by jakákoli technika mohla vyloučit nebo oslabit potřebu teorie, považujeme za zcela chybnou.

Literatura: Coombs C. H., The Theory and Methods of Social Measurement, v: Festinger L., Katz D., Research Methods in Behavioral Sciences, New York, 1954; Gardner M., Lickert R., Public Opinion and Individual, New York, 1937; Goode W. J., Hatt P. K., Methods in Social Research, New York, 1952; Horst P. a kol., The Prediction of Personell Adjustment, Social Science Council, New York, 1941; König R., ed., Handbuch der empirischen Sozialforschung, sv. 1, Stuttgart, 1962; Lazarsfeld P., ed., Mathematical Thinking in the Social Sciences, Columbia University, The Free Press, Glencoe, 1954; Stouffer S., Guttmann L., Measurement and Prediction, Princeton University Press, Princeton—New Jersey, 1950; Šafář Z., Škálování, v: Metody a techniky sociologického výzkumu, Sborník referátů z rozhovoru 2. prosince 1965, Společnost pro šíření politických a vědeckých znalostí, Praha, 1965; Torgerson, Theory and Methods of Scaling, New York, 1958.

Přemysl Pergler

Viz též heslo škálování ve Velkém sociologickém slovníku (1996)