Analýza faktorová

analýza faktorová – (z něm. Faktor, to z lat. factor = činitel) – metoda lineární mnohorozměrné statistické analýzy, jejímž cílem je studium skryté struktury společných příčin ([math]F_1, F_2,\ \ldots , F_K[/math]) variability empir. měřených veličin [math]Y_1, Y_2,\ \ldots , Y_M[/math]. Používá se k odhalení latentních proměnných [math]F_k[/math], jež se podílejí na vzniku manifestních proměnných [math]Y_m[/math], a jejich vzájemných korelací, k odhadu hodnot těchto redukci informace pro účely popisu souboru, ke grafickému vyjádření vztahů mezi proměnnými a ke klasifikačním účelům (klasifikace proměnných i jednotek). A.f. vychází z lineárního modelu: [math]Y_m = \Sigma_k a_{mk}F_k + E_m[/math] (maticově [math]Y = AF + \epsilon[/math]), v němž [math]a_{mk}[/math] = faktorové zátěže nebo faktorové koeficienty – vyjadřují intenzitu vztahu a převodní vztah mezi jednotlivými faktory (ve standardizované formě) a manifestními proměnnými. Jsou-li [math]F_k[/math] vzájemně nezávislé, [math]a_{mk}[/math] jsou koeficienty korelace mezi [math]F_k[/math] a [math]Y_m[/math]; [math]\epsilon_m[/math] obsahují náhodovou a specif. složku hodnot [math]Y_m[/math]; [math]\epsilon_m[/math] jsou nezávislé na faktorech a mezi sebou navzájem. Podíl faktorů na vysvětlení variance [math]Y_m[/math] se nazývá komunalita. Zbytek se skládá ze specificity (podíl specif. variability nezávislé na faktorech) a nespolehlivosti (podíl měřící chyby [math]Y_m[/math]). Matice korelací mezi proměnnými a faktory se nazývá faktorovou strukturou. K přijetí modelu patří rozhodnutí mezi předpokladem nezávislosti faktorů a určením stupně korelovanosti mezi faktory. Statist. úlohou je konkretizace modelu, tj. faktorů, které dostatečně přesně reprodukují korelační (resp. kovarianční) vztahy mezi manifestními proměnnými. Model a.f. nemá jednoznačné řešení a předpokládá volbu dodatečného kritéria.

Postup a.f. spočívá: 1. v extrakci faktorů včetně určení jejich počtu, přičemž mezi nejběžnější metody patří: a) metoda hlavních komponent, která vychází z postupného vyčlenění vzájemně nezávislých faktorů, z nichž každý vysvětluje maximum předešlými faktory nevysvětlené variability, b) metoda hlavních faktorů, která je podobná předešlé, vychází však z předběžného odhadu komunality, c) metoda maximální věrohodnosti, vycházející z předpokladu normality, jejíž parametry odhaduje, d) metoda min. reziduí, která postupně minimalizuje rozdíl mezi předchozími faktory nevyčerpanou korelací manifestních proměnných a vlivem následujícího extrahovaného faktoru; počet faktorů se určuje statist. testy, podle hodnot charakteristických čísel (Kaiserovo pravidlo), podle procenta vyčerpané variability nebo interpretabilitou a smysluplností faktorů; 2. v rotaci, tj. výběru vhodného řešení z množiny všech faktorových řešení – v případě, že extrahované faktory interpretaci nevyhovují. Používané postupy: a) hledání shody s hypotetickým předpokladem, resp. apriorním kritériem (kriteriální rotace), b) hledání prosté struktury matice faktorových zátěží – každý faktor ovlivňuje co nejvíce proměnných, každá proměnná je závislá na co nejmenším počtu faktorů (L. L. Thurstone), přičemž druhý požadavek se někdy vynechává (R. B. Cattell); pro dosažení nezávislých orthogonálních faktorů jsou známy metody VARIMAX, QUARTIMAX, EQUIMAX atd., pro získání závislých (šikmých) faktorů jsou to metody OBLIMIN, BIQUARTIMIN, PROMAX atd., c) optické rotování k interpretovatelnému řešení, d) konfaktorová rotace (Cattell) – hledání společného řešení ze dvou, resp. více datových souborů na základě předpokladu, že v nich působí stejné faktory, e) faktorová syntéza (Tucker) – hledání vzájemně nejbližších řešení ve dvou souborech; 3. v odhadu hodnot faktorů pro jednotlivé případy (přímé určování v metodě hlavních komponent a odhadové postupy). Výstupem a.f. je dále transformační matice mezi extrahovaným a výsledným řešením, korelační matice faktorů, grafické znázornění vztahů mezi proměnnými i jejich vztahů k faktorům.

A.f. se používá také pro grafické a numerické vyjádření vztahů mezi případy datového souboru – Q-technika (na rozdíl od R-techniky pro faktorizaci proměnných) vychází z korelační matice případů (jsou-li všechny proměnné měřeny na společné stupnici). Šikmé faktory [math]F_1, F_2,\ \ldots ,F_K[/math] mohou být opět modelovány a.f. Výsledkem jsou faktory druhé řádu (a podobně třetího a dalšího), jejich interpretace je však mimořádně složitá. A.f. vychází paralelně i z dalších (ekvivalentních) modelů, např. geometrického, z metody parciálních korelací. Má vztah k dalším metodologiím, např. k teorii měření. Techniky vyvinuté v a.f. se využívají v dalších postupech, např. v mnohorozměrném škálování. Velký význam pro další aplikace mají v a.f. vyvinuté identity triadová a tetradová. A.f. vznikla hist. jako psychometrický model v teoriích schopností a chování člověka a z toho tradičně vychází i její výklad (význam modelu je však podstatně širší); je spojena se jmény Ch. Spearmana, C. Burta, T. L. Kellyho, G. H. Thompsona, L. L. Thurstona a mnoha dalších.

factor analysis analyse factorielle Faktorenanalyse analisi fattoriale

Literatura: Enslein, K. – Ralston, A. – Wilf, H. S. eds.: Statistical Methods for Digital Computers. New York 1977; Harman, H. H.: Modern Factor Analysis. Chicago 1967; Horst, P.: Factor Analysis of Data Matrices. New York 1965; Jöreskog, K. G.: Statistical Estimation in Factor Analysis. Stockholm 1962; Thurstone, L. L.: Multiple Factor Analysis. Chicago 1947.

Jan Řehák

Viz též heslo analýza faktorová v historickém Malém sociologickém slovníku (1970)