Koeficienty pořadové korelace

koeficienty pořadové korelace1.Ch. E. Spearmanovo [math]\rho [/math]: charakterizuje souběžnost pořadí hodnot dvou proměnných [math]X[/math] a [math]Y[/math] a měří stupeň jejich shody, resp. neshody ([math]\rho = 1 - 6\Sigma d_i^2/(n^3-n)[/math], [math]d_i[/math] je rozdíl pořadí [math]X[/math] a [math]Y[/math][math]i[/math]-tého objektu). Lze jej též získat tak, že aplikujeme koeficient lineární korelace na pořadí hodnot obou proměnných – vyjadřuje stupeň monotónní statistické závislosti obou proměnných. Nabývá hodnot v intervalu [math][-1,+1][/math]; [math]\rho = 1[/math] znamená úplnou shodu obou pořadí (ryze monotónní rostoucí vztah hodnot); [math]\rho = -1[/math] znamená úplnou inverzi obou pořadí (ryze monotónní klesající vztah hodnot); [math]\rho = 0[/math] odpovídá stavu pořadové (monotónní) nekorelovanosti; obě pořadí jsou k sobě v náhodném poměru; 2. Kendallovo [math]\tau [/math] Kendalův koeficient korelace: má obdobné vlastnosti jako Spearmanovo [math]\rho [/math]. Vychází ze vztahů všech dvojic objektů, u nichž definujeme shodu, jsou-li u jednoho objektu obě hodnoty [math]X[/math] i [math]Y[/math] vyšší než u druhého, a neshodu, je-li jedna proměnná vyšší u jednoho a druhá u druhého objektu; je-li [math]S[/math] = počet shod mezi všemi dvojicemi, [math]I[/math] = počet neshod, je [math]\tau = 2(S-I)/(n(n-1))[/math]; 3. Danielsův (koeficient obecné korelace): [math]\Gamma = \Sigma \Sigma a_{ij} b_{ij} / \Sigma a_{ij}^2 \Sigma b_{ij}^2[/math]; [math]a_{ij}[/math] ([math]b_{ij}[/math]) jsou skóry přiřazené dvojicím objektů tak, že [math]a_{ij} = -a_{ji}[/math] jsou přiřazeny proměnné [math]X[/math], [math]b_{ij} = -b_{ji}[/math] proměnné [math]Y[/math]. Spec. případy: [math]a_{ij} = -b_{ij}[/math] = rozdíl pořadí pro [math]X(Y)[/math] vede na Spearmanovo [math]\rho [/math]; [math]a_{ij} = -1, 0, +1[/math] pro [math]X_i \lt X_j, X_i = X_j, X_i \gt X_j[/math] a obdobně pro [math]b_{ij}[/math], dává Kendallovo [math]\tau [/math]; [math]a_{ij}[/math] = [math]X_i - X_j[/math], [math]b_{ij}[/math] = [math]Y_i - Y_j[/math] vede na Pearsonův koeficient lineární korelace (rovná se 1, když všechna [math]a_{ij}[/math] jsou úměrná k [math]b_{ij}[/math] s kladnou konstantou úměrnosti, −1, když úplná úměra je dána zápornou konstantou); 4. míry odvozené z neparametrické korelace, používané pro kontigenční tabulky. Jsou to adaptace [math]\rho[/math], [math]\tau [/math], Goodmannovo – Kruskalovo [math]\gamma [/math] = [math](S-I)/(S+I)[/math], Somersovo [math]d[/math] pro asymetrický vztah (obdoba regresního koeficientu), [math]d_{Y/X}=(S-I)/(S+I+T)[/math]; [math]T[/math] je počet dvojic, u kterých nastalo spojení (shodná hodnota) pouze u [math]Y[/math]. Uvedené vzorce pro [math]\rho [/math] a [math]\tau [/math] jsou složitější v případě, že u [math]X[/math] nebo [math]Y[/math] se vyskytují stejné hodnoty, které mají stejné (spojené) pořadí.

rank correlation coefficients coefficients de corrélation des rangs Rangkorrelationskoeffizient coefficienti di correlazione per ranghi

Literatura: Goodman, L. A.Kruskal, W. H.: Measures of Association for Cross Classification I–IV. Journal of the American Statistical Association, 49, 54, 58, 67, 1972; Kendall, M. G.: Rank Correlation Methods. London 1970; Siegel, S.: Nonparametric Statistics for the Behavioral Sciences. New York 1956; viz též koeficienty statistické.

Jan Řehák