Handbook of Parametric and Nonparametric Statistical Procedures, 4th Edition
"Quien mucho abarca poco aprieta" dice un antiguo y conocido refrán. Sin embargo, parece que éste no aplicara al libro al que me referiré en esta reseña. Y es que se trata probablemente de uno de los libros con mayor contenido sobre procedimientos estadísticos –en un solo volumen– que se puede encontrar en la literatura. Desde su primera edición, en 1997, ha marcado un sello propio dentro de los manuales de Estadística y ha ido incorporando más procedimientos en sus sucesivas ediciones (la última hasta ahora es la quinta, de 2011).
Partiendo por sus características físicas (1736 páginas, 2 kilógramos y 2800 cm cúbicos), su extensión, que en principio puede parecer exagerada, es totalmente acorde (y muy justificada) con su contenido. En el primer capítulo Introducción trata los tópicos clásicos de cualquier texto de Estadística, como son las variables y sus escalas de medición, estadística descriptiva, medidas de resumen, estimación de parámetros, pruebas de hipótesis y diseños, por mencionar los más importantes. En cada uno de ellos entrega una visión general de la terminología, los conceptos y los métodos más empleados.
Luego del capítulo introductorio vienen los contenidos por los cuales este libro tiene su real valor. Primero hay un esquema general de los distintos procedimientos estadísticos incluidos, separados según si se trata de una muestra, dos o más muestras –independientes o dependientes–, medidas de asociación o correlación, etc., además de especificar en cada caso la escala de medición de las variables bajo análisis.
En esta misma línea, continúa con una guía y unas "tablas de decisión" (Decision Tables) para seleccionar el procedimiento adecuado, donde, para cada caso mencionado en el párrafo anterior, se indican los procedimientos que podrían ser aplicables para el análisis. Los procedimientos y tests se identifican con números asignados por el autor –y letras para indicar procedimientos de una misma "familia", cuando corresponda–, lo que facilita enormemente la búsqueda. Así, se presentan cuatro tablas: para métodos empleados con variables de intervalo/razón (Tabla I.16), ordinales/de rangos ordenados (Tabla I.17), categóricas/nominales (Tabla I.18) y para medidas de asociación/correlación (Tabla I.19).
Para ilustrar el esquema de los contenidos de esta obra usaré como ejemplo el capítulo Inferential Statistical Tests Employed with Two Independent Samples (and Related Measures of Association/Correlation), dentro del cual se incluyen los siguientes subcapítulos:
- Test 11: The t Test for Two Independent Samples
- Test 12: The Mann-Whitney U Test
- Test 13: The Kolmogorov-Smirnov Test for Two Independent Samples
- Test 14: The Siegel-Tukey Test for Equal Variability
- Test 15: The Moses Test for Equal Variability
- Test 16: The Chi-Square Test for r x c Tables (Test 16a: The Chi-Square Test for Homogeneity; Test 16b: The Chi-Square Test of Independence (employed with a single sample))
Dentro de cada subcapítulo se incluyen las siguientes secciones:
- I. Hypothesis Evaluated with Test and Relevant Background Information: Se entrega la hipótesis a evaluar mediante el test a modo de pregunta, por ejemplo: ¿dos muestras independientes representan a dos poblaciones con diferentes valores de media? Luego se describen las condiciones y supuestos del método, indicando las situaciones distintas en las que otros métodos son aplicables, señalando el nombre y número de cada uno de esos otros tests para buscarlos dentro del libro.
- II. Example: Se entrega el enunciado de un problema de investigación y los datos a analizar.
- III. Null versus Alternative Hypotheses: Se plantean las hipótesis estadísticas involucradas en el problema, siguiendo lo que el autor llama "modelo clásico de test de hipótesis", que es esa especie de hibridación entre los modelos de Fisher y de Neyman-Pearson. En el primer capítulo el autor incluye un apartado en donde entrega una visión histórica y crítica de este modelo y justifica por qué adhiere a él en el libro.
- IV. Test Computations: Se entregan de una manera muy detallada los procedimientos de cálculo para aplicar el método al problema planteado en II. El hecho de que los ejemplos consistan en conjuntos pequeños de datos constituye, en mi opinión, una fortaleza del texto para aquellas lectoras y lectores interesados en saber el detalle de dichos procedimientos.
- V. Interpretation of the Test Results: Se entrega una completa interpretación de los resultados al problema analizado, incluyendo las hipótesis alternativas uni y bidireccionales según sea el caso.
- VI. Additional Analytical Procedures for the Test: La extensión de esta sección es bastante variable ya que se describen casos particulares (por ejemplo, cuando la hipótesis nula o de nulidad establece un valor distinto de cero) o tests complementarios (por ejemplo, para verificar el supuesto de igualdad de varianzas), con el detalle de cálculos, interpretación y discusión. En particular, para el Test 11 se incluyen: Test 11a: Fmax de Hartley de homogeneidad de varianza / F para varianzas de dos poblaciones; Test 11b: índice de Cohen; Test 11c: Omega cuadrado; Test 11d: Eta cuadrado; y Test 11e: z para dos muestras independientes.
- VII. Additional Discussion of the Test: Se discuten otros aspectos metodológicos relacionados con el test, como robustez, presencia de datos faltantes o extremos, etc., incluyendo numerosas referencias y ejemplos adicionales, cálculos e interpretaciones.
- VIII. Additional Examples Illustrating the Use of the Test: Se entregan ejemplos adicionales de aplicación del test con resultados e interpretaciones, obviando los detalles de cálculo.
- References: Dada la abundante discusión de resultados, así como el contraste de aportes y opiniones de distintos autores y aspectos generales de la historia de cómo se desarrollaron los métodos, esta sección es también de considerable extensión y es una muy buena fuente de información para quien quiera profundizar.
- Endnotes: A lo largo de cada sección se insertan una serie de referencias numéricas correspondientes a notas al final del capítulo. Éstas explican diversos detalles adicionales, tanto de cálculo, fórmulas, definiciones, etc., a modo de información anexa al texto principal.
Con tal extensión de las secciones, no es extraño que haya subcapítulos con más de 100 páginas sólo para tratar un test. Cabe mencionar además que en esta cuarta edición se agregó un capítulo de métodos multivariantes (con salidas de SPSS), que incluye ocho subcapítulos de distintos procedimientos de análisis, entre los que se cuentan modelos de regresión lineal y logística múltiple, T cuadrada de Hotelling, MANOVA, MANCOVA, análisis discriminante, correlación canónica, análisis de componentes principales y análisis factorial, además de un repaso de álgebra matricial. En total, el libro presenta, analiza y discute un total de 162 procedimientos estadísticos.
En conclusión, éste es un libro que yo recomiendo para quienes requieren aplicar métodos estadísticos y deben tomar la decisión de evaluar la estrategia de análisis más adecuada a su problema. También es una muy buena fuente de ejercicios y discusión de métodos para quienes hacemos clases de Estadística con métodos inferenciales.
Mauricio Fuentes Alburquenque
Programa de Bioestadística, Escuela de Salud Pública