domingo, 5 de mayo de 2019

Tema11: Pruebas no paramétricas.

1. CHI CUADRADO
El test de Chi-cuadrado se utiliza para hacer análisis bivariados. Esas dos variables deben ser cualitativas ambas. 
  • Para comparar dos variables cualitativas.
  • Razonamiento a seguir: suponemos que la hipótesis nula es cierta y estudiamos cómo es de probable que siendo iguales los dos grupos a comparar se obtengan resultados como los obtenidos o haber encontrado diferencias más grandes por grupos.
Para ello, vamos a utilizar el método de tablas de contingencia que es el método con el que expresamos las frecuencias absolutas en una tabla.
  • Se emplean para registrar y analizar la asociación entre dos o más variables de naturaleza cualitativa (nominales y ordinales)
  • Veamos: tabla de contingencia general para la comparación de dos variables dicotómicas. En las filas situamos la variable independiente y en las columnas las dependientes.

2. Prueba chi-cuadrado
La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:
  • Es debida al azar: Recordemos que la Ho establece que no hay diferencia, es decir, que hay igualdad. Aceptamos la Ho.
  • Es debida a algo más, por ejemplo una asociación entre las variables que estudiamos: Rechazamos la H0. Aceptamos la H1
Condiciones para aplicar chi-cuadrado:
  • Las observaciones deben ser independientes: es decir, al clasificar los sujetos en cada casilla, debe haber sujetos distintos; no puede haber sujetos repetidos en más de una casilla. Ni los sujetos se pueden clasificar en más de un lugar.
  • Utilizar en variables cualitativas nominales u ordinales
  • Más de 50 casos, deben ser tamaños muestrales importantes.
  • Las frecuencias teóricas o esperadas en cada casilla de clasificación ni deben ser inferiores a 5. Si son menores a 5, no podemos sacar conclusiones del contraste de hipótesis con Chicuadrado. Algunos autores señalan como tolerable que un 20% de las casillas tengan una frecuencia teórica inferior a 5, pero no deben ser muy inferiores. 

  • Si no se cumplen los requisitos. Se usan pruebas paramétricas:
  1. Utilizar el estadístico de Fisher
  2. Corrección de continuidad de Yates: Actualmente discutido por autores y se puede no tener en cuenta. Conviene mencionarla porque responde a una práctica muy generalizada y figura en muchos textos.
Para realizar esta prueba debemos recordar los siguientes conceptos:
  • La frecuencia observada es la que recogen los datos.
  • La frecuencia esperada es la que observaríamos si no hubiera relación. Lo que sucedería en la tabla si la hipótesis nula se cumpliera.
  • Grados de libertad: número de valores o datos que pueden variar libremente dado un determinado resultado. Grados de libertad= (filas-1) x (columnas-1). En nuestro caso planteado, el grado de libertad es 1.
Esta prueba permite determinar si dos variables cualitativas están o no asociadas. Para su cómputo, calculamos:
  • Frecuencia esperada (FE): aquellas que deberían haberse observado si la HO fuese cierta y si ambas variables fueran independientes.
  • Frecuencias observadas (FO): en nuestro estudio
Las comparamos para calcular el valor del estadístico chi-cuadrado (X2):

Cuanto mayor sea la diferencia (y, por tanto, el valor del estadístico), mayor es la asociación/dependencia entre ambas variables. Por otra parte, como las diferencias entre las frecuencias observadas y esperadas están elevadas al cuadrado, esto hace que el valor de 𝑋2 siempre sea positivo.

Para obtener los valores esperados, éstos se calculan a través del producto de los valores totales marginales dividido por el número total de casos (n). Para el caso más sencillo de una tabla 2x2. 


3. ODDS RATIO
Permite cuantificar la importancia/fuerza de la asociación entre dos variables. Puede acompañar al resultado de la prueba chi-cuadrado (en variables dicotómicas). ¿Recordamos la odds? Frecuencia expuestos/frecuencia no expuestos (casos y controles). Odds ratio sería el cociente entre la odds del grupo de individuos de la categoría 1 de la variable supuestamente dependiente (variable 2) (a/c), frente a la odds del otro grupo formado por los individuos de la categoría 2 de esa misma variable (b/d).
Características:
  • No tiene dimensiones.
  • El rango va de 0 a ∞
  • OR=1 indica que no hay asociación (independencia)
  • OR>1 la presencia del factor de exposición (V1.1) se asocia a mayor ocurrencia del evento (V2.1)
  • OR<1 la presencia del factor de exposición (V1.1) se asocia a menor ocurrencia del evento (V2.1)
Si se da el caso que las frecuencias esperadas sean pequeñas o menores de 5… no se puede utilizar el estadístico Chi cuadrado: ¿Qué hacemos?
  1. Reagrupar los valores de las categorías
  2. Utilizar:
  • Prueba exacta de Fisher
  • Corrección de Yates

No hay comentarios:

Publicar un comentario