martes, 19 de marzo de 2019

Tema 4: Introducción a la estadística descriptiva

1.Diferencias entre Estadística Descriptiva e Inferencial

    ESTADÍSTICA INFERENCIAL: Utiliza muestras de datos para sacar conclusiones sobre poblaciones más grandes. Este tipo de método se encuentra más frecuentemente en artículos publicados sobre investigación científica. Infiere o “induce” leyes de comportamiento de una población, a partir del estudio del análisis de una muestra. Apoyándose en el cálculo de probabilidad y a partir de datos muestrales, efectúa:
  • Estimaciones
  • Decisiones
  • Predicciones
  • Generalizaciones sobre un conjunto mayor de datos
      
     ESTADÍSTICA DESCRIPTIVA: Sirve para describir y resumir datos. Se refiere al tipo de estadística que normalmente vemos en los medios de difusión. Describe y analiza una determinada población o muestra sin pretender sacar conclusiones de tipo general. Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Organiza de manera clara y fácil de analizar, resume los datos, explora las relaciones entre variables, es preliminar antes de la inferencia. 

2.Variables de la Estadística Descriptiva

      La manera más básica de presentar datos es mediante Tablas de frecuencia: datos que muestran frecuencia en columnas y categorías de las variables en filas. Además presentan información repetitiva de forma visible y comprensible. Presenta varios requisitos;
  • Son autoexplicativas.
  • Son sencillas y de fácil comprensión.
  • Tienen título, breve y claro.
  • Indican lugar, fecha y fuente de información.
  • Incluye las unidades de medida en cada cabecera.
  • Indican frecuencias absolutas y relativas.

Ejemplo: Tabla de frecuencia variable cualitativa ordinal.

Frecuencia de consumo habitual de verduras estudio multicéntrico hábitos de salud estudiantes de enfermería año 2017.
n=614
Fuente: Estudio multicéntrico hábitos de salud estudiantes de Enfermería .


3.Variables continuas. Tablas de frecuencia

Datos desagrupados de pesos en kg de niños atendidos en la consulta de niño sano. N=40
     En esta tabla están ordenados por orden de llegada, lo primero que debemos hacer para construir la tabla de frecuencia es ordenarlos de mayor a menor peso. Una vez que están ordenados, convierto esta variable en una variable ordinal, creo unos intervalos: 
  1. Definir los intervalos
  2. Definir los extremos de los intervalos
  3. Amplitud o distancia entre los extremos
  4. Cálculo de la marca de clase de cada intervalo
    Calculamos el recorrido o rango Re= xn-x1 =6,13,3= 2,8 (esto quiere decir que hay una diferencia de 2,8 kg entre el niño que pesa más y el que pesa menos). Cuando no se os dice nada de número de intervalos, se obtiene calculando la raíz cuadrada del número de datos observado (n=40). Veremos que la raíz cuadrada de 40 es igual a 6,32 por lo tanto tomaremos 6 intervalos. Como el recorrido es 2,8 si lo dividimos por el número de intervalos tendremos la amplitud de cada uno de ellos y así: 2,8/6= 0,46. Así calculamos la amplitud de cada intervalo.

Los tipos de frecuencia de datos agrupados son:
  • Frecuencias absolutas (𝒇𝒊): Número de individuos que presentan una modalidad, o que están incluidos en un intervalo.
  • Frecuencias relativas (𝒉𝒊):Proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo.
  • Frecuencias acumuladas ( 𝒇𝒊 ó 𝒉𝒊): Número de individuos menores o iguales que la modalidad o el intervalo que estamos estudiando.
4.Indicadores

      En el análisis descriptivo se usan en gran medida los números relativos, que son la expresión de la relación de dos o más cantidades. La frecuencia absoluta no puede ser un indicador pues le falta un denominador que la relacione con el tamaño de la muestra o población, y/o el periodo en el que se presentaron los eventos.

       Existen muchos indicadores elaborados en:
  • Instituto Nacional de Estadística (INE)
  • Instituto de Estadística de Andalucía (IEA)
  • Centro de Investigaciones Sociológicas (CIS)
     Se define indicador como la medida de la frecuencia de un determinado suceso en una población, expresado como un número que puede ser: proporción, tasa, razón y Odds. Los indicadores siempre están formados por un numerador y un denominador, es decir, es el resultado del cociente entre dos magnitudes.

4.1.Proporciones

     Se define como una medida resumen para variables cualitativas, que consiste en la comparación, a través de un cociente (división) entre un subconjunto y el conjunto al que pertenece.  
Ejemplo: proporción de personas que presentan una enfermedad;

      Características:     
  • El numerador siempre está incluido en el denominador.
  • Adopta valores reales entre 0 y 1, expresando la frecuencia relativa del suceso que medimos.
  • Se suele multiplicar por 100, para una mejor comprensión, expresando los porcentajes correspondientes.
  • Si el suceso que emdimos es muy poco frecuente, podemos multiplicar por 1.000, por 10.000, etc.

4.2.Tasas (RATE)

      Es una medida que expresa el riesgo de ocurrencia del evento (enfermedad) estudiado. En realidad es una proporción, pero con relación espacial y temporal. El denominador incluye una unidad de tiempo.

        Consiste en la comparación, a través de una división, entre el número de veces que ocurre un cierto tipo de evento y la población en la que puede ocurrir dicho evento en un tiempo determinado. Usualmente el resultado de tal división consiste en una cifra fraccionaria menor a 1, por lo que el resultado suele ser multiplicado por alguna constante que sea múltiplo de 10 (100, 1.000, 10.000, etc.)

       Medidas más empleadas en la estadística sanitaria:



4.3.Incidencias

       Número de nuevos casos de enfermedad que ocurren en un período específico de tiempo, en una población a riesgo de desarrollar la enfermedad. La incidencia mide cambio: de ausencia a presencia de enfermedad, de vivo a muerto, de no tener una característica a tenerla. La incidencia es una medida de riesgo.

      INCIDENCIA ACUMULADA: (proporción de incidencia): Se calcula utilizando un período de tiempo durante el cual consideramos que todos los individuos de la población están a riesgo de la enfermedad. Es la proporción de sujetos que desarrollan la enfermedad, en un período de tiempo, del total de población a riesgo al inicio del período. Mide el riesgo promedio de padecer la enfermedad (probabilidad de desarrollar la enfermedad). 

      Condiciones:
  • No puede haber pérdidas en el seguimiento.
  • Se siguen a todos los sujetos durante todo el período.
  • No permite inferir fuera del período de estudio.

      TASA DE INCIDENCIA: Con frecuencia, no todos los individuos a riesgo (denominador) son seguidos durante el mismo período de tiempo. Si se disponen de los diferentes tiempos de observación (“tiempos en riesgo”) de los diferentes individuos, se puede calcular la densidad de incidencia o tasa de incidencia.

     Es necesario especificar la unidad de tiempo a las que se refiere la tasa (personas–año; personas–mes, personas–semana, etc.). Una misma cantidad de personas-tiempo se puede obtener mediante el seguimiento de distintos grupos de población.

Ejemplo: “1000 personas-año” se pueden obtener siguiendo a 1000 personas durante un año, o siguiendo a 500 personas durante 2 años o siguiendo a 2000 personas durante 6 meses.

Se mide en unidades de tiempo(-1). No son proporciones, es una tasa instantánea. Expresa la “tasa” a la cual ocurren los eventos en sujetos de la población en riesgo en cualquier momento. Expresa velocidad: la tasa de cambio instantáneo o la rapidez con la que se desarrolla el evento en la población.

Tasa = datos agregados 
Densidad de incidencia = tasa obtenida de datos individuales.



4.4. Razones o RATIOS

        Es una medida de resumen para variables cualitativas que consiste en la comparación, a través de una división entre dos conjuntos.Los dos conjuntos son distintos, es decir, uno no incluye al otro. El numerador del cociente, por tanto, no está incluido en el denominador, como sí sucedía en las proporciones.

Ejemplo: La razón de sexos:

O =

  • En una empresa trabajan 1.200 hombres y 345 mujeres
  • La razón de sexos será de 1.200/345, es decir, 3,47 hombres por cada mujer, o 347 hombres por cada 100 mujeres

4.5.ODDS o Ventajas

      El cociente entre la proporción o probabilidad de ocurrencia de un evento y la proporción o probabilidad (complementaria) de no ocurrencia, se denomina con el término inglés “odds”, empleado en el lenguaje de apuestas.

Forma de cálculo:

No hay un término exacto en español, ni consenso en su traducción. El más aceptado es “ventaja” u “oportunidad”. La odds representa la frecuencia de un aspecto relativa a los sujetos que no presentan dicho aspecto, por lo que es un tipo especial de razón. Sus valores van desde 0 (eventos que nunca ocurren) hasta el infinito (eventos que ocurren siempre).

5.Medidas de asociación: Relaciones entre proporción, RATIOS, y ODDS

    La magnitud de asociación entre dos fenómenos (por ejemplo entre un factor de exposición y una enfermedad), puede estimarse a través de medidas que relacionen proporciones, tasas y odds. Es lo que se llaman “Medidas de asociación” y dependiendo del tipo de estudio, se usarán una u otra.
Las tres más importantes son:
  • Razón de prevalencias: Estudios descriptivos de corte transversal. Realiza una ratio entre dos prevalencias (proporciones).
  • Riesgo relativo o razón de riesgos: Estudios de observacionales de seguimiento o estudios experimentales. Realiza una ratio entre dos incidencias acumuladas (proporciones) o dos densidades de incidencia (tasas).
  • Odds ratio: Estudios de casos y controles. Realiza una ratio entre dos medidas “odds” o ventajas.

6.Estudio descriptivo: Razón de prevalencia

       Es la razón entre la proporción de enfermos en los expuestos y la proporción de enfermos entre los no expuestos. Cuantifica una estimación de la asociación entre el factor de exposición y la enfermedad. Si el valor se aproxima a 1, la enfermedad se distribuye por igual entre los expuestos y los no expuestos.



7.Estudio de seguimiento y experimentales: razón de incidencias, razón de riesgo relativo.

       Es la razón entre el riesgo en los expuestos y el riesgo en los no expuestos. Cuantifica el incremento en el riesgo producido por la exposición. Si el valor se aproxima a 1, la enfermedad o el suceso aparece de forma similar entre los expuestos y los no expuestos.

      Entonces la relación entre la incidencia (nuevos casos) en expuestos I.e y la incidencia (nuevos casos) en no expuestos I.ne, se puede expresar como: I.e / I.ne 


8.Estudios de casos y controles: ODDS, RATIO o Razón de ventajas



No hay comentarios:

Publicar un comentario