Pruebas de bondad de ajuste y pruebas no parametricas
- 1. Estadística Inferencial I Unidad 4 Página 1 PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMETRICAS
- 2. Estadística Inferencial I Unidad 4 Página 2 4.1 BONDAD DE AJUSTE Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se puede ajustar o afirmar que proviene de una determinada distribución. Las pruebas básicas que pueden aplicarse son: la ji-cuadrada y la prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que en estadística se denominan pruebas de “Bondad de Ajuste” y miden, como el nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están basadas en la hipótesis nula de que no hay diferencias significativas entre la distribución muestral y la teórica, H0 es la distribución que se supone sigue la muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Hablamos de bondad de ajuste cuando tratamos de comparar una distribución de frecuencia observada con los valores correspondientes de una distribución esperada o teórica. Algunos estudios producen resultados sobre los que no podemos afirmar que se contribuyen normalmente, es decir con forma acampanada concentradas sobre la media. Su fórmula es la siguiente: 𝑓𝑜𝑖= Valor observado en la i-ésimo dato. 𝑓𝑒𝑖= Valor esperado en la i-ésimo dato. 𝑘 = Categorías o celdas. 𝑚 = Parámetros estimados sobre la base de los datos de la muestra Los grados de libertad vienen dados por: gl= K-m-1. k i e eo i ii f ff 1 2 2
- 3. Estadística Inferencial I Unidad 4 Página 3 Criterio de decisión es el siguiente: Se rechaza H0 cuando 2 1; 2 mKt . En caso contrario se acepta. Donde t representa el valor proporcionado por las tablas, según el nivel de significación elegido. Cuanto más se aproxima a cero el valor de chi-cuadrada, más ajustadas están ambas distribuciones.
- 4. Estadística Inferencial I Unidad 4 Página 4 4.1.1 ANALISIS JI-CUADRADA Es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medidas las diferencias existentes entre ambas se deben al azar en el contraste de la hipótesis. Esta prueba se basa en la hipótesis nula H0 de que no hay diferencias significativas entre la distribución muestral y la teórica. La estructura básica de la prueba para la bondad de ajuste se muestra en la siguiente tabla: Clases Frecuencia observada Frecuencia esperada 1 Foi1 Fe1 2 Foi2 Fe2 . . . . . . k Foik Fek Total n n Donde para calcular la Frecuencia esperada se tiene: 𝜒2 = ( 𝑓𝑜𝑖 − 𝑓𝑒𝑖)2 𝑓𝑒𝑖 Fórmula para el análisis de ji-cuadrada 𝜒2 = ∑ ( 𝑓𝑜𝑖−𝑓𝑒𝑖)2 𝑓𝑒𝑖 𝑘 𝑖−1 Interpretación: cuanto mayor sea el valor de ji-cuadrada menos creíble es la hipótesis nula H0. De la misma forma, cuanto más se aproximan acero el valor de 𝜒2 , más ajustadas están las distribuciones. 𝜒2 = 0 H0 se acepta 𝜒2 > 0 H0 se rechaza 𝑓𝑜𝑖 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑓𝑒𝑖 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑘 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑒𝑠𝑡𝑢𝑑𝑖𝑜
- 5. Estadística Inferencial I Unidad 4 Página 5 4.1.2 PRUEBA DE INDEPENDENCIA La prueba de independencia trata de la comparación de dos situaciones en las cuales podemos esperar que sean dependientes o independientes, esto quiere decir que, pueden o no estar relacionados sus datos debido a muchos factores que pueden influir en ellos, o bien, un problema no tenga relación con otro. Su objetivo es determinar si alguna situación es afectada por otra, basándose en datos estadísticos y valores probabilístico obtenidos de la fabulación de datos o de pronósticos por medio de formulas y tablas, para esto se basa en un nivel de significancia en un caso y en el otro a comparar, valiéndonos de tablas de contingencia para obtener frecuencias esperadas y poder aplicarlas, para así obtener datos comparativos que son determinantes en la decisión de independencia. Para todas las pruebas de independencia, las hipótesis son: H0: las dos variables de clasificación son independientes. H1: las dos variables de clasificación son dependientes. Los métodos para poner a prueba H0 contra H1 son idénticos a los usados para poner a prueba las diferencias entre proporciones poblacionales basados en la prueba de 𝝌2. De nuevo compararemos las frecuencias observadas con las esperadas, las obtenidas bajo el supuesto de que H0, para determinar que tan grande debe ser el alejamiento permitido para que la hipótesis de independencia pueda rechazarse. Si el valor del estadístico de prueba 𝝌2 es mayor o igual que el valor critico calculado, ya no podremos suponer que pueda resultar de dos variables de clasificación independientes, siendo esta la razón de que todas las pruebas de 𝝌2 sobre independencia sean de cola derecha.
No hay comentarios:
Publicar un comentario