martes, 27 de noviembre de 2018

  •   

 Prueba de hipotesis para proporciones Est ind clase02

  1. 1. PRUEBA DE HIPOTESIS II ESTADISTICA INDUSTRIAL Ing. William León Velásquez TEMA 02
  2. 2. PRUEBA DE HIPOTESIS PARA PROPORCIONE S Error tipo II Ing William León Velásquez 2
  3. 3. CONTENIDO  PRUEBA DE HIPÓTESIS PARA UNA PROPORCION  PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES  ERROR TIPO II Ing William León Velásquez 3
  4. 4. PRUEBA PARA UNA PROPORCIÓN 4
  5. 5. PRUEBA PARA UNA PROPORCIÓN  Las pruebas de hipótesis con proporciones son necesarias en muchas áreas del conocimiento y en especial en la administración e ingeniería. 5  Se probará que la hipótesis nula es: p = p0  p es el parámetro de la distribución binomial.  po es el valor poblacional • Se considerará el problema de probar la hipótesis de que la proporción de éxito en un experimento binomial sea igual a un cierto valor especifico. Ing William León Velásquez
  6. 6. 6  La información que frecuentemente se utilizará para la estimación de una proporción real o verdadera (porcentaje o probabilidad) es una proporción muestral.  Que se calcula de la siguiente manera PRUEBA PARA UNA PROPORCIÓN Donde: x es el número de veces que ha ocurrido un evento en n ensayos. 𝑝 = 𝑥 𝑛 Ing William León Velásquez
  7. 7. 7 Ejemplo,  Si una muestra aleatoria de 500 compras realizadas en una tienda, 200 se realizan con tarjeta de crédito. PRUEBA PARA UNA PROPORCIÓN  Entonces se puede utilizar esa cifra como estimación puntual de la proporción real de compras realizadas en ese negocio que se abonaron a tarjetas de crédito. 𝑝 = 200 500 Ing William León Velásquez
  8. 8. 8 Las hipótesis serán: La hipótesis nula será lo siguiente: p=po  La hipótesis alterna puede ser una de las alternativas usuales: unilateral o bilateral  Tales como: 000 ..,.., ppopppp  PRUEBA PARA UNA PROPORCIÓN Ing William León Velásquez
  9. 9. 9  Un valor Zc calculado a partir de la muestra se compara con un valor critico de Z dados en las tablas.  Zc se obtiene así:  O también se puede utilizar: n qp ppZc .   npq npxZc  PRUEBA PARA UNA PROPORCIÓN Ing William León Velásquez
  10. 10. EJEMPLOS PARA PROBAR UNA PROPORCIÓN 10 Un político esta interesado en conocer si ha habido un aumento en la proporción (porcentaje) de votantes que lo favorecen en las próximas elecciones; Un productor de cereales puede querer conocer si ha ocurrido o no una baja en la proporción de clientes que prefieren su marca de cereal; Un hospital desea confirmar la afirmación de un fabricante de medicamentos quien indica que su producto cura al 80% de los usuarios. Ing William León Velásquez • El procedimiento para probar una proporción en una población normal es similar al usado para las medias.
  11. 11. 11 MÉTODOS PARA PROBAR UNA PROPORCIÓN Para probar una proporción De la región de rechazo Por el valor de p Ing William León Velásquez
  12. 12. A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) 12 Paso 1 Establecer las hipótesis. Sea po es la proporción admitida o requerida. Ho :p = po H1 : p > po ó p < po ó p ≠ po Ing William León Velásquez
  13. 13. 13 Paso 2  Con el nivel de significancia (α) se dibuja la región de rechazo en la curva normal estándar (curva z) indicando el valor de Z proveniente de la tabla Z.  Z α ó α/2 A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) H1: p > po H1: p < po H1: p ≠ po Ing William León Velásquez
  14. 14. 14 Paso 3  Indicar el valor de Zc en el diagrama de la región de rechazo (Paso 2). Zc A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) H1: p > po H1: p < po H1: p ≠ po Ing William León Velásquez
  15. 15. 15 Paso 4  Calcular el valor zc para la proporción muestral usando la fórmula n pp p )1( 00  A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) 𝑝 = 𝑥 𝑛 𝑧 𝑐 𝑝 − 𝑝0 𝜎 𝑝 Ing William León Velásquez
  16. 16. 16 Paso 5  Si el valor Zc cae dentro de la región de rechazo (sombreada), entonces se rechaza Ho. Si cae fuera de la región sombreada, entonces no se rechaza la Ho. Escriba la conclusión de la prueba en términos de la Ha A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  17. 17. 17 Ejemplo :  Se desea probar si a habido una variación en la proporción de 0.4 de mujeres en las carreras de ingeniería.  En el ultimo examen de admisión realizado se selecciona una muestra de 200 ingresantes y se obtiene una proporción de mujeres de 0.45. A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) • Utilice un nivel de significancia del 0.01 𝑝 = 0.45, n = 200, y α= 0.01. Ing William León Velásquez
  18. 18. 18 A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1)  Solución: Paso 1 • H0 : p = 0.4 La proporción de mujeres en las carreras de ingeniería es de 0.4 • H1 : p ≠ 0.4 La proporción de mujeres en las carreras de ingeniería es diferente de 0.4 Ing William León Velásquez
  19. 19. 19 Paso 2  Usando α= .01,  como es de dos colas α/2= 0.005 Entonces Z= -2.575 A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  20. 20. 20 Paso 2  Usando α= .01,  Z= -2.575 y como es de colas el otro Z= 2.575  Entonces el diagrama de la región de rechazo es: .005.005 -2.575 2.575 A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  21. 21. 21 Paso 3  Calculando el valor z para la proporción muestral 𝑝 = 0.45, po=0.4  obtenemos:   Z= 0346.0 200 )4.01(4.0 p 45.1 0346.0 4.045.0  A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  22. 22. 22 Paso 4  Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos: .005.005 -2.575 2.575 1.45 A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  23. 23. 23 Paso 5  Como el valor z está fuera de la región de rechazo (sombreada),  Por lo tanto no se rechaza Ho.  Conclusión:  La proporción de mujeres en las carreras de ingeniería no es diferente de 0.4. A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Ing William León Velásquez
  24. 24. B. MÉTODO DEL VALOR P (MÉTODO 2) 24  Sea po es la proporción admitida o requerida.  Paso 1 Se establece las hipótesis: H0 : p = p0 H1 : p > p0 ó p < p0 ó p ≠ p0 Ing William León Velásquez
  25. 25. Paso 2  Calcular el valor de Zc para la proporción muestral usando la fórmula: donde 25 n pp p )1( 00  B. MÉTODO DEL VALOR P (MÉTODO 2) 𝑧 𝑐 𝑝 − 𝑝0 𝜎 𝑝 𝑝 = 𝑥 𝑛 Ing William León Velásquez
  26. 26. 26 Paso 3  Utilizando la hipótesis alternativa dibujar la región bajo la curva z que representa los valores extremos y con el valor de Zc. Ir a la tabla y encontrar el valor de p Zc p o p/2 B. MÉTODO DEL VALOR P (MÉTODO 2) H1: p > po H1: p < po H1: p ≠ po Ing William León Velásquez
  27. 27. 27 Paso 4 El valor p = al área de la cola sombreada (s) en el Paso 3. B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  28. 28. 28 Paso 5  Si el valor p< α, entonces se rechaza H0  Si el valor p >= α, entonces no se rechaza H0.  Escribir la conclusión de la prueba, en términos de la Ha B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  29. 29. 29 B. MÉTODO DEL VALOR P (MÉTODO 2) Ejemplo :  Se desea probar si a habido una variación en la proporción de 0.4 de mujeres en las carreras de ingeniería.  Se selecciona una muestra de 200 ingresantes y se obtiene una proporción de mujeres de 0.45.  Utilice un nivel de significancia del 0.01 𝑝 = 0.45, n = 200, y α= 0.01. Ing William León Velásquez
  30. 30. 30 Paso 1  Formulación de la hipótesis H0 : p = 0.4 La proporción de mujeres en las carreras de ingeniería es de 0.4 H1 : p ≠ 0.4 La proporción de mujeres en las carreras de ingeniería no es de 0.4  Asuma que 𝑝 = 0.45, n = 200, y α = 0.01. B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  31. 31. 31 Paso 2 o Calculo del valor z de 𝑝 o Se obtiene Z = 45.1 0346.0 4.045.0  0346.0 200 )4.01(4.0 p B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  32. 32. 32 Paso 3  El valor P= para una de las áreas. Z= 1.45  =1.4 +0.05 =1.45 B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  33. 33. 33 Paso 3  La región bajo la curva z que contiene los valores extremos de es 0.0735 en ambos lados de la curva P/2P/2 0.07350.0735 B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  34. 34. 34 Paso 4  El valor p de una de las áreas es 0.0735 (p/2)  Por lo tanto el valor total de los dos extremos para poder comparar con el α es sumando las dos regiones del Paso 3 p= 2(el área a la izquierda de 1.45) p= 2(0.0735) p= 0.147 B. MÉTODO DEL VALOR P (MÉTODO 2) Ing William León Velásquez
  35. 35. 35 Paso 5  Como alfa es 0.01  Y sabemos que si el valor p >= α, entonces no se rechaza H0  Se tiene que 0.147 >=0.01 por lo tanto no se rechaza la Ho B. MÉTODO DEL VALOR P (MÉTODO 2) Conclusión: La proporción de mujeres en las carrera de ingeniería no es diferente de 0.4. Ing William León Velásquez
  36. 36. EJEMPLO 1: 36  Se afirma que, de todas los trabajadores que se contratan en una empresa por lo menos el 30 % proviene del cono sur. • Si una muestra de 600 contrataciones tomada al azar de los registros de la oficina de Recursos Humanos revela que de las personas contratadas 153 fueron del cono sur. • Se desea verificar tal afirmación con un nivel de significancia del 1% Ing William León Velásquez
  37. 37. 37 SOLUCIÓN:  Para calcular la proporción p lo primero que se ha de hacer es determinar la proporción muestral. ,..255.0 600 153,..600  pn  ,..70.0,...30.0  qp EJEMPLO 1: • Se probará la hipótesis nula p = 0.30 contra la hipótesis alternativa p < 30 con un α=0.01 153x Para calcular el error estándar de la proporción Ing William León Velásquez
  38. 38. 38 1.- Hipótesis: 30.0: 30.0: 1 0   pH pH EJEMPLO 1: Ho: El porcentaje de trabajadores que proviene del cono sur es del 30% H1: El porcentaje de trabajadores que proviene del cono sur es menor del 30% Ing William León Velásquez
  39. 39. 39 2.- Cálculo del valor critico 33.2Z con un nivel de significancia del 1 % para una prueba de una cola se tiene α=0.01. EJEMPLO 1: Ing William León Velásquez
  40. 40. 40  Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: ZZc  es decir, . 33.2cZ EJEMPLO 1: Ing William León Velásquez
  41. 41. 41 3.- Cálculo del estadístico de prueba Aplicando formula se tiene: O también Aplicando: 41.2 0187.0 045.0 00035.0 045.0 600 7.03.0 300.0255.0 .  cc Z x n qp ppZ  41.2 225,11 27 126 180153 )70.0)(30.0(600 )30.0(600153  npq npxZ EJEMPLO 1: Ing William León Velásquez
  42. 42. 42 4.- Conclusión: Como Zc es menor que Zα, se rechaza Ho . 33.241.2 cZ EJEMPLO 1: Esto se observa en la grafica donde Zc cae fuera del área de no rechazo .001 -2.33 -2.41  Se puede afirmar con un nivel de significancia del 1% que El porcentaje de trabajadores que proviene del cono sur es menor del 30%  Por lo tanto, la afirmación de que, de todas los trabajadores que se contratan en una empresa por lo menos el 30 % proviene del cono sur, es falsa. Zc AREA DE NO RECHAZ O Ing William León Velásquez
  43. 43. 43  Un fabricante de semiconductores produce controladores que se emplean en el sistema eléctrico de vehículos.  El cliente requiere que la proporción de controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre estas características del proceso de fabricación con este nivel de calidad, con un nivel de significancia del 5 %. EJEMPLO 2: • El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. • ¿El fabricante puede demostrar al cliente la calidad exigida? Obtener sus conclusiones.Ing William León Velásquez
  44. 44. 44 SOLUCIÓN:  Calcular la proporción muestral  Para resolver el problema hay que plantear una hipótesis alternativa unilateral de una cola por la izquierda  Es decir, p< 0.05 EJEMPLO 2: n=200 x=4 𝑝 = 4 200 = 0.02 Para calcular el error estándar de la proporción se tiene que considerar la proporción poblacional de éxitos y fracasos: p=0.05 y q=0.95 Ing William León Velásquez
  45. 45. 45 1.- Hipótesis: 05.0: 05.0: 1 0   pH pH EJEMPLO 2: Ho: La proporción de controladores defectuosos es 0.05 H1: La proporción de controladores defectuosos es menor a 0.05 Ing William León Velásquez
  46. 46. 46 645,1Z 2.-Cálculo del Z crítico Por tabla se sabe que al 5 % por la cola izquierda es decir un α=0.05 EJEMPLO 2: Ing William León Velásquez
  47. 47. 47  Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si  Es decir, ZZc  645,1cZ EJEMPLO 2: Ing William León Velásquez
  48. 48. 48 3.- Calculo el Z de los datos Aplicando formula se tiene:  200 95.005.0 05.002.0 . x n qp ppZc  95.1 0154.0 03.0 0002375.0 03.0  cZ EJEMPLO 2: Ing William León Velásquez
  49. 49. 49 4.- Conclusión:  Como Zc es menor que Zα, es decir, , se rechaza Ho con un nivel de significancia de 0.05. 645.195.1 cZ EJEMPLO 2:  Esto se podrá observar en una grafica en donde Zc caerá dentro del área de rechazo .005 -1.645 -1.91 • Por lo tanto La proporción de controladores defectuosos es menor a 0.05 Es decir • El fabricante puede demostrar al cliente la calidad exigida Ing William León Velásquez
  50. 50. PRUEBA DE HIPOTESIS PARA DOS PROPORCIONES 50
  51. 51. • El objetivo de una prueba de dos muestras es determinar si las dos muestras independientes fueron tomadas de dos poblaciones, las cuales presentan la misma proporción de elementos con determinada característica. PRUEBA DE PROPORCIONES DE DOS MUESTRAS 51Ing William León Velásquez • La prueba se concentra en la diferencia relativa (diferencia dividida entre la desviación estándar de la distribución de muestreo) entre las dos proporciones muestrales. • Diferencias pequeñas denotan únicamente la variación casual producto del muestreo (se acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza H0).
  52. 52. • La proporción de semillas que germinan siendo tratadas o no con un funguicida. • El porcentaje de hombres y de mujeres que votan a determinado candidato. • La proporción de piezas defectuosas de un lote de fabricación, correspondiente al turno diurno y nocturno PRUEBA DE PROPORCIONES DE DOS MUESTRAS • Ejemplos: 52Ing William León Velásquez
  53. 53. • Para efectuar esta comparación se requiere  Una muestra aleatoria de tamaño n1 extraída de la población 1 con parámetro p1  Una muestra aleatoria de tamaño n2 extraída de la población 2 con parámetro p2 REQUISITOS 53Ing William León Velásquez
  54. 54. • Se comparará las dos proporciones haciendo inferencia sobre p1-p2 (diferencia entre las dos proporciones poblacionales). •Si las dos proporciones poblacionales son iguales, entonces p1-p2 = 0. •El mejor estimador de p1-p2 es la diferencia entre las dos proporciones muestrales: PRUEBA DE PROPORCIONES DE DOS POBLACIONES 54 𝑝1 − 𝑝2 = 𝑥1 𝑛1 − 𝑥2 𝑛2 Ing William León Velásquez
  55. 55. EL ESTADISTICO DE LA PRUEBA 55 Para obtener el estadístico Zc de la diferencia de proporciones Proporción ponderada 0 por Ho 𝑧 = 𝑝1 − 𝑝2 − 𝑃1 − 𝑃2 𝑝 1 − 𝑝 1 𝑛1 + 1 𝑛2 𝑝 = 𝑛1 𝑝1 + 𝑛2 𝑝2 𝑛1 + 𝑛2 = 𝑝 = 𝑥1 + 𝑥2 𝑛1 + 𝑛2 Ing William León Velásquez
  56. 56. PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS Ing William León Velásquez 56 1. Definir la Hipótesis estadística H0 y Ha 56 Ho: P1 – P2 = 0 Ha: P1 – P2 ≠ 0 Ha: P1 – P2 > 0 Ha: P1 – P2 < 0 La hipótesis nula es: La hipótesis alternativa puede ser:
  57. 57. PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS • El nivel de significancia es la probabilidad de rechazar la hipótesis nula cuando es verdadera es a lo que se llama error Tipo I. • El nivel de significancia se define con la letra griega alfa (α ). • Se le llama también nivel de riesgo. Ing William León Velásquez 2. Definir el nivel de significancia y la zona de rechazo 5757
  58. 58. PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS La zona de rechazo tiene: • Una magnitud dada por α y • Una dirección dada por la hipótesis alternativa. • A través de la tabla Z se obtendrá el estadístico critico Ing William León Velásquez 58 2 Definir el nivel de significancia y la zona de rechazo 58
  59. 59. PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS Ing William León Velásquez 4. Calcular el estadístico de prueba a partir de los datos muestrales considerando H0 como verdadera 5959 𝑧 = 𝑝1 − 𝑝2 𝑝 1 − 𝑝 1 𝑛1 + 1 𝑛2 𝑝 = 𝑥1 + 𝑥2 𝑛1 + 𝑛2 Donde la proporción ponderada 𝑝 = 𝑛1 𝑝1 + 𝑛2 𝑝2 𝑛1 + 𝑛2
  60. 60. PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS Ing William León Velásquez 5. Decidir si H0 no se rechaza o se rechaza. Y Concluir en términos del contexto del problema. 

rueba de hipótesis de la varianza

  1. 1. Pruebas de Hipótesis Prueba de Hipótesis para la Varianza Hernández Gayosso Alfonso Javier
  2. 2. Introducción En situaciones como control estadístico de la calidad, de antemano se conocen los parámetros de referencia del proceso bajo control. La actividad central para decidir si en un momento dado, el proceso esta bajo control, es la confrontación permanente de los datos obtenidos con la hipótesis sobre la centralidad del proceso (media) y sobre la magnitud de su variabilidad (varianza). La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de dispersión de datos.
  3. 3. Si se desea probar una hipótesis acerca de la varianza se puede hacer utilizando las medidas estadísticas con las que se construyo el intervalo de confianza σ2, esto es con la distribución ji- cuadrada. Así podremos determinar una franja de confianza, con base en la cual podríamos tomarse decisiones al respecto.
  4. 4. Para esto entonces debemos conocer nuestro estadístico de prueba considerando que la población sigue una distribución normal: • X2 = -------- • gl=n-1 ( n – 1 ) S2 σ2
  5. 5. Problema Considerando que el arribo de un metrobus a la estación Iztacalco es en promedio de 45 segundos y su variabilidad (varianza) debiera ser de 5 segundos. ¿Muestran los siguientes datos suficiente evidencia de que esta varianza ha cambiado? Use un α = 0.05 Tomamos el tiempo de una muestra periódica de 16 autobuses para controlar la periodicidad de arribo y se obtienen los siguientes datos en segundos:
  6. 6. 46.2 45.2 44.3 51.7 47.5 41.6 46.4 49.0 43.6 42.2 44.0 47.8 43.7 47.8 41.8 44.2 Datos dados en segundos Datos: X = 45.4375 S = 2.81 S2 = 7.91 1.-Ensayo de Hipótesis H0:σ 2 = 5 H1:σ2 > 5 2.-Nivel de significancia α= 0.05 3.-Regla de decisión Se rechaza H0 si y solo si X2 > 24.996
  7. 7. 4.-Tomamos la muestra y la aplicamos a nuestro estadístico de prueba: X 2 = ( n – 1 ) S2 σ2 = ( 16 – 1 ) 7.91 5 = 23.73 5.-la Hipótesis se acepta ya que se encuentra en la región de aceptación y podemos afirmar que nuestra variabilidad no ha cambiado de 5 segundos, pero se acerca mucho al valor critico y es complicado tomar una decisión.
- INTRODUCCION
Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar como a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del limite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población.
Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación estándar o la forma de la población, pero a veces no se dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalote confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra.
2.- HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:
Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.
3.- Procedimiento sistemático para una prueba de hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.
Paso 2: Seleccionar el nivel de significancia.
Nivel de significacia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, tambiιn es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.

Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuerade área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.

viernes, 9 de noviembre de 2018

¿Qué es un método no paramétrico?

Una prueba no paramétrica es una prueba de hipótesis que no requiere que la distribución de la población sea caracterizada por ciertos parámetros. Por ejemplo, muchas pruebas de hipótesis parten del supuesto de que la población sigue una distribución normal con los parámetros μ y σ. Las pruebas no paramétricas no parten de este supuesto, de modo que son útiles cuando los datos son considerablemente no normales y resistentes a transformaciones.
En la estadística paramétrica, se presupone que las muestras provienen de distribuciones totalmente especificadas caracterizadas por uno o más parámetros desconocidos sobre los cuales se desea hacer inferencias. En un método no paramétrico, se presupone que la distribución de la que proviene la muestra no está especificada y, con frecuencia, se desea hacer inferencias sobre el centro de la distribución. Por ejemplo, muchas pruebas de la estadística paramétrica, como la prueba t de 1 muestra, se realizan bajo el supuesto de que los datos provienen de una población normal con una media desconocida. En un estudio no paramétrico, se elimina el supuesto de normalidad.
Los métodos no paramétricos son útiles cuando no se cumple el supuesto de normalidad y el tamaño de la muestra es pequeño. Sin embargo, las pruebas no paramétricas no están completamente libres de supuestos acerca de los datos. Por ejemplo, es fundamental presuponer que las observaciones de las muestras son independientes y provienen de la misma distribución. Además, en los diseños de dos muestras, se requiere el supuesto de igualdad de forma y dispersión.
La prueba de Kolmogorov es una prueba de bondad de ajuste, es decir, del grado en que la distribución observada difiere de otra distribución. Es una alternativa a la prueba Ji Cuadrado de bondad de ajuste cuanto el número de datos es pequeño. La prueba no debe ser aplicada si hay muchos empates.
a) Supuestos. Los datos están medidos al menos a nivel ordinal.
b) Hipótesis Nula: No hay diferencias entre las distribuciones comparadas.
c) Estadístico de contraste: D (mayor diferencia entre las frecuencias relativas de las distribuciones).
d) Distribución del estadístico de contraste: Específico dependiendo de la distribución con que se compare la distribución observada.

Ejemplo
Desean saber si una muestra de debe datos pertenece a una población normalmente distribuida. Los datos (ordenados de menor a mayor) son:
b) Hipótesis Nula: No hay diferencia estadísticamente significativa entre la distribución de la población a que pertenece la muestra y la distribución Normal.
Hipótesis Alternativa: Hay diferencia estadísticamente significativa entre la distribución de la población a que pertenece la muestra y la distribución Normal.
c) Estadístico de contraste. Obtención del estadístico de contraste:
Tipificar la muestra:


Pruebas de bondad de ajuste y pruebas no parametricas

  1. 1. Estadística Inferencial I Unidad 4 Página 1 PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO PARAMETRICAS
  2. 2. Estadística Inferencial I Unidad 4 Página 2 4.1 BONDAD DE AJUSTE Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se puede ajustar o afirmar que proviene de una determinada distribución. Las pruebas básicas que pueden aplicarse son: la ji-cuadrada y la prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que en estadística se denominan pruebas de “Bondad de Ajuste” y miden, como el nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están basadas en la hipótesis nula de que no hay diferencias significativas entre la distribución muestral y la teórica, H0 es la distribución que se supone sigue la muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Hablamos de bondad de ajuste cuando tratamos de comparar una distribución de frecuencia observada con los valores correspondientes de una distribución esperada o teórica. Algunos estudios producen resultados sobre los que no podemos afirmar que se contribuyen normalmente, es decir con forma acampanada concentradas sobre la media. Su fórmula es la siguiente: 𝑓𝑜𝑖= Valor observado en la i-ésimo dato. 𝑓𝑒𝑖= Valor esperado en la i-ésimo dato. 𝑘 = Categorías o celdas. 𝑚 = Parámetros estimados sobre la base de los datos de la muestra Los grados de libertad vienen dados por: gl= K-m-1.      k i e eo i ii f ff 1 2 2 
  3. 3. Estadística Inferencial I Unidad 4 Página 3 Criterio de decisión es el siguiente: Se rechaza H0 cuando 2 1; 2  mKt . En caso contrario se acepta. Donde t representa el valor proporcionado por las tablas, según el nivel de significación elegido. Cuanto más se aproxima a cero el valor de chi-cuadrada, más ajustadas están ambas distribuciones.
  4. 4. Estadística Inferencial I Unidad 4 Página 4 4.1.1 ANALISIS JI-CUADRADA Es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medidas las diferencias existentes entre ambas se deben al azar en el contraste de la hipótesis. Esta prueba se basa en la hipótesis nula H0 de que no hay diferencias significativas entre la distribución muestral y la teórica. La estructura básica de la prueba para la bondad de ajuste se muestra en la siguiente tabla: Clases Frecuencia observada Frecuencia esperada 1 Foi1 Fe1 2 Foi2 Fe2 . . . . . . k Foik Fek Total n n Donde para calcular la Frecuencia esperada se tiene: 𝜒2 = ( 𝑓𝑜𝑖 − 𝑓𝑒𝑖)2 𝑓𝑒𝑖 Fórmula para el análisis de ji-cuadrada 𝜒2 = ∑ ( 𝑓𝑜𝑖−𝑓𝑒𝑖)2 𝑓𝑒𝑖 𝑘 𝑖−1 Interpretación: cuanto mayor sea el valor de ji-cuadrada menos creíble es la hipótesis nula H0. De la misma forma, cuanto más se aproximan acero el valor de 𝜒2 , más ajustadas están las distribuciones. 𝜒2 = 0 H0 se acepta 𝜒2 > 0 H0 se rechaza 𝑓𝑜𝑖 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑓𝑒𝑖 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑘 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑒𝑠𝑡𝑢𝑑𝑖𝑜
  5. 5. Estadística Inferencial I Unidad 4 Página 5 4.1.2 PRUEBA DE INDEPENDENCIA La prueba de independencia trata de la comparación de dos situaciones en las cuales podemos esperar que sean dependientes o independientes, esto quiere decir que, pueden o no estar relacionados sus datos debido a muchos factores que pueden influir en ellos, o bien, un problema no tenga relación con otro. Su objetivo es determinar si alguna situación es afectada por otra, basándose en datos estadísticos y valores probabilístico obtenidos de la fabulación de datos o de pronósticos por medio de formulas y tablas, para esto se basa en un nivel de significancia en un caso y en el otro a comparar, valiéndonos de tablas de contingencia para obtener frecuencias esperadas y poder aplicarlas, para así obtener datos comparativos que son determinantes en la decisión de independencia. Para todas las pruebas de independencia, las hipótesis son: H0: las dos variables de clasificación son independientes. H1: las dos variables de clasificación son dependientes. Los métodos para poner a prueba H0 contra H1 son idénticos a los usados para poner a prueba las diferencias entre proporciones poblacionales basados en la prueba de 𝝌2. De nuevo compararemos las frecuencias observadas con las esperadas, las obtenidas bajo el supuesto de que H0, para determinar que tan grande debe ser el alejamiento permitido para que la hipótesis de independencia pueda rechazarse. Si el valor del estadístico de prueba 𝝌2 es mayor o igual que el valor critico calculado, ya no podremos suponer que pueda resultar de dos variables de clasificación independientes, siendo esta la razón de que todas las pruebas de 𝝌2 sobre independencia sean de cola derecha.

prueba de hipotesis

http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf