miércoles, 26 de septiembre de 2018

La prueba de hipótesis que incluye la diferencia entre las medias de dos poblaciones o muestras se utiliza con más frecuencia para determinar si es razonable o no concluir que ambas son distintas entre sí; sin embargo, debe recordarse la definición de muestra, en que el interés se centra en quiénes (en los sujetos u objetos de estudio), que corresponde a un subgrupo de la población y depende del planteamiento inicial de la investigación. Para seleccionar una muestra, primero se debe definir la unidad de análisis (a quiénes se va a medir); por ello, se deben precisar con claridad el problema a investigar y los objetivos de la investigación.
Los tipos de muestra se dividen en dos ramas: muestras no probabilísticas y muestras probabilísticas. En las primeras, la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador o del que selecciona la muestra, de modo que el procedimiento no es mecánico, ni se basa en fórmulas de probabilidad.
En las muestras probabilísticas, todos los elementos de la población tienen la misma posibilidad de ser escogidas. Esto se obtiene definiendo los siguientes elementos:
  1. Las características de la población.
  2. El tamaño de la muestra.
  3. La selección aleatoria de las unidades de análisis.
Es muy frecuente que en la investigación médica o de ciencias relacionadas con la salud se bua partir de muestras pareadas o no pareadas.
La media o promedio es la medida de tendencia central más utilizada y puede definirse como el promedio aritmético de una distribución. Se simboliza con X y es la suma de todos los valores dividida entre el número de casos.
Sólo se aplica a mediciones por intervalos o de razón. Carece de sentido para variables medidas en un nivel nominal u ordinal. La fórmula para la proporción muestral, como estimación de la proporción p de la población, es:

cursos mooc


jueves, 13 de septiembre de 2018

Distribución muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.
Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np5 y 
n(1-p)
 5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intentos.

Generación de la Distribución Muestral de ProporcionesSuponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Artículos Buenos
Artículos Malos
Proporción de artículos defectuoso
Número de maneras en las que se puede obtener la muestra
1
4
4/5=0.8
8C1*4C4=8
2
3
3/5=0.6
8C2*4C3=112
3
2
2/5=0.4
8C3*4C2=336
4
1
1/5=0.2
8C4*4C1=280
5
0
0/5=0
8C5*4C0=56
Total
792
Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es igual a la Proporción de la población.
p = P
También se puede calcular la desviación estándar de la distribución muestral de proporciones:
La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta fórmula tenemos que:
 , este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de corrección para una población finita y un muestreo sin reemplazo:
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en la aproximación de la distribución normal a la binomial . Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de  si se cumple con las condiciones necesarias.
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución:
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x< 440) = ?
Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.



Distribución Muestral de Proporciones

Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p< 0.55) = ?


 Observe que este valor es igual al obtenido en el método de la aproximación de la distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.
La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.

Ejemplo:
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

  1. Resolverlo mediante la aproximación de la normal a la binomial


  2. Resolverlo con la distribución muestral de proporciones


  1. Aproximación de la distribución normal a la binomial:

  2. Datos:
    n=150 personas
    p=0.03
    x= (0.04)(150) = 6 personas
    p(x>6) = ?
    Media = np= (150)(0.03)= 4.5


    p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa.


  3. Distribución Muestral de Proporciones
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?



Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa.

Ejemplo:
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:

  1. Menos del 3% de los componentes defectuosos.


  2. Más del 1% pero menos del 5% de partes defectuosas.

Solución:



  1. Datos:

  2. n= 60 artículos
    P=0.04
    p= 0.03
    p(p<0.03) = ?


    La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos defectuosos es de 0.2327.


  3. Datos:
n= 60 artículos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?

 


prueba de hipotesis

http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf