domingo, 23 de junio de 2019

PRUEBAS NO PARAMÉTRICAS: DISTRIBUCIÓN BINOMIAL


Prueba de hipótesis No paramétricas
Una prueba no paramétrica es una prueba de hipótesis que no requiere que la distribución de la población sea caracterizada por ciertos parámetros. Por ejemplo, muchas pruebas de hipótesis parten del supuesto de que la población sigue una distribución normal con los parámetros μ y σ. Las pruebas no paramétricas no parten de este supuesto, de modo que son útiles cuando los datos son considerablemente no normales y resistentes a transformaciones.
En la estadística paramétrica, se presupone que las muestras provienen de distribuciones totalmente especificadas caracterizadas por uno o más parámetros desconocidos sobre los cuales se desea hacer inferencias. En un método no paramétrico, se presupone que la distribución de la que proviene la muestra no está especificada y, con frecuencia, se desea hacer inferencias sobre el centro de la distribución. Por ejemplo, muchas pruebas de la estadística paramétrica, como la prueba t de 1 muestra, se realizan bajo el supuesto de que los datos provienen de una población normal con una media desconocida. En un estudio no paramétrico, se elimina el supuesto de normalidad.
Los métodos no paramétricos son útiles cuando no se cumple el supuesto de normalidad y el tamaño de la muestra es pequeño. Sin embargo, las pruebas no paramétricas no están completamente libres de supuestos acerca de los datos. Por ejemplo, es fundamental presuponer que las observaciones de las muestras son independientes y provienen de la misma distribución. Además, en los diseños de dos muestras, se requiere el supuesto de igualdad de forma y dispersión.
Por ejemplo, los datos sobre salarios son fuertemente asimétricos hacia la derecha, porque muchas personas devengan salarios modestos y pocas personas ganan salarios más altos. Usted puede utilizar pruebas no paramétricas con estos datos para responder a preguntas como las siguientes:
·            ¿Es la mediana de los salarios de su empresa igual a cierto valor? Utilice la prueba de signos de 1 muestra.
·            ¿Es la mediana de los salarios de una sucursal urbana de un banco mayor que la mediana de los salarios de una sucursal rural del banco? Utilice la prueba de Mann-Whitney o la prueba de Kruskal-Wallis.
·            ¿Son diferentes las medianas de los salarios en las sucursales rurales, urbanas y suburbanas de un banco? Utilice la prueba de la mediana de Mood.
·            ¿Cómo incide el nivel de educación en los salarios de las sucursales rural y urbana? Utilice la prueba de Friedman.
Limitaciones de las pruebas no paramétricas
Las pruebas no paramétricas tienen las siguientes limitaciones:
·            Las pruebas no paramétricas por lo general son menos potentes que la prueba paramétrica correspondiente cuando se cumple el supuesto de normalidad. Por lo tanto, es menos probable que usted rechace la hipótesis nula cuando sea falsa si los datos provienen de la distribución normal.
·            Las pruebas no paramétricas suelen requerir que se modifiquen las hipótesis. Por ejemplo, la mayoría de las pruebas no paramétricas acerca del centro de la población son pruebas sobre la mediana y no sobre la media. La prueba no responde a la misma pregunta que el procedimiento paramétrico correspondiente si la población no es simétrica.
Prueba de hipótesis binomial
En la mayoría de las áreas de conocimiento es relativamente frecuente encontrarse con variables dicotómicas o dicotomizadas, es decir, con variables categóricas que sólo toman dos valores: éxito fracaso, a favor en contra, tratados no tratados, recuperados–no recuperados, aprobados suspensos, etc. Podemos llamar, de forma genérica, acierto y error a los dos niveles de una variable de este tipo. La prueba binomial permite averiguar si una variable dicotómica sigue o no un determinado modelo de probabilidad. En concreto, permite contrastar la hipótesis de que las proporción observada de aciertos se ajusta a la proporción teórica de una distribución binomial (lo cual se traduce, según veremos, en la posibilidad de contrastar hipótesis sobre proporciones y sobre cuartiles). John Arbuthnott (1710) fue el primero en utilizar este procedimiento para demostrar que la proporción de varones nacidos en Londres en un determinado periodo de tiempo era significativamente mayor que la proporción de mujeres.
Si extraemos muestras aleatorias de tamaño n y, en cada muestra, definimos la variable X = “número de aciertos en las n extracciones”, tendremos una variable aleatoria distribuida, si la proporción de aciertos (π) permanece constante en cada extracción, según el modelo de probabilidad binomial, con parámetros n = “número de extracciones” y π = “proporción de aciertos”. Podemos, por tanto, utilizar las probabilidades de la distribución binomial para conocer la probabilidad exacta asociada a cada uno de los valores de la variable X. Además, a medida que n aumenta, la distribución de X se aproxima a la distribución , normal con parámetros.
Se distribuirá según el modelo de probabilidad normal N(0, 1). Podemos, también, por tanto, utiliza la distribución normal para conocer las probabilidades asociadas a los valores de X.

El SPSS utiliza ambas soluciones. Con muestras pequeñas (n _< 25), utiliza la distribución binomial para obtener las probabilidades exactas asociadas a los valores del estadístico X. Con muestras grandes (n > 25) utiliza la distribución normal para obtener las probabilidades asocia- das a los valores del estadístico Z (y, consecuentemente, las probabilidades aproximadas aso- ciadas al estadístico X).
Ejercicio resuelto
En una investigación piden a una muestra de sujetos que indiquen en una escala de 0 a 10 la preferencia por una bebida. Los resultados son:
Desean saber si la Mediana de la población de la que procede la muestra de los datos es igual a 5.
a) Supuestos: Los datos están medidos a nivel ordinal o superior.
b) Hipótesis:
c) Estadístico de contraste:
d) Distribución del estadístico de contraste: Bin (7,0.5). (7 es el número de datos. 0.5 es la probabilidad que una observación tenga valor superior a 5 bajo el supuesto establecido en la Hipótesis Nula).
e) Significación del estadístico de contraste: La probabilidad de obtener 3 datos por encima de 5 (n=7, p= 0.5) es 0.5
f) Decisión: Se acepta la Hipótesis Nula.
Ejercicio propuesto
Se ha realizado una encuesta en una población mediante una muestra de 200 personas, resultando 72 fumadores. 
(a) Estima la proporción de fumadores así como la desviación típica de dicha estimación. 
(b) Halla un intervalo de confianza para dicha estimación con un coeficiente de confianza del 95%. 
(c) En caso de que deseemos aumentar la precisión de la estimación reduciendo al menos a la mitad la longitud del intervalo de confianza, ¿qué tamaño de muestra debemos utilizar? 
(d) ¿Hay evidencia suficiente para afirmar que al menos 1/3 de la población es fumadora con un nivel de significación α= 0.05

No hay comentarios:

Publicar un comentario