Prueba de hipótesis No paramétricas
Una prueba no paramétrica
es una prueba de hipótesis que no requiere que la distribución de la población
sea caracterizada por ciertos parámetros. Por ejemplo, muchas pruebas de
hipótesis parten del supuesto de que la población sigue una distribución normal
con los parámetros μ y σ. Las pruebas no paramétricas no parten de este
supuesto, de modo que son útiles cuando los datos son considerablemente no
normales y resistentes a transformaciones.
En la estadística paramétrica,
se presupone que las muestras provienen de distribuciones totalmente
especificadas caracterizadas por uno o más parámetros desconocidos sobre los
cuales se desea hacer inferencias. En un método no paramétrico, se presupone
que la distribución de la que proviene la muestra no está especificada y, con
frecuencia, se desea hacer inferencias sobre el centro de la distribución. Por
ejemplo, muchas pruebas de la estadística paramétrica, como la prueba t de
1 muestra, se realizan bajo el supuesto de que los datos provienen de una
población normal con una media desconocida. En un estudio no paramétrico, se
elimina el supuesto de normalidad.
Los métodos no paramétricos
son útiles cuando no se cumple el supuesto de normalidad y el tamaño de la
muestra es pequeño. Sin embargo, las pruebas no paramétricas no están
completamente libres de supuestos acerca de los datos. Por ejemplo, es
fundamental presuponer que las observaciones de las muestras son independientes
y provienen de la misma distribución. Además, en los diseños de dos muestras,
se requiere el supuesto de igualdad de forma y dispersión.
Por ejemplo,
los datos sobre salarios son fuertemente asimétricos hacia la derecha, porque
muchas personas devengan salarios modestos y pocas personas ganan salarios más
altos. Usted puede utilizar pruebas no paramétricas con estos datos para
responder a preguntas como las siguientes:
·
¿Es la mediana de los salarios de su empresa igual a cierto valor?
Utilice la prueba de signos de 1 muestra.
·
¿Es la mediana de los salarios de una sucursal urbana de un banco mayor
que la mediana de los salarios de una sucursal rural del banco? Utilice la
prueba de Mann-Whitney o la prueba de Kruskal-Wallis.
·
¿Son diferentes las medianas de los salarios en las sucursales rurales,
urbanas y suburbanas de un banco? Utilice la prueba de la mediana de Mood.
·
¿Cómo incide el nivel de educación en los salarios de las sucursales
rural y urbana? Utilice la prueba de Friedman.
Limitaciones
de las pruebas no paramétricas
Las pruebas
no paramétricas tienen las siguientes limitaciones:
·
Las pruebas no paramétricas por lo general son menos potentes que la
prueba paramétrica correspondiente cuando se cumple el supuesto de normalidad.
Por lo tanto, es menos probable que usted rechace la hipótesis nula cuando sea
falsa si los datos provienen de la distribución normal.
·
Las pruebas no paramétricas suelen requerir que se modifiquen las
hipótesis. Por ejemplo, la mayoría de las pruebas no paramétricas acerca del
centro de la población son pruebas sobre la mediana y no sobre la media. La
prueba no responde a la misma pregunta que el procedimiento paramétrico
correspondiente si la población no es simétrica.
Prueba de hipótesis binomial
En la mayoría de las áreas de conocimiento es relativamente frecuente encontrarse con variables dicotómicas o dicotomizadas, es decir, con variables categóricas que sólo toman dos valores: éxito fracaso, a favor en
contra, tratados no tratados, recuperados–no recuperados, aprobados suspensos, etc. Podemos llamar,
de forma genérica, acierto y
error a los dos niveles de una variable de este tipo. La prueba binomial permite averiguar si una
variable dicotómica sigue o no un determinado modelo de probabilidad. En concreto, permite
contrastar la hipótesis de que las proporción observada
de aciertos se ajusta a la proporción
teórica de una distribución binomial (lo cual se traduce, según
veremos, en la posibilidad de contrastar hipótesis sobre proporciones y sobre cuartiles). John Arbuthnott (1710)
fue el primero en utilizar
este procedimiento para demostrar que la proporción de varones nacidos
en Londres en un determinado periodo de tiempo era
significativamente mayor que la proporción de
mujeres.
Si extraemos
muestras aleatorias de tamaño n y, en
cada muestra, definimos la variable X = “número
de aciertos en las n extracciones”, tendremos
una variable aleatoria distribuida, si la proporción de aciertos (π) permanece constante
en cada extracción, según el modelo
de probabilidad binomial, con parámetros n =
“número de extracciones” y π = “proporción de aciertos”. Podemos,
por tanto, utilizar
las probabilidades de la distribución binomial para conocer la probabilidad exacta asociada a
cada uno de los valores de la variable X. Además, a medida
que n aumenta, la distribución de X se aproxima
a la distribución , normal con parámetros.
Se distribuirá según el modelo de probabilidad normal N(0, 1). Podemos,
también, por tanto, utiliza la distribución normal
para conocer las probabilidades asociadas a los valores de X.
El SPSS utiliza ambas soluciones. Con muestras pequeñas (n _< 25), utiliza la distribución binomial para obtener
las probabilidades exactas
asociadas a los valores del estadístico X. Con muestras grandes (n > 25) utiliza la distribución normal
para obtener las probabilidades asocia- das a los valores
del estadístico Z (y,
consecuentemente, las probabilidades aproximadas aso-
ciadas al estadístico X).
Ejercicio resuelto
En
una investigación piden a una muestra de sujetos que indiquen en una escala de
0 a 10 la preferencia por una bebida. Los resultados son:
Desean
saber si la Mediana de la población de la que procede la muestra de los datos
es igual a 5.
a)
Supuestos: Los datos están medidos a nivel ordinal o superior.
b)
Hipótesis:
c)
Estadístico de contraste:
d)
Distribución del estadístico de contraste: Bin (7,0.5). (7 es el número de
datos. 0.5 es la probabilidad que una observación tenga valor superior a 5 bajo
el supuesto establecido en la Hipótesis Nula).
e)
Significación del estadístico de contraste: La probabilidad de obtener 3 datos
por encima de 5 (n=7, p= 0.5) es 0.5
f)
Decisión: Se acepta la Hipótesis Nula.
Ejercicio propuesto
Se ha realizado una encuesta en una
población mediante una muestra de 200 personas, resultando 72 fumadores.
(a)
Estima la proporción de fumadores así como la desviación típica de dicha
estimación.
(b) Halla un intervalo de confianza para dicha estimación con un
coeficiente de confianza del 95%.
(c) En caso de que deseemos aumentar la
precisión de la estimación reduciendo al menos a la mitad la longitud del
intervalo de confianza, ¿qué tamaño de muestra debemos utilizar?
(d) ¿Hay
evidencia suficiente para afirmar que al menos 1/3 de la población es fumadora
con un nivel de significación α= 0.05
No hay comentarios:
Publicar un comentario