domingo, 23 de junio de 2019

CONCEPTOS BASICOS DE ESTADISTICA


¿Qué es estadística?

La estadística es la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre. (Gutiérrez, p.23)
La estadística es la ciencia de los datos, la cual implica su recolección, clasificación, síntesis, organización, análisis e interpretación, para la toma de decisiones frente a la incertidumbre (Ángel, p. 28)
La estadística es la rama del conocimiento humano que tiene como objeto el estudio de ciertos métodos inductivos aplicables a fenómenos susceptibles de expresión cuantitativa. (López, p.1).

Objetivo de la estadística


El objetivo de la estadística es mejorar la comprensión de hechos a partir de datos. (Moore, p.267)

El principal objetivo de la estadística es hacer inferencias acerca de una población, con base en la información contenida en una muestra. (Pérez, p.172)

¿Cuáles son los tipos de estadística?

Básicamente se tienen dos tipos de estadística, a saber:

Estadística descriptiva

Se puede definir como un método para describir numéricamente conjuntos numerosos. Por tratarse de un método de descripción numérica, utiliza el número como medio para describir un conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se dan en los casos raros. No es posible sacar conclusiones concretas y precisas de los datos estadísticos. (Vargas, p.33)

Objetivo de la estadística descriptiva

La finalidad última de la estadística descriptiva es resumir la información de conjuntos más o menos numerosos de datos. Para ello se asienta en un concepto inmediato a la tarea de recuento: la frecuencia, medida empírica de la ocurrencia de los distintos estados que puede presentar una variable. (SGT, p.16)

Estadística inferencial, analítica o deductiva

Estudia la probabilidad de éxito de las diferentes soluciones posibles a un problema en las diferentes ciencias en las que se aplica y para ello utiliza los datos observados en una o varias muestras de la población. Mediante la creación de un modelo matemático infiere el comportamiento de la población total partiendo de los resultados obtenidos en las observaciones de las muestras. (Fernández et.al, p.17)

Objetivo de la estadística inferencial

La inferencia estadística intenta tomar decisiones basadas en la aceptación o el rechazo de ciertas relaciones que se toman como hipótesis. Esta toma de decisiones va acompañada de un margen de error, cuya probabilidad está determinada. (Vargas, p.33)

INTRODUCCION UNIDAD I: PRUEBA DE HIPÓTESIS

PRUEBA DE HIPÓTESIS

Dentro del estudio de la inferencia estadística, se describe cómo se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. 
Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación estándar o la forma de la población, pero a veces no se dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra.
HIPÓTESIS Y PRUEBA DE HIPÓTESIS
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:
1) Se plantea la Hipótesis nula alternativa
2) Se selecciona el nivel de significancia
3) Se identifica el estadístico de prueba
4) Se formula la regla de decisión
5)Se toma una muestra y se decide, si se rechaza o se acepta dicha hipótesis.

Objetivo de la prueba de hipótesis.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

REFERENCIAS:


PRUEBA DE HIPÓTESIS: CASO I


CASO 1: DIFERENCIA DE MEDIAS PARA UNA SOLA POBLACIÓN















La aproximación normal para :

por lo general será buena si n>=30 sin importar la forma de la población. Si n<30 la aproximación es buena solamente si la población no es muy diferente de una distribución normal y si se sabe que la población es normal, la distribución muestral de seguirá una distribución normal exacta, no importa que tan pequeño sea el tamaño de las muestras.


EJERCICIO RESUELTO

1)      La duración media de una muestra de 300 focos producidos por una compañía resulta ser de 1620 horas.

Como se tiene como dato el tamaño de la población se tiene que verificar si cumple con la condición para utilizar el factor finito de corrección.
GRÀFICO


EJERCICIO PROPUESTO

  1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con media de 2000 libras y una varianza de 25,000 lbs 2. Si se selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidad de que en esa muestra:
  1. La resistencia media encontrada sea de por lo menos 1958 libras.
  2. La resistencia media se mayor de 2080 libras.

PRUEBA DE HIPÓTESIS: CASO II


CASO 2: DIFERENCIA DE MEDIAS PARA 2 POBLACIONES
Las pruebas de dos muestras se utilizan para decidir si las medias de dos poblaciones son iguales. Se requieren dos muestras independientes, una de cada una de las dos poblaciones. Considérese, por ejemplo, una compañía investigadora que experimentan con dos diferentes mezclas de pintura, para ver si se puede modificar el tiempo de secado de una pintura para uso doméstico. Cada mezcla es probada un determinado número de veces, y comparados posteriormente los tiempos medios de secado de las dos muestras. Una parece ser superior, ya que su tiempo medio de secado (muestra) es 30 minutos menor que el de la otra muestra.
Una de las pruebas de hipótesis más utilizadas es la que se comparan la diferencia entre dos medias poblacionales. D0 denota la diferencia hipotética entre μ1 y μ2, las tres formas que puede tener una prueba de hipótesis son las siguientes:

En muchas aplicaciones D0 = 0. Con un ejemplo de una prueba de hipótesis de dos colas, cuando D0 = 0 la hipótesis nula es H0: μ1- μ2 = 0. En este caso, la hipótesis nula es que μ1 y μ2 son iguales. Rechazar H0 lleva a la conclusión de que Ha: μ1 μ2 0 es verdadera: μ1 y μ2 no son iguales.
FÓRMULA

Entonces, evaluaremos nuestra hipótesis en función de Z y zα, obtenida mediante la tabla de la distribución normal.

Datos importantes:
Sin embargo, el caso más común es que no se conozcan las varianzas, entonces se utilizan la de las muestras para estimarlas, y el procedimiento es exactamente igual.
Como se menciona en el párrafo anterior, la única diferencia entre las fórmulas para calcular el estadístico de prueba y el error estándar de la diferencia entre 2 medias.


Cuando no se conocen las varianzas, pero se asume que son iguales

En estas condiciones, el estadístico de prueba sigue siendo Z de la distribución normal estándar:
Pero ahora, como se supone que las varianzas de las 2 poblaciones son iguales, se combinan las varianzas muestrales de la siguiente manera:
EJERCICIO RESUELTO
Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar y la fórmula 2 tiene un nuevo ingrediente secante que tiende a reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos y esta variabilidad inherente no debe verse afectada por la adición del nuevo ingrediente. Se pintan 35 placas con la fórmula 1 y otras 35 con la fórmula 2. Los dos tiempos promedio de secado muestrales son 116 minutos para la fórmula 1 y 112 minutos para la fórmula 2. ¿A qué conclusión puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, al nivel de significancia 0,01?
Por tabla, observamos que Zc = 2,33. Decidimos entonces aceptar la hipótesis nula. No hay evidencia suficiente como para demostrar que el tiempo de secado disminuye significativamente.

EJERCICIOS PROPUESTOS:

1.      En 2 ciudades en las que existen refinerías se tomó una muestra a cada persona de un grupo de 35, y se midió el nivel de plomo en la sangre. En la ciudad A s encontró que en promedio el nivel de plomo es de 74.9 microgramos con una desviación estándar de 8. En la ciudad B, el promedio es de 78 microgramos con una desviación estándar de 1. ¿Existe diferencia en el nivel de plomo en la sangre de los habitantes de cada ciudad, a un nivel de significancia de 0.01?
2.           Una compañía telefónica brinda dos tipos de servicios, plan y prepago, y desea saber si existe diferencia entre el número de minutos utilizados mensualmente en cada servicio. En el caso de los usuarios del servicio de plan se tomó una muestra de 36 personas y se encontró que en promedio de minutos fue de 237 con una desviación estándar de 8.7. De los usuarios de prepago se tomó una muestra de 41 y en promedio fue de 248 con una desviación estándar de 10.4. Compruebe la hipótesis con un nivel de significancia de 0.01.

Se desea probar si el salario medio mensual de los empleados oficinistas de 2 empresas del ramo de servicios turísticos son iguales o no, con un nivel de significancia de 1%. Para ello, se toman muestras de ambas y los datos correspondientes se resumen en el siguiente cuadro:

Datos
Muestra empresa 1
Muestra empresa 2
Tamaño n
= 50
= 60
Media
6000
5850
2 Desv. Estándar
300
214




REFERENCIAS



PRUEBA DE HIPÓTESIS : CASO III


CASO 3: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES
Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaños n 1 y n 2, para observar una característica o cualidad, se puede comparar el comportamiento de dicha característica en las poblaciones a través de la diferencia de proporciones.
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o pequeño.
Esta prueba comprende el cálculo del valor estadístico de prueba Z.












EJERCICIO RESUELTO

En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:













Como en los datos aparece el tamaño de la población, se debe verificar si el tamaño de la nuestra es mayor que el 5%. Se reemplaza valores en la siguiente fórmula:





















Decisión:





EJERCICIO PROPUESTO
Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74 por ciento tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto, el banco desarrollará un paquete especial de servicios para este grupo. La administración quiere determinar si el porcentaje verdadero es mayor del 60 por ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron ingresos de $200,000 o más al año.

REFERENCIAS

PRUEBA DE HIPÓTESIS: CASO IV


CASO 4: PRUEBA DE HIPÓTESIS PARA DIFERENCIAS ENTRE DOS PROPORCIONES.
Algunas veces estamos interesados en analizar la diferencia entre las proporciones de poblaciones de grupos con distintas características. Por ejemplo, pensemos que la administración de las tiendas Oxxo cree, sobre la base de una investigación, que el porcentaje de hombres que visitan sus tiendas 9 o más veces al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo. Las especificaciones requeridas y el procedimiento para probar esta hipótesis es la siguiente:
Las hipótesis nula y alternativa son las siguientes:
, la proporción de hombres que reportan 9 o más visitas por mes es la misma o menor que la proporción de mujeres que hacen lo mismo.
, la proporción de hombres que reportan 9 o más visitas por mes es mayor a la proporción de mujeres que hacen lo mismo.

EJERCICIO RESUELTO
La información proporcionada es:


1.      Especifica el nivel de significación de  
 El valor crítico para la prueba de una sola cola es de 1.64.
2.      Estima el error estándar de la diferencia de las dos proporciones:

donde:



PH = proporción muestra de hombres (H)
PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres
Por lo tanto:

3.      Calcula de prueba estadística:

La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor crítico Z. La administración no puede concluir con un 95 por ciento de confianza que la proporción de hombres que visita 9 o más veces los Oxxo es mayor que la proporción de mujeres.

SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de proporciones. Probemos si el porcentaje de hombres dueños de microempresas es estadísticamente diferente del porcentaje de mujeres.

La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el valor crítico Z. Podemos concluir que el porcentaje de hombres dueños de microempresas es estadísticamente superior al porcentaje de mujeres propietarias de microempresas.

EJERCICIO PROPUESTO
A una muestra a nivel nacional (en Estados Unidos) de ciudadanos influyentes de los partidos republicano y demócrata, se les preguntó entre otras cosas, si estaban de acuerdo con la disminución de los estándares ambientales para permitir el uso del carbón con alto contenido de azufre como combustible. Los resultados fueron:
                                       Republicanos               
 Demócratas 
Cantidad muestreada              1000
Cantidad a favor                       200 
 800
 168

¿Al nivel de significancia 0,02, puede decirse que hay una proporción mayor de Demócratas a favor de reducir los estándares?


REFERENCIAS


http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T08.pdf
http://www.stadcenterecuador.com/estadisticas/ejercicios/17-sp-762/26-ejercicios-resueltos-prueba-de-hipotesis-para-proporciones
https://www.profesor10demates.com/2015/03/distribucion-de-poisson.html
http://www3.uji.es/~mateu/t4-alumnos.pdf
https://es.scribd.com/document/352040872/Prueba-de-Hipotesis-Para-La-Diferencia-de-Proporciones