Pruebas de Hipótesis




descargar 1.56 Mb.
títuloPruebas de Hipótesis
página1/19
fecha de publicación14.01.2016
tamaño1.56 Mb.
tipoPruebas
med.se-todo.com > Derecho > Pruebas
  1   2   3   4   5   6   7   8   9   ...   19






Metodos Estadisticos

  1. Pruebas de Hipótesis

  2. Análisis de la Varianza

  3. Estadística No-Parametrica

  4. Regresión Lineal

  5. Pronósticos


Tema 1 Pruebas de Hipótesis.

  • Hipótesis Estadísticas Definiciones

  • Pasos de Las Pruebas de Hipótesis

  • Contraste Bilateral

  • Potencia de la Prueba

  • Comparación de Medias

  • Diferencia de Varianzas






369[1]
Prueba de hipótesis

Hipótesis estadísticas

Un objetivo de la Estadística es hacer inferencias con respecto a parámetros poblacionales desconocidos, basadas en la información obtenida de muestras, estas inferencias se expresan como estimaciones de los parámetros respectivos o como pruebas de hipótesis referentes a sus valores.

El test de hipótesis es una herramienta ampliamente utilizada para comparar mediciones y tomar decisiones basadas en una probabilidad, se debe decidir si, con los datos de la muestra, se puede caracterizar a la población. 

Se puede distinguir entre dos tipos de hipótesis: Paramétricas que se refieren a conjeturas sobre el parámetro de una distribución y No- paramétricas que responden a afirmaciones sobre la data.
Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.

La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.
Partes de una hipótesis
1-La hipótesis nula “Ho”
2-La hipótesis alternativa “H1
3-El estadístico de prueba
4-Errores tipo I y II
5-La región de rechazo (crítica)
6-La toma de decisión
Definiciones

El test de hipótesis

Es una herramienta ampliamente utilizada para comparar mediciones y tomar decisiones basadas en una probabilidad. Se debe decidir si, con los datos de la muestra, podemos caracterizar a la población. 

Estadística de Prueba

Es una función de la muestra, en base a la información contenida en esta función se decide respecto de la aceptación o rechazo de H0.

Región Crítica

Define los valores del estadístico de Prueba para los cuales se contradice H0.

El nivel de significación P (o P-valor)

La significación estadística o el nivel de significación (p- valor) es una medida del grado en el cual los resultados obtenidos son verdaderos, en el sentido que los resultados obtenidos por medio de muestras sean extensibles a la población, el nivel de significación de un test es un estadístico asociado a la verificación de una hipótesis.
El nivel de significación mide la probabilidad de cometer error al aceptar los resultados obtenidos en un procedimiento como resultados generalmente validos, es decir validos para toda la población

El nivel de significación es equivalente al Error Tipo 1 (alfa: Probabilidad de rechazar la hipótesis nula dado que esta es verdadera), (decisión conocida como error de tipo I, o "falso positivo").

Si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto menor sea el valor P, más significativo será el resultado.

Un valor alto del p-valor representa una menor confianza en que los resultados obtenidos con la manipulación de la muestra sean equiparables a los de la población.

El nivel de significación mide la probabilidad de cometer error al aceptar los resultados obtenidos en un procedimiento como resultados generalmente validos, es decir validos para toda la población

Un p-valor de 0.05 se interpreta como que existe el 5% de probabilidad de que las relaciones encontradas entre las variables a partir de la manipulación de muestras hayan sido debidas al puro azar, a la pura suerte (“de Chiripa”) Si se asume que en la población no existe relación entre las variables.

Un nivel de significancia de 5% indica que se debe esperar hasta 20 repeticiones para que aparezca un experimento donde existan entre las variables relaciones mucho más significativas que las que se pudieran encontrar en las anteriores replicas del experimento.

En muchas áreas técnicas el nivel mínimo de significación se ha establecido en 5%, en otras más exigentes como el área científica o de investigación científica requieren de 1% y otras hasta de 0.1%.

Pasos para contrastar Hipótesis

Cuando se tiene que contrastar una hipótesis estadística es conveniente seguir un esquema, el cual debe incluir las siguientes etapas:

  • Plantear unas hipótesis.

  • Conocer la distribución del estadístico plantear unas hipótesis.

  • Escoger un estadístico concreto.

  • Enunciado de la hipótesis nula y alternativa

  • Elección del nivel de significación 

  • Selección del estadístico de prueba.

  • Determinación de la región crítica.

  • Cálculo del estadístico.

  • Exposición de las conclusiones.


Contraste de medias
Con la notación que habitualmente se utiliza en el contraste de hipótesis tendremos que μ es la media de la población, σ la desviación típica de la población, s la desviación típica de la muestra, n es el tamaño de muestra, X la media de la muestra, y Z o t es el estadístico.

Existen diversos tipos de contrastes de hipótesis, se consideraran ejemplos de dos de ellos, que son el contraste de medias y el contraste de diferencias de medias. En el contraste de medias, suelen emplearse dos tipos de pruebas, los tests unilaterales o los tests bilaterales
Pasos para realizar una prueba de hipótesis

1-.Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral

H0=k

H1 ≠ k


Unilateral

H0≥ k

H1 < k

H0 ≤k

H1> k



2.
 Determinar, la zona de aceptación ( zα/2 (bilaterales), o zα (unilaterales)). El valor del parámetro muestral (x o p'), a partir de un nivel de confianza 1 − α o el de significación α.

3. Calcular: x o p', a partir de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza.


Contraste bilateral

Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).
gráfica

El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.

La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad para x o p', es decir:

[o también: [
La desviación típica del número de derrames de petróleo que ocurren en el lago de Maracaibo es 2,4. Para una muestra de 36 días se obtuvo una media de derrames de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que el número promedio de derrames en un año fue de 6, con un nivel de confianza del 95%?
1. Enunciamos las hipótesis nula y alternativa:

H0: μ = 6      La media de derrames no ha variado.

H1: μ ≠ 6      La media de derrames si ha variado

2. Zona de aceptación

Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.

Determinamos el intervalo de confianza para la media:

(6-1,96 ·  0,4 ; 6+1,96 ·  0,4) = (5,22 ; 6,78)
3. Verificación.

Valor obtenido de la media de la muestra: 5,6 .
4. Decisión

Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.


Contraste unilateral

Caso 1

La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).

Valores críticos

1 − α

α

z α

0.90

0.10

1.28

0.95

0.05

1.645

0.99

0.01

2.33


gráfica

El nivel de significación α se concentra en una parte o cola.

La región de aceptación en este caso será:

[o también: [
Se ha pronosticado, que en una determinada ciudad, el nivel de abstención en las próximas elecciones será del 40% como mínimo. Se elige al azar una muestra aleatoria de 200 votantes, con derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar con un nivel de significación del 1%, si se puede admitir el pronóstico.
1. Enunciamos las hipótesis nula y alternativa:

H0: μ ≥ 0.40      La abstención será como mínimo del 40%.

H1: μ < 0.40     La abstención será como máximo del 40%;
2. Zona de aceptación

Para α = 0.01, le corresponde un valor crítico: zα = 2.33.

Determinamos el intervalo de confianza para la media:

= ( 0.3192, ∞ )

3. Verificación.


4. Decisión

Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de significación del 1%, que la  La abstención será como mínimo del 40%.
Caso 2

La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ > k (o bien H1: p > k).


El nivel de significación α se concentra en la otra parte o cola.

La región de aceptación en este caso será:

[-∞, o también: [-∞,
El voltaje en una zona es, como máximo, de 120 voltios con una desviación típica de 40. Se toma una muestra de 100 y se obtiene que la media es de 128 v

¿Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación de que el voltaje es menor de 120 v ?

1. Enunciamos las hipótesis nula y alternativa:

H0 : μ ≤ 120

H1 : μ > 120
2.Zona de aceptación

Para α = 0.1, le corresponde un valor crítico: zα = 1.28 .

Determinamos el intervalo de confianza:

[-∞, 120 = ( -∞, 125.12 )gráfica

3. Verificación.

Valor obtenido de la media de la muestra: 128 v
4. Decisión

No aceptamos la hipótesis nula H0. Con un nivel de significación del 10%.
Región crítica.

Tipos de errores

En la práctica el Contraste de Hipótesis consiste en estudiar si un estadístico que es función de las observaciones de la muestra está dentro de una región llamada de aceptación, o se encuentra en la región de rechazo o región crítica, de tal forma que si el estadístico se encuentra en la región de aceptación se aceptará la hipótesis nula y si cae en la región de rechazo se rechazará dicha hipótesis.

El estadístico muestral es un fenómeno aleatorio, por lo que pudiera ocurrir que aunque la Ho fuera cierta, el estadístico se encontrara en la región de rechazo, en esta situación estaríamos cometiendo un Error de Tipo I (α).
Otra posible situación sería encontrar el estadístico en la región de aceptación siendo la Ho falsa, con lo que cometeríamos un Error Tipo II (β).
La forma de minimizar este problema es empleando muestras de tamaño grande. Generalmente se procede fijando una probabilidad de error α. Al valor α se le denomina nivel de significación y habitualmente es del 5%.

Aunque existen diversos tipos de contrastes de hipótesis, únicamente explicaremos y pondremos ejemplo de dos de ellos, que son el contraste de medias y el contraste de diferencias de medias.
El propósito de cualquier test de hipótesis es decidir cual hipótesis - la nula o la alternativa - sería rechazada. Ya que cualquier decisión estará basada sobre información parcial de una población, contenida en una muestra, habrá siempre una posibilidad de una decisión incorrecta. La siguiente tabla resume cuatro posibles situaciones que pueden surgir en un test de hipótesis.
Si la hipótesis nula es rechazada y de hecho, la hipótesis nula es verdadera, se cometió un error, que se llama Error de tipo I ().

Un Error de tipo II () ocurriría si la hipótesis nula fuera aceptada y de hecho, la hipótesis alternativa es verdadera.

Ya que nunca se puede eliminar la posibilidad de cometer un error de tipo I o un error de tipo II cuando se usan muestras para hacer inferencias, se considerarán las posibilidades de cometer estos errores.

= P (error de tipo I)

P (rechazar H0 si H0 es verdadera)

 = P (error de tipo II)

P (aceptar H0 si H0 es falsa)

Es deseable que tanto  como  estén próximos a cero pero en general esto no es posible, ya que el experimentador desea concluir que H1 es verdadera (rechazar H0 ) el interés está en que tenga una probabilidad pequeña tal como 0,01 ó 0,05.
Se desea estar seguro que si H0 es verdadera, será muy raro que sea rechazada. El experimentador es libre de elegir el valor de  , esto es, determinar cuán raro un suceso observado debe ser para rechazar H0. Determinar si el valor de  estará presente para el test de hipótesis es algo más complicado, de modo que no se intentará su cálculo.
Manteniendo  pequeño se evita aceptar la hipótesis de investigación (alternativa) si la hipótesis nula es verdadera. De otra forma se induciría a la crítica de que se ha sesgado la investigación para probar la alternativa. El sacrificio de mantener  pequeña es que la "chance" de aceptar la hipótesis nula, si la hipótesis de investigación es verdadera (), puede ser mayor de lo que se desea.

En el ejemplo considerado H0 :  = 180 gramos, H1 :  ≠ 180 gramos

Suponiendo que los resultados del experimento produjeron una media muestral de 187 gramos, el test estadístico se construiría como:
z = z = = = 1.65
donde : 187 = media de la muestra (http://www.fca.unl.edu.ar/inferest/image15.gif= 187)

180 = media hipotética (poblacional = 180)

30 = desvío estándar poblacional (conocido) (=30)

50 = tamaño de la muestra o repeticiones (n=50)
Para decidir si la hipótesis nula (H0) se rechaza o no se compara el valor de z calculado ( 1,65) con el valor de z tabulado N (0,1), para un nivel de probabilidad  = 0,05.
Por tratarse de una prueba bilateral, indicado por la desigualdad de la hipótesis alternativa el valor de  se divide en dos  /2 = 0,025, lo que implica que la probabilidad con la que se busca el valor de z, en la tabla de la distribución normal es 0,975, el valor de z correspondiente a esta probabilidad es1,96.

Gráficamente las zonas de rechazo y aceptación serían:http://www.fca.unl.edu.ar/inferest/image17.gif


como el valor de z calculado= 1,65 es menor que l,96 o sea cae en la región de aceptación , no hay evidencias suficientes como para rechazar la hipótesis de que la media de la población es igual a 180.
Conclusión: la publicidad que hace el semillero de que el peso promedio es de 180 gramos, es correcta, aunque podría existir una probabilidad de error tipo II, si de hecho la media no fuera 180 gramos
Una vez realizado el contraste de hipótesis, se habrá optado por una de las dos hipótesis, la hipótesis nula o base H0 o la hipótesis alternativa H1, y la decisión escogida coincidirá o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro:




H0es cierta

H1es cierta

Se escogió H0

No hay error (verdadero positivo)

Error de tipo II (β o falso negativo)

Se escogió H1

Error de tipo I (α o falso positivo)

No hay error (verdadero negativo)

Si la probabilidad de cometer un error de tipo I está unívocamente determinada, su valor se suele denotar por la letra griega α, y en las mismas condiciones, se denota por β la probabilidad de cometer el error de tipo II, esto es:
P(escoger H1| H0 es cierta ) = a

P(escoger H0| H1 es cierta ) = b
Se denomina Potencia del contraste al valor 1-β, esto es, a la probabilidad de escoger H1 cuando esta es cierta: P(escoger H1| H1 es cierta ) = 1 - 
Cuando es necesario diseñar un contraste de hipótesis, sería deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeñas como fuera posible.
Para una muestra de tamaño prefijado, al disminuir la probabilidad del error de tipo I, (α), se incrementara la probabilidad del error de tipo II, (β). Se diseñan las pruebas de tal manera que la probabilidad α sea el 5% (0,05), a veces el 10% (0,1) o 1% (0,01). Para aumentar la potencia de la prueba, esto es, disminuir β, se aumenta el tamaño muestral.
Potencia de la Prueba

El concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo I, α, es preferible. Si se trata de contrastar dos hipótesis sencillas sobre un parámetro desconocido, θ, del tipo:

H0∈ 

Ha∈ 
Se trata de escoger entre todos los contrastes posibles con α prefijado aquel que tiene mayor potencia, esto es, menor probabilidad β de incurrir en el error de tipo II.En este caso el Lema de Neyman-Pearson garantiza la existencia de un contraste de máxima potencia y determina cómo construirlo.


Contraste uniformemente más potente

En el caso de que las hipótesis sean compuestas, esto es, que no se limiten a especificar un único posible valor del parámetro, sino que sean del tipo:
H0: ∈ 
H1 : ∈ 
donde y son conjuntos de varios posibles valores, las probabilidades α y β ya no están unívocamente determinadas, sino que tomarán diferentes valores según los distintos valores posibles de θ.

En este caso se dice que un contraste (x) tiene tamaño α si: = MaxP0 ((x))=0 

esto es, si la máxima probabilidad de cometer un error de tipo I cuando la hipótesis nula es cierta es α.

Se puede considerar β como una función de θ, puesto que para cada posible valor de θ en la hipótesis alternativa se tendría una probabilidad distinta de cometer un error de tipo II.
Se define entonces:(θ) = Po(∅(X) = 1 ) ∀θε,la función de potencia del contraste es entonces: Pot(θ) = 1 - (θ)∀θε,
Se dice que un contraste es uniformemente más potente de tamaño α cuando, para todo valor   Pot()es mayor o igual que el de cualquier otro contraste del mismo tamaño.





Contraste de diferencia de medias
Sean X1 y X2 dos medias muestrales de dos poblaciones. Los tamaños de cada una de estas muestras son n1 y n2 respectivamente.
Queremos observar si la diferencia entre las medias es significativa o no, es decir, comprobar si podemos aceptar que μ1 = μ2


Hipótesis nula H0: μ1−μ2 = 0

Hipótesis alternativa Ha: μ1−μ2 ≠ 0
Si las desviaciones de las poblaciones son desconocidas y sólo conocemos las desviaciones muestrales, tendremos que considerar la distribución t de Student en vez de la normal.
Prueba de hipótesis para la varianza

La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión de dispersión de datos.
1-Prueba de hipótesis a dos colas

H0 : 2 = k

H1 : 2 ≠ k
2-Prueba de hipótesis a una cola superior

H0 : 2 = k     ó     H0 : 2 http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/simbolos/menorigual.gif k

H1 : 2> k      ó     H1 : 2 > k
3-Prueba de hipótesis a una cola inferior

H0 : 2 = k     ó     H1 : 2> k

H0 : 2< k     ó     H1 : 2< k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida.
Si se utiliza la varianza sin corregir (2) la estadística de trabajo es la expresión:

T = ~Si se utiliza la varianza corregida, la estadística de trabajo es la expresión

T = ~

Regla de decisión para prueba de la varianza

Si se ha planteado la hipótesis alternativa como:

H1 : 2 ≠ k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia (  ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura

http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/curvas/3.8.jpg

Grafica de decisión para una prueba de hipótesis a dos colas

Zy  pertenecen a una distribución X2 con (n-1) grado de libertad.
Si el valor de la estadística de trabajo (T) está entre Z y Z1- no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 .
Si  Z < T < Z1- no se rechaza H0.

Si se ha planteado la hipótesis alternativa como: H1 : 2 > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia () en la parte superior de la distribución.

http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/curvas/3.9.jpg

Regla de decisión para una prueba de hipótesis a una cola superior

Z1-http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/simbolos/infinito.gif pertenece a una distribución X2 con (n-1) grado de libertad.
Si el valor de la estadística de trabajo (T) es menor que  z1-2no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Si T < z1-2 no se rechaza H0 .
Si se ha planteado la hipótesis alternativa como:H1 : 2 < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( α ) en la parte inferior de la distribución.

http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/curvas/3.10.jpg

Grafica de decisión para una prueba de hipótesis a una cola inferior
Z pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es mayor que Zhttp://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/simbolos/infinito.gif no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Si T > Z no se rechaza H0.
Ejemplo Se supone que los diámetros de cierta marca de válvulas están distribuídos normalmente con una varianza poblacional de 0,2 pulgadas 2 , pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas:
5,5     5,4     5,4     5,6     5,8     5,4     5,5     5,4     5,6     5,7

Con ésta información pruebe si lo que se cree es cierto.
Solución

Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:

H0 : 2 = 0,2

H1 : 2 > 0,2

Solución
n= 10 s2 = 0.0181 1 - a = 0.95http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/images/curvas/3.11.jpg
  1   2   3   4   5   6   7   8   9   ...   19

similar:

Pruebas de Hipótesis iconPruebas de Hipótesis

Pruebas de Hipótesis iconPruebas de Hipótesis 19

Pruebas de Hipótesis icon5. Pruebas de hipótesis 15

Pruebas de Hipótesis iconPruebas de hipótesis para una media

Pruebas de Hipótesis iconPruebas de hipótesis de dos poblaciones p. Reyes/Sept. 2007

Pruebas de Hipótesis iconTesis. > Hipotesis. A que se debe

Pruebas de Hipótesis iconContraste experimental de las hipótesis

Pruebas de Hipótesis iconGlobalización y hipótesis hechas realidad

Pruebas de Hipótesis iconPrimeras hipotesis hacia el mundo miscroscopico

Pruebas de Hipótesis iconHoracio Quiroga y La Hipótesis Técnico-Científica


Medicina



Todos los derechos reservados. Copyright © 2015
contactos
med.se-todo.com