Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la




descargar 369.72 Kb.
títuloMuchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la
página1/6
fecha de publicación04.12.2015
tamaño369.72 Kb.
tipoDocumentos
med.se-todo.com > Documentos > Documentos
  1   2   3   4   5   6




UNIDAD 4

REGRESIÓN Y CORRELACIÓN
Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la relación entre variables. En algunos casos se confía en la intuición para juzgar cómo es la relación entre esas variables, pero, si se pueden obtener datos, se puede emplear un procedimiento estadístico llamado análisis de regresión para plantear una ecuación que muestre la manera como se interrelacionan las variables.
Ejemplos:

  • Evaluación del comportamiento de algunas variables del negocio de acuerdo al comportamiento de los indicadores financieros.

  • Tiempo de falla de un componente en función de la temperatura a la que es sometido.

  • Comportamiento en el tiempo de la demanda de un producto.

  • Consumo de energía en función de la temperatura ambiente promedio, la pureza promedio del producto y las toneladas de producto elaboradas.



La forma más simple para mostrar dicha relación es la construcción de un diagrama de dispersión, que es una gráfica en la que cada par (xi, yi) está representado con un punto en un sistema de coordenadas bidimensional. Este método puede ofrecer una idea base y por ello siempre es conveniente graficar los datos, pero es demasiado subjetivo y se limita sólo a dos variables (o máximo a tres).
En la mayoría de aplicaciones se debe hacer una distinción entre las variables en lo que respecta a su papel en el experimento, así:

  • Variable dependiente o respuesta (Y): No se controla en el experimento; es, entonces, una variable aleatoria.

  • Variables independientes o regresoras (X): Se controlan en el proceso y, por lo tanto no son variables aleatorias.


El análisis de regresión evalúa casos en que existe una sola variable respuesta y una o varias variables regresoras (x1, x2,..., xk).
La relación que se ajusta a un conjunto de datos experimentales se caracteriza con una ecuación, que se denomina ecuación de regresión y describe en forma razonable el comportamiento de la variable respuesta, dados los valores de las variables de regresión.
Obviamente, para un valor dado de x, es imposible predecir exactamente un valor de y; sin embargo, es posible predecir el valor promedio de y para todos los individuos para los cuales x vale lo mismo. En otras palabras, para cada valor de x existe una distribución de Y y lo que se busca es esa distribución, dado x.
Si sólo se evalúa la relación entre una variable regresora y una variable respuesta, se habla de regresión simple. Si las variables independientes son varias, se hablaría de regresión múltiple.

1. REGRESIÓN SIMPLE

El caso más sencillo de una regresión simple ocurre cuando se da una relación lineal entre ambas variables. Si esto sucede, es razonable suponer que la media de la variable aleatoria Y está relacionada con x por:



E(Y\x) =  + x,
donde  representa la intersección con la ordenada y  es la pendiente de la línea; ambos se denominan coeficientes de regresión. Recordemos que la pendiente cuantifica el cambio promedio en Y correspondiente a un cambio unitario en X

Cabe aclarar que generalmente unos datos experimentales no forman exactamente una línea recta; por lo tanto, para un valor fijo de x, el valor real de y está determinado por la media de la función lineal más un término que representa un error aleatorio. Lo anterior puede expresarse de la siguiente forma:
Y =  + x + 
La ecuación de regresión debe ser una recta promedio y, por lo tanto, µ= 0. De aquí que el valor estimado de y está dado por:

donde A y B son las estimaciones de  y , respectivamente.

Método de mínimos cuadrados:
Si se tienen n pares de observaciones (x1, y1), (x2, y2), ........, (xn, yn), el mejor ajuste se logra si se minimiza la suma de los cuadrados de las diferencias entre los valores observados de la variable respuesta y aquellos proporcionados por la ecuación de predicción; dichas diferencias son llamadas errores o residuales.
Esa suma se denota con SSE. Podría escribirse, entonces:

Al diferenciar SSE con respecto a A y luego con respecto a B, se obtiene:



Si se iguala cada ecuación a cero, se obtienen las ecuaciones normales:


Resolviendo esas ecuaciones, se obtiene que:





EJEMPLO 4.1.

Se tomaron datos del voltaje y la corriente de un transformador monofásico con el

devanado secundario en corto. Se obtuvieron los siguientes resultados:


Vp(V)

1

2

5

7

8

10

12

15

20

25

(x)

Ip(A)

0.7

2.5

7.9

9.6

10.5

14.1

17.8

23

31.5

38.6

(y)


a) Elabore un diagrama de dispersión.

b) Encuentre la ecuación de la recta ajustada.

c) ¿Qué valor de corriente se podría esperar si se aplica un voltaje de 18V?
Solución:
a)




b)


Por tanto:

En consecuencia, y = -1.096 + 1.592x, lo cual implica que por cada voltio adicionado se esperaría un aumento en la corriente de 1.592A.
c) En este caso: y = -1.096 + 1.592 (18)

y = 27.6A
Es decir, si se aplica un voltaje de 18V la corriente esperada sería 27.6A






EJEMPLO 4.2.

A continuación se encuentran los datos recopilados por un gerente de ventas acerca de los años de experiencia de los 10 vendedores de la empresa y el monto de las ventas mensuales –en millones de pesos-:


Vendedor

Años de experiencia

Ventas anuales

(millones de pesos)

1

1

80

2

3

97

3

4

92

4

4

102

5

6

103

6

8

111

7

10

119

8

10

123

9

11

117

10

13

136


a) Elabore un diagrama de dispersión, con los años de experiencia como la variable independiente.

b) Encuentre una ecuación estimada de regresión con la que se puedan predecir las ventas mensuales de un vendedor, dados sus años de experiencia.

c) Use dicha ecuación para predecir las ventas mensuales de un vendedor con 9 años de experiencia.

Solución:
a)



Se observa que existe una relación directa entre ambas variables, es decir, tiende a presentar mayores ventas mensuales un vendedor que tiene más años de experiencia.

b)
Por tanto:

En consecuencia, y = 80 + 4x, lo cual implica que por cada año de experiencia adicional se esperaría que la persona venda 80 millones de pesos más al mes.


c) En este caso: y = 80 + 4x

y = 80 + 4(9)

y = 116 millones de pesos




El análisis de regresión no se puede interpretar como un procedimiento para establecer una relación de causa-efecto entre variables; sólo puede indicar cómo están asociadas las variables entre sí. Cualquier conclusión acerca de causa y efecto se debe basar en un juicio que parta del conocimiento de la situación.
El grado de interconexión entre variables se define como correlación y es estimado mediante el coeficiente de correlación (r), que se encuentra siempre en el intervalo ; valores cercanos a esos límites indican una fuerte relación lineal, mientras que si se acerca a cero, la relación es débil.
Un valor positivo de r indica una relación directa entre las variables, mientras que un valor negativo de él indica una relación inversa.
La adecuación del modelo de regresión se puede medir con el coeficiente de determinación (R2), que es el cuadrado del coeficiente de correlación y expresa la proporción de la variación total en los valores de la variable Y que se puede explicar mediante una relación lineal con los valores de X.
El coeficiente de correlación muestral se evalúa como:

y es una medida de la relación lineal entre las dos variables, por lo que un valor de r igual a cero implica falta de linealidad y no necesariamente falta de asociación.


EJEMPLO 4.3.

Hallar el coeficiente de correlación y el coeficiente de determinación entre las variables del ejemplo 4.2.
Solución:
R2 = 0.93038

Esto implica que el 93% de la variación en los valores de Y se explica por una relación lineal con X.




EJEMPLO 4.4.

Retomemos los tiempos requeridos por los programadores que utilizan el lenguaje 3 (base de datos utilizada en la unidad 1) y adicionemos el tiempo que se demora cada uno de ellos con un lenguaje determinado (X)


t requerido con leng. 3

(minutos)

t requerido con leng. X

(minutos)

12

15

12

19

14

24

15

18

15

15

18

16

18

18

20

24

22

12

24

15

29

20
  1   2   3   4   5   6

similar:

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconTaller filosófico el logos
«filósofos de la naturaleza» porque, ante todo, se interesaban por la naturaleza y por sus procesos. Ya nos hemos preguntado de dónde...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconMuchas veces nos interesa observar el movimiento de un cuerpo globalmente,...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconEn la búsqueda de mejoras o en la solución de problemas es necesario,...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconEncomiéndate a Dios de todo corazón, que muchas veces suele llover...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconResumen diferenciando entre factores extrínsecos o intrínsecos, son...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconResumen diferenciando entre factores extrínsecos o intrínsecos, son...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconFÍsica nueva, ideas filosóficas en la
«Anuario filosófico de la Univ de Navarra» III, 1970, 329-350. Muchas veces se confunden las expresiones «Física moderna» y «Física...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconMuchas veces se piensa que el maquillaje consiste tan solo en la...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconEste libro -suponiendo que sea un libro- data Comenzó a publicarse...
«reales», va aumentando su imprecisión, su torpeza y confusionismo. Dóciles al prejuicio inveterado de que hablando nos entendemos,...

Muchas veces es necesario expresar la naturaleza de la relación existente entre dos o más variables; igualmente, muchas decisiones gerenciales se basan en la iconAlgunos aspectos comunes entre la vida mental del hombre primitivo y los neuróticos
«Todavía muchas cosas; quizá todo lo principal.» Mas por ahora le sería imposible captar esto, lo esencial, con claras palabras;...


Medicina



Todos los derechos reservados. Copyright © 2015
contactos
med.se-todo.com