3. CORRELACIÓN
La correlación es la relación que existe entre dos variables estadísticas unidimensionales que constituyen una variable estadística bidimensional.
La llamada nube de puntos proporciona una primera aproximación al grado de correlación que hay entre las variables estadísticas. La correlación puede ser:

  • Lineal si la nube de puntos está distribuida en torno a una línea.
  • Positiva o directa si a medida que crece una variable, también lo hace la otra.
  • Negativa o inversa a medida que aumenta una variable, disminuye la otra.
  • Curvilínea si la nube de puntos está distribuida alrededor de una curva.
  • Nula cuando no existe ninguna relación entre las variables.

   

MEDIDA DE LA CORRELACIÓN
Al estudiar las distribuciones marginales, cada una de las variables estadísticas que forman la distribución bidimensional, puede ser analizada independientemente. Así es posible calcular la media y la desviación típica de la variable estadística.

Se define la covarianza de una variable bidimensional (X,Y), como la media aritmética del producto de las desviaciones de cada una de las variables respecto de sus respectivas medias.


3.1 REGRESIÓN LINEAL. COEFICIENTE DE PEARSON
Una forma de cuantificar la correlación lineal entre dos variables es mediante el cálculo del coeficiente de correlación lineal de Pearson, r, que viene dado así:

Está comprendido entre -1 y +1 y tiene el mismo signo que la covarianza:
  • Si -1<r<0, la correlación es negativa y será mas fuerte cuanto más se aproxime a -1,
  • Si 0<r<1, la correlación es positiva y será mas fuerte cuanto más se aproxime a 1.
  • Si r=0, no existe una correlación.
  • Si r=1 o r=-1, existe una dependencia funcional lineal (el valor de una variable determina unívocamente el valor de la otra). No tiene sentido realizar un estudio estadístico bidimensional.



3.2 RECTAS DE REGRESIÓN

- La recta de regresión es la que mejor se ajusta a la nube de puntos. 
- La recta de regresión pasa por el punto {(\overline{x}, \overline{y})} conformado por las medias aritméticas de los valores de X y Y.
- El punto {(\overline{x}, \overline{y})} es llamado centro de gravedad.

RECTA DE REGRESIÓN DE y SOBRE x
La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de X.

La pendiente de la recta es el cociente entre la covarianza Sxy y la varianza S2X de la variable X.


RECTA DE REGRESIÓN DE x SOBRE y
La recta de regresión de X sobre Y se utiliza para estimar los valores de X a partir de los de Y.


La pendiente de la recta es el cociente entre la covarianza Sxy y la varianza  S2Y
 de la variable Y.

*Si la correlación es nula, esto es r = 0, las rectas de regresión son perpendiculares entre si.



     VÍDEOS DE AYUDA     

No hay comentarios:

Publicar un comentario