Coeficiente de Correlación en un Diagrama de Dispersión

Clase 20 de 28 • Curso de Probabilidad y Estadística 2018

Contenido del curso

Introducción

Probabilidad Simple

4
Cálculo de probabilidades
15:51 min

Probabilidad Compuesta

Distribución de Datos

Medidas de Tendencia Central

Medidas de Dispersión

Medidas de Posición

Regresión Lineal

Importante: antes del examen

28
Examen de certificación
03:28 min

Tomar examen

Hector Vasquez

student•

Dejo mi código en python, con comentarios, que calcula el coeficiente de correlación, mostrando los cálculos en pantalla:

# -*- coding: utf-8 -*-
from functools import reduce
import math

def media(lista):
  # Calcular la media de una lista de elementos
  return reduce( lambda a, b: a + b, lista ) / len(lista)

def cuadrado(x):
  return x*x

def varianza(lista, valMedia):
  # Sumo los resultados del cuadrado de la resta de la media total, menos cada valor de la lista, dividido por la cantidad de elementos de la lista
  return reduce( lambda a, b: a + b, list(map( lambda x: cuadrado(valMedia - x), lista )) ) / len(lista)

def desviacionEstandar(varianza):
  # Obtener raíz cuadrada de la varianza
  return math.sqrt(varianza)

def sumatoriaXY(lista):
  # Sumar todos los valores de X y retornar resultado. Lo mismo con Y
  return reduce( lambda a, b: (a[0] + b[0], a[1] + b[1]), lista )

def sumatoriaMediaMenosVal(lista, mediaX, mediaY):
  # Sumar todos los resultados de restar X con la media de X, y restar Y con la media de Y
  return reduce( lambda a, b: a + b, list(map( lambda x: (x[0] - mediaX) * (x[1] - mediaY), lista )) )

def covarianza1(lista):
  # Cantidad de elementos en la lista
  lenLista = len(lista)

  # Obtener la media de X y la media de Y
  valSumatoriaXY = sumatoriaXY(lista)
  mediaX = valSumatoriaXY[0] / lenLista
  mediaY = valSumatoriaXY[1] / lenLista
  print('Media de X: {}'.format( mediaX ))
  print('Media de Y: {}'.format( mediaY ))

  valSumatoriaMediaMenosVal = sumatoriaMediaMenosVal(lista, mediaX, mediaY)
  print('{} / {}'.format( valSumatoriaMediaMenosVal, lenLista ))

  # Dividir el resultado de arriba, con la cantidad de elementos de la lista
  return valSumatoriaMediaMenosVal / lenLista

def sumatoriaXPorY(lista):
  # Sumar el resultado de la multiplicación de todos los valores X e Y
  return reduce( lambda a, b: a + b, list(map( lambda x: x[0] * x[1], lista )) )

def covarianza2(lista):
  
  valSumatoriaXPorY = sumatoriaXPorY(lista)

  # Cantidad de elementos en la lista
  lenLista = len(lista)

  # Obtener la media de X y la media de Y
  valSumatoriaXY = sumatoriaXY(lista)
  mediaX = valSumatoriaXY[0] / lenLista
  mediaY = valSumatoriaXY[1] / lenLista
  print('Media de X: {}'.format( mediaX ))
  print('Media de Y: {}'.format( mediaY ))

  # Dividir el resultado de arriba, con la cantidad de elementos de la lista
  # Luego restar la multiplicación de la media de X y la media de Y
  print('({} / {}) - ({} * {})'.format( valSumatoriaXPorY, lenLista, mediaX, mediaY ))
  return (valSumatoriaXPorY / lenLista) - (mediaX * mediaY)


def coeficienteCorrelacion(lista):
  listaX = list(map( lambda x: x[0], lista ))
  listaY = list(map( lambda x: x[1], lista ))
  valCovarianza = covarianza2(lista)
  print('Covarianza: {}'.format(valCovarianza))
  valVarianzaX = varianza(listaX, media(listaX))
  print('Varianza X: {}'.format(valVarianzaX))
  valDesviacionX = desviacionEstandar(valVarianzaX)
  print('Desviación Estandar X: {}'.format(valDesviacionX))
  valVarianzaY = varianza(listaY, media(listaY))
  print('Varianza Y: {}'.format(valVarianzaY))
  valDesviacionY = desviacionEstandar(valVarianzaY)
  print('Desviación Estandar Y: {}'.format(valDesviacionY))

  print('{} / ({} * {})'.format(valCovarianza, valDesviacionX, valDesviacionY))
  return valCovarianza / ( valDesviacionX * valDesviacionY )

if __name__ == '__main__':
  # Lista de datos de ejemplo (X, Y)
  lista = [(3,4), (4,3), (5,2), (6,1)]
  print('lista: {}'.format(lista))
  print('Coeficiente de Correlación: {}'.format( coeficienteCorrelacion(lista) ))```

Andrés Madrigal

student•

que buena trabajada jaja

Luis Fernando Pedroza Taborda

student•

Excelente codigo Hector, mucha gracias

Nico Jara

company_admin•

Diego Forero

Team Platzi•

Francisco Leví Méndez Delgado

Maximiliano Rodríguez Porras

MARCELA VALENZUELA GÓMEZ

teacher•

Cristian Orozco Benjumea

Wilson Fernando Antury Torres

Joaquin Villamediana

Guillermo Jonathan Salas Montenegro

Diana Mildred Galindo

JESUS ALBERTO CARREÑO MARTINEZ

Nico Quiroz

Julian David Colorado Jaramillo

Luis Ruiz Ramos

Luis E. Gama Ramirez

Ricardo Celis

Aaron Quiroga

José Luis Gómez Rojas

Xavier Sebastian Vaca Ordoñez

Felipe Andrés González Quintero

Omar Fernando López Olivas

Jesús Joel Sarabia Félix

JAVIER SANTIAGO SALGADO

Usuario anónimo

user•

Manuel Alejandro Aguilar Téllez Girón

LUIS FERNANDO CASTAÑEDA CASTRO

Luis Fernando Úbeda Camacho

Smerlyn Javier Eusebio Bonifacio

Héctor Daniel Vega Quiñones

Ricardo Rosas Esquivel

Armando González Esquivel

Coeficiente de Correlación en un Diagrama de Dispersión

Introducción

¡Antes de comenzar lee esto! Curso en renovación

Introducción al curso de Probabilidad y Estadìstica

Conceptos Básicos

Probabilidad Simple

Cálculo de probabilidades

Probabilidad Compuesta

Probabilidad Compuesta y Diagramas de Árbol

Probabilidad compuesta: Unión

Probabilidad compuesta: Intersección

Variaciones, permutaciones y combinaciones

Variaciones, permutaciones y combinaciones: Ejercicios

Distribución de Datos

Tabla de Frecuencias

Tablas de Frecuencia en Distribución de Datos: Ejercicios

Tablas de Frecuencia Gráficas

Medidas de Tendencia Central

Gráfica de Dispersión

Parámetros Estadísticos, Centralización

Parámetros Estadísticos, Centralización: Ejercicio

Tipos de Correlación Y Covarianza

Medidas de Dispersión

Rango

Desviación Media

Varianza y Desviación Estándar