Parámetros Estadísticos, Centralización: Ejercicio
Clase 15 de 28 • Curso de Probabilidad y Estadística 2018
Contenido del curso
Clase 15 de 28 • Curso de Probabilidad y Estadística 2018
Contenido del curso
Alessandri Fonseca
Richard Steven Parra
freddy Mejia
Ricardo Barrera Barr
Jhon Freddy Puentes Nuñez
Luis Fernando Pedroza Taborda
Usuario anónimo
MARCELA VALENZUELA GÓMEZ
Miguel Angel Ramos Rodríguez
Franco Martin
Lucas Mateo Aldana Briceño
Pedro Manuel Salas Galindo
Juan Alonso Alcala
Miguel Angel Guerrero Salinas
Kevin Vega
Miguel Angel Guerrero Salinas
Alfredo Gómez Delgado
Andrés Fernández
Faustino Correa Muñoz
Duvan Andres Giraldo Quiñonez
Josue Farley Lopez Carvajal
JESUS ANDRES JARA PUELLES
MARCELA VALENZUELA GÓMEZ
Andrés Madrigal
Ricardo Celis
Andrés Madrigal
Smerlyn Javier Eusebio Bonifacio
Luis E. Gama Ramirez
Andrés Madrigal
Lucas Mateo Aldana Briceño
Antonio Godoy
Iván Sabido
JAVIER sanchez
LUIS EDUARDO SALAMANCA GARCIA
Alejandro Tangarife Rivas
Lorena Perales Anaya
Santiago Pulido Peláez
Kevin Vega
Zois Ruggiero
Claudia A Sedano Porras
Calculo de la media y la mediana en python:
datos= [0,0,0,0,0,0,0,0,0,0,0,0,0 ,1,1,1,1,1,1,1,1,1,1 ,2,2,2,2,2,2,2 ,3,3,3,3,3,3 ,4,4] def media(datos): return sum(datos)/len(datos) def mediana(datos): if(len(datos)%2 == 0): return (datos[int(len(datos)/2)] + datos[int((len(datos)+1)/2)]) / 2 else: return datos[(len(datos)+1)/2] if __name__ == '__main__': print(media(datos)) print(mediana(datos))```
Que buen aporte
tuve un error en el else statement, que devuelve un float para acceder al array se soluciona de la siguiente forma:
return datos[int((len(datos)+1)/2)]
Hice un pequeño script (de rápido) en ruby para sacar la media, mediana y la moda
def media(elementos) suma = elementos.sum suma.to_f/elementos.size.to_f end def mediana(elementos) elementos.sort! half = (elementos.size/2).floor if elementos.size % 2 == 0 (elementos[half] + elementos[half + 1])/2 else elementos[half] end end def moda(elementos) data = {} elementos.each do |el| data[el] = 0 unless data[el] data[el] += 1 end data.max_by{|k, v| v}[0] end elementos = [3, 2, 0, 3, 0, 3, 0, 2, 0, 0, 3, 1, 1, 0, 1, 0, 1, 0, 2, 3, 0, 1, 0, 4, 1, 0, 2, 1, 3, 1, 1, 2, 1, 2, 0, 2, 4, 0, 0] puts "media: #{media(elementos)}" puts "mediana: #{mediana(elementos)}" puts "moda: #{moda(elementos)}"
Media, Mediana y Moda en Python con librerias:
import numpy as np from scipy import stats dataset= [0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,2,3,4,5,6,6,7] #mean value mean= np.mean(dataset) #median value median = np.median(dataset) #mode value mode= stats.mode(dataset) print("Mean: ", mean) print("Median: ", median) print("Mode: ", mode)
Genial aporte jfpuestes.
Excelente manera de explicar todo, he disfrutado cada vídeo recordando estos temas vistos en la U.
¡Muchas gracias! En serio lo hago con amor 🙈
Yo quiero decir eso en cada video, me encanta esta profesora enseña muy bien, casi no tengo dudas!, como me hubiera gustado haber tenido una profesora así en la Universidad 😃.
En parte uso Platzi para adelantarme a las clases de la universidad y eso me da más interés y compresión del tema ya que lo vi antes.
Buen método de estudio, refuerzas los temas y de paso aseguras un buen promedio ;)
con pandas .
# MEDIDAS DE TENDENCIA CENTRAL data = [3,2,0,3,0,3,0,2,0,0,3,1,1,0,1,0,1,0,2,3,0,1,0,4,1,0,2,1,3,1,1,2,1,2,0,2,4,0] df_medida_tendencia_celtral = pd.DataFrame(data) # MEDIA print(f'el promedio es : {df_medida_tendencia_celtral.mean()}') # MEDIANA print(f'la media es : {df_medida_tendencia_celtral.median()}') # MODA print(f'la moda es : {df_medida_tendencia_celtral.mode()}')
Me ahorraste la busqueda , gracias
Hice un peque;o programa en Python para calcular media, moda, mediana.
datos = [3, 2, 0, 3, 0, 3, 0, 2, 0, 0, 3, 1, 1, 0, 1, 0, 1, 0, 2, 3, 0, 1, 0, 4, 1, 0, 2, 1, 3, 1, 1, 2, 1, 2, 0, 2, 4, 0, 0] datos.sort() print("Cantidad de datos:", len(datos)) print("Elementos ordenados:", datos) total_goles = sum(datos) total_datos = len(datos) media = total_goles / total_datos #region Mediana # Par if (total_datos % 2 == 0): menor = int(total_datos / 2) mayor = int( (total_datos / 2) + 1) if (datos[menor] != datos[mayor]): mediana = float((datos[menor] + datos[mayor])/ 2) else: mediana = datos[menor] # Impar else: mediana = float( (datos[ int( (total_datos + 1) / 2) ])) #endregion #region Moda traduccion_datos = dict() for dato in datos: # Leera todos los datos. if (str(dato) in traduccion_datos): traduccion_datos[str(dato)] += 1 else: traduccion_datos[str(dato)] = 1 numero_mayor = traduccion_datos["0"] for dato in traduccion_datos: if (numero_mayor < traduccion_datos[dato]): numero_mayor = traduccion_datos[dato] moda = [dato for dato in traduccion_datos if(traduccion_datos[dato] == numero_mayor)] #endregion print("Numero más repetido fue repetido", numero_mayor, "veces") print("La moda es:", moda) print("Total:", total_goles) print("Media o media aritmetica:", media) print("Mediana:", mediana)
En este ejercicio con esos valores: Media : 1,28 Mediana:1 Moda:0 Correcto?
Tendría que estar de vuelta en casa para revisar, lo siento compañero :(.
¿de que me sirve saber la mediana? ¿o saber cual posicición se encuentra justo en la mitad?
¡Hola! Mira la figura que adjunto.
El tema con la media es que si tienes una cola muy larga en tu distribución (o bien outliers), éstos van a afectar la media, es decir, un solo valor muy alto/bajo puede desplazar la media considerablemente. En cambio la mediana toma en consideración los outliers pero no su magnitud, por lo que se ve mucho menos afectada y representa mejor la tendencia central de los datos.
En síntesis, preferimos la mediana para excluir el efecto de los outliers .
¡Slaudos!
Por si solo no mucho, debes tener y analizar los parámetros estadísticos tanto de tendencia central y de dispersión para tomar desiciones o también saber interpretar lo que te quieran vender (clásico estudios de los periodicos). Un ejemplo donde se ve claramente es en los sueldos de un país, ejmeplo chile la media en sueldos de trabajadores contratados es 800.000 CLP pero la mediana es de 400.000 CLP, aunque con el promedio piensas que todos les va bien con sus 800 k CLP para cada uno en promedio la realidad es que la mitad de esa población gana 400 k CLP
Excelentes explicación, Muchsisismas gracias. :D
funciones en Python para calcular las 3 tendencias centrales:
def media(datos): return sum(datos)/len(datos) def mediana(datos): datos_sorted = sorted(datos) centro = len(datos_sorted)//2 return datos_sorted[centro] if len(datos) % 2 != 0 else media([datos_sorted[centro], datos_sorted[centro + 1]]) def moda(datos): index = {} for key in datos: if key in index: index[key] += 1 else: index[key] = 1 f = 0 x = 0 for k,v in index: if f < v: f = v x = k return (x, f) if __name__ == "__main__": data = [3,2,0,3,0,3,0,2,0,0,3,1,1,0,1,0,1,0,2,3,0,1,0,4,1,0,2,1,3,1,1,2,1,2,0,2,4,0] print(f'La media de los datos es {media(data)}') print(f'La mediana de los datos es: {mediana(data)}') print(f'La moda de los datos es: {moda(data)}')```
Marcela: Que dispositivo usas para escribir, se ve super chevre.
Es sólo una tableta xD Admito que mi letra se ve horrenda ahí jajajajaja
Tienen el archivo de esta clase?
Hola Andrés! en la sección de archivos están los ejercicios de esta clase y los ejercicios de práctica (tienen resultados para que compares tus respuestas)
Espero que te sea de mucha utilizad
Muchas gracias!
Estadísticas de Lionel Messi
Jugador de fútbol
BARCELONA
ARGENTINA
1 de 2
Copa del Rey
Año
Jugados
Goles
Asist.
2018-19 1 1 1 0 0 2017-18 6 4
1 0 2016-17 7 5
3 0 2015-16 5 5
1 0 2014-15 6 5
1
0
Messi metio un promedio de 1.31 GOLES por partido en la liga Temporada 2011/2012 …
Baia baia (─‿‿─)
Y la moda es 0 goles jajajaja
Un crack el hombre jajaja
¿Por qué la mediana suele salir inferir a la media? Porque, en este ejemplo, si hubiese coincidido que los valores centrales en vez de 1 y 1 hubiesen sido los dos 4, la mediana habría sido 4. O sea, que la mediana puede ser superior a la media, pero no suele ser así (al menos en los casos que yo he podido ver).
¿Por qué sucede esto o es solo una impresión mía?
Y, por otro lado, ¿para qué nos puede servir la mediana?
Quiero decir:
La moda nos podría servir para apostar a que Messi no va a marcar si nos obligan a elegir el número exacto de goles que va a marcar en un partido.
La media nos podría servir para apostar si Messi va a marcar o no (dando igual cuántos, al ser superior a 1 conviene apostar a que sí va a marcar, al contrario de en el caso anterior).
Pero en el caso de la mediana no veo la utilidad. Y la vería aún menos si hubiese coincidido que los dos valores en el medio hubiesen sido 4 y 4.
Dependiendo de tus datos podrías utilizar la media o la mediana, ya que la media se ve fuertemente influenciada por datos extremos, en cambio la Mediana es más robusta a la presencia de este tipo de datos. Por lo tanto, en esas situaciones podrías hacer uso de la mediana.
mediana = esta en el medio madia = promedio moda = dato que mas se repite
Buena clase!
Hola. Cómo resolvemos la Mediana por medio de la fórmula? :D. Vi que la profesora dejó de lado el método y continuó de una forma más sencilla.
Esa es por ahora la mejor forma de calcular la mediana. Cuando son pocos datos como ahora o no estamos tan avanzados en Probabilidad y estadística, realmente tenemos que contar todos los elementos hasta llegar a la posición indicada y la única operación que se ocupa es dividir el total de datos entre dos para saber qué posición vamos a buscar (y también sacar el promedio como lo hizo, en caso de que sean dos valores los que están a la mitad).
De igual forma te comparto este link donde sí muestran la fórmula para obtener la mediana, pero ya ocupa más elementos que no se han visto hasta este punto del curso: https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/mediana.html
Muy ilustrativo el ejemplo!
Hola, tengo una duda¿si la formula para hallar la media es x= (N+1)/2 la media no me debería dar 1.5?... aplicando x=(38+1)/2 ==>19,5...osea que mi media sería 1,5 no?
No, primero que la formula de la media que pusiste está mal (por el 1 ese que pusiste sumando al 38). La formula de la media es la suma de todas las observaciones dividido por el numero total de los datos que tenes. En el ejercicio que dieron era 50/38=1.31 . 50 es la suma de todos los goles 38 la cantidad de datos que tenes , osea los partidos en los que messi metio determinada cantidad de goles.
Tu definicion esta mal.