No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Estadística descriptiva

7/25
Recursos

Aportes 22

Preguntas 2

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

hay un error cuando se usa “ss.variation”.La profesora menciona que es la desviación estándar y no es cierto, ahí esta calculando lo que se conoce como coeficiente de variación que comúnmente se obtiene como el cociente entre la desviación estándar y la media. Recuerden ser “Muy” rigurosos en los conceptos que aplican, por que esto afecta totalmente sus resultados y la interpretabilidad de los mismos.


Utilizando otra BD de aves en Bogotá, Colombia, logre crear un mapa de densidad de las 13 aves más amenazadas actualmente.

A pesar de que hay casos en los que 11 automóviles se vieron implicados (max), al menos en el 75% de los choques solo 2 autos fueron los protagonistas.

Todos los colegios reconocidos por mi país, ordenados por la ubicación en metros sobre el nivel del mar

Podriamos colocar un negocio donde se hagan reparaciones de carros cerca a sitios con mayores accidentes ajajaja

Mediante la geolocalización de las zonas con más accidentes se podrían lanzar alertas a los vehículos que utilicen apps como Waze, esto generaría un impacto directo en los choques y más conciencia en los conductores.

Una compañía de seguros podría colocar en su estrategia de publicidad las zonas con mayor frecuencia de accidentes

“En un análisis exploratorio tu no sabes que es lo que quieres ver, apenas estás entendiendo lo que tienes.”

Incluso reproduciéndolo en 2x se siente muy lento este curso…

Con las DB de datos abiertos en Colombia, hice el mismo ejercicio de accidentes de tránsito para la ciudad de Medellín en el año 2020.

Se me ocurre la siguiente, ver las calles con mas accidentalidad las horas del día en la que ocurren y ver si existen un relación entre cantidad de luz y accidentes.
Lo estoy pensando a modo de como con infraestructura, podemos solucionar los choques. y mi primera hipótesis es la cantidad de luz

Me parece que hubo un error en la desviación estándar, usando la librería SciPy es : ss.tstd(df_chicago[‘NUM_UNITS’]) también puede ser con : df_chicago[‘NUM_UNITS’].std()

Aunque no logré adjuntar la imagen de la tabla que muestra la cantidad de dispositivos de control de tráfico presentes durante cada accidente, logré visualizar que en 16283 casos no hubo dispositivos de control, por lo que presento la hipótesis de que si se incrementa la cantidad de estos dispositivos, los accidentes podrían disminuir considerablemente.

Dejo como aporte la explicación de esta linea de código:

df = px.data.carshare()

En esa linea de código en específico, se carga una serie de dataframes que tiene la librería plotly.express y el .carshare() hace mención al dataframe que estamos usando en el ejemplo, existen otros tales como

  • election()
  • experiment()
  • iris()

El estado podría analizar poner señales de transito ya que del total de los 27 961 choques, 16 183 están clasificados como ’ NO CONTROLS’ , lo que quiere decir que en mas de la mitad de los choques no había ningún señalamiento.

Vaya me encnató, esa metodología de contar una historia. Ahora entiendo por que todo el mundo dice que esto es un arte . Me encanta y ahora en adelante lo seguiré haciendo asi

Me llamó la atención lo que se quizo hacer con la densidad de choques y creo que aquí se puede ver mejor:

Una mejor forma de ver la distribución de la cantidad de accidentes es utilizando la herramienta seaborn. Para ello hice un calculo para tener los nombres de los meses. Espero que les sirva.

# sacamos el nombre de los meses
df_chicago['month_name'] = df_chicago['CRASH_DATE'].dt.month_name()

# importamos la librería
import seaborn as sns

# ordenamos para que los meses salgan en orden
df_chicago.sort_values(by = 'CRASH_MONTH', inplace = True)

# Graficamos con seaborn
plt.figure(figsize=(8,4))
sns.countplot(x='month_name',data=df_chicago)
plt.xticks(rotation=90)
plt.title('Numero de Accidentes por Mes')
plt.xlabel('Mes')
plt.ylabel('Cantidad')
plt.show()

Creo que un buen caso de uso es el del Gobierno ya que el gobierno podría saber en donde poner los semáforos o hacer que se reduzca la velocidad con multas o algo así!, también sería buen uso para poder predecir en qué lugares se necesitarán más grúas o ayuda por ejemplo ambulancias para los heridos del choque y grúas para los vehículos desztrozados!

😀

Colegas: les recomiendo las clases del profesor Francisco Camacho que aparece en los recursos de este curso en Clases relacionadas. El profesor Camacho usa un enfoque bien claro y directo sobre los temas estadísticos con la implementación en python, orientándándolos todos a data science. Igualmente en los contenidos del curso utiliza excelentes ejemplos que se pueden seguir como práctica.

Enfocandonos en los puntos de mayor convergencia de accidentes, se podrían desarrollar modelos que ayuden a disminuir esos picos.

Yo aplicaría esto crear mejores rutas, rutas más seguras en empresas como Uber o DiDi, pero también para rutas donde vayan en su mayoría o completamente personas jóvenes como niños o adolescentes.