No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Qué hace una Data Scientist?

8/15
Recursos

¿Qué es un Data Scientist?

En el fascinante mundo del análisis de datos, una Data Scientist es el arquitecto del conocimiento, encargado de extraer, analizar y transformar datos en valiosos insights. Pero, ¿Qué hace exactamente este perfil profesional?

Descubramos cómo esta profesión en constante evolución navega y se adapta a las demandas del entorno laboral actual. Explora desde sus tareas hasta su salario y posibilidades.

undecima_arti_clase(1).jpg

¿Qué hace una Data Scientist? Roles y responsabilidades

Embarcarse en una carrera en ciencia de datos implica una variedad de tareas, que incluyen:

  • Extraer, limpiar y analizar datos de diversas fuentes.
  • Diseñar e implementar modelos de Machine Learning.
  • Supervisar la precisión de los datos.
  • Automatizar procesos para agilizar la recolección de datos.
  • Crear informes detallados en paneles de análisis para otros equipos.

Más allá de la ciencia de datos, su rol se extiende a organizar volúmenes de datos para mejorar el rendimiento organizacional.

Cómo convertirse en Data Scientist: del aprendizaje a la práctica

Convertirse en una Data Scientist requiere una combinación única de habilidades y conocimientos. Aunque no hay un camino único, la mayoría de Data Scientists se especializan en áreas como Estadística, Ciencias de la Computación o Matemáticas, o trabajan como programadores.

Además, la competencia en programación, la experiencia con herramientas analíticas y una sólida comprensión del negocio son cruciales para este rol.

El aprendizaje continuo y la participación en cursos especializados son clave para mantenerse relevante en este campo dinámico. Para enriquecer tu conjunto de habilidades, considera explorar las siguientes áreas:

  • Inteligencia artificial
  • Álgebra lineal
  • Python (también tenemos cursos de Python en Platzi
  • Lenguaje de programación
  • Business intelligence

¿Qué hacen quienes se especializan en ciencia de datos?

Algunas de las funciones en la profesión de ciencia de datos incluyen lo siguiente:

  • Extraer, limpiar y analizar datos de diversas fuentes.
  • Diseñar y emplear modelos de Machine Learning.
  • Monitorear la precisión de los datos.
  • Automatizar procesos para agilizar la recolección de datos.
  • Crear reportes detallados en tableros de análsisi para otros equipos.

Su labor va más allá de la ciencia de datos; es organizar el volumen de la data para potenciar el rendimiento organizacional.

¿Cuánto gana un científico de datos?

El rol de Data Scientist no solo es apasionante, sino también recompensado. En el competitivo mercado laboral, el salario de una Data Scientist refleja la demanda de sus habilidades.

En México: Los Data Scientists con experiencia pueden esperar un salario anual promedio de 30,500 pesos mexicanos. Esta cifra puede variar según la ubicación geográfica, la industria específica y la trayectoria profesional.

En Colombia: Los salarios para científicos de datos en Colombia varían, oscilando entre COP 2,800,000 y COP 17,000,000 al año, según Glassdoor.

Roles en dentro del campo del data science

Imagínate un día donde cada línea de código tiene el poder de transformar datos en decisiones estratégicas. La rutina de una Data Scientist implica la extracción meticulosa de datos de diversas fuentes. Diseñan y aplican modelos de Machine Learning para desentrañar patrones ocultos.

Además, supervisan la calidad de los datos, automatizan procesos para agilizar el flujo de información y materializan sus hallazgos en informes detallados. Su día culmina con la implementación de modelos en productos y la incorporación de datos estratégicos para potenciar el crecimiento y la innovación.

Diferencia entre Data Scientist y Data Analyst

Data Scientist Data Analyst
Enfoque Principal Analizar datos para producir modelos avanzados y predecir el futuro con programación orientada a objetos. Responder preguntas de negocio mediante análisis de datos actuales con una programación fundamental.
Responsabilidades Dirige equipos de datos, utiliza diversas herramientas para analizar el presente y prever el futuro. Centrado en responder preguntas específicas de áreas comerciales mediante análisis de datos del presente.
Habilidades Claves Programación avanzada, modelado predictivo, liderazgo de equipos de datos. Análisis de datos fundamentales, capacidad para abordar preguntas comerciales específicas, habilidades de comunicación.
Objetivo Final Hallar información valiosa para el negocio o proyecto, potenciando la toma de decisiones estratégicas. Proporcionar información inmediata para satisfacer las necesidades actuales de las áreas comerciales.

Aprovecha que con Platzi, tienes todos los cursos de Data Science para avanzar en tu carrera.

Contribución creada por: Ismael H.

Aportes 197

Preguntas 16

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Una de las principales diferencias es que el DA mira el hoy (el presente) y el DS mira hacia adelante y proyecta tendencias futuras.

Día a día del Data Scientist:
-Obtener datos de distinstas fuentes.
-Diseñar y aplicar modelos de Machine Learning.
-Diseñar herramientas para monitorear datos.
-Automatizar procesos de recolección, limpieza y trasformación de datos.
-Incoporar datos a los productos junto con el equipo de ingenieria.

Voy a dar mi opinión libre sobre el mal uso del lenguaje que noto en los videos, me distraen un poco, no me deja disfrutar al 100% el curso.
Dicen y escriben: “¿qué hace una Data Scientist?”, lo correcto es: “un Data Sientist”, porque nos estamos refiriendo a un profesional, independientemente del sexo de la persona.
La RAE ya lo aclaro 500 millones de veces.
Personalmente prefiero que separen las ideologías del aprendizaje y sean neutrales, es más profesional y no genera trivialidades innecesarias.

Es evidente que un Data Scientist requiere mucho más nivel que un Data Analyst, o por lo menos tiene un poco más de relación con la ingeniería para adaptar Machine Learning a sus productos 🤖

Un Data Analyst es la combinación entre un programador, detective y artista

Data Science VS Data Analyst

la principal diferencia desde mi punto de vista radica en que el data analyst ve el presente de la organizacion mientras que el data scientist tiende a observar mas el futuro

en primera instancia uno podria pensar que se requiere mayor nivel tecnico para ser data scientist y en estricto sentido seria cierto, sin embargo no olvidemos que el data analyst es quien comunica la informacion a traves de tableros y reportes al negocio

diria que es aqui la ventaja competitiva del data analyst, la capacidad de poder entender a las demas areas de negocio y su habilidad de comunicacion para hacer ver los hallazgos encontratos en sus analisos de manera clara y objetiva para los managers o directores de la industria quienes claramente en muchos casos no son ingenieros y se les requiere explicar de manera muy digerible la informacion

en pocas palabras considero que la parte fuerte de un cientifico de datos es su habilidad tecnica y la de un data analyst seria la capacidad para pode entender el negocio desde distintos angulos (perspectiva mas amplia) y poder comunicar su informacion de manera optima

es por ello que el conocimiento del negocio y la interaccion con otras areas es una parte fundamente del data analyst ya que funge como un puente entre los datos y lo que ellos revelan y los gerentes, manager o directores que son los que tomaran las decisiones

Data scientist:

Toma datos internos o externos de la empresa y los utiliza para crear servicios de machine learning esto es para tomar decisiones basadas en datos e incorporar datos en los productos de software.

Rutina:
-Obtiene datos, analiza y procesa
-Diseña y utiliza modelos de machine learning (predecir futuro)
-Automatiza procesos de recolección y transformación de datos
-Crear reportes
-Incorpora datos a los productos basados en datos

El dia a dia de un Data Science:

  • Ingesta de datos

  • Validacion de datos

  • Preparacion de datos

  • Entrenamiento del modelo

  • Monitoreo del modelo

  • Visualizacion de los reportes

  • Incorporar datos a los productos

Les comparto una pequeña infografía!
(

Los dos campos me encantan, considero que para iniciar en este mundo e ir avanzando lo ideal es empezar con el DATA ANALYST y luego seguir con el DATA SCIENTIST, creo que es la ruta que seguiré

  1. Objetivo final: La principal diferencia entre un Data Scientist y un Data Analyst es el objetivo final. Un Data Analyst se enfoca en analizar datos para responder preguntas específicas y resolver problemas específicos de negocios. Un Data Scientist, por otro lado, se enfoca en descubrir patrones y tendencias más amplias en los datos, y en construir modelos predictivos para apoyar la toma de decisiones.

  2. Habilidades técnicas: Ambos roles requieren habilidades técnicas en áreas como programación, estadísticas y bases de datos. Sin embargo, un Data Scientist generalmente tiene habilidades técnicas más avanzadas, como machine learning y análisis de big data.

  3. Herramientas y técnicas: Los Data Analysts y Data Scientists usan diferentes herramientas y técnicas. Un Data Analyst puede utilizar herramientas como Excel, SQL y Tableau para analizar datos, mientras que un Data Scientist puede utilizar herramientas como Python, R y Hadoop para realizar análisis más avanzados.

  4. Proceso: El proceso de análisis de datos también puede ser diferente para cada rol. Un Data Analyst generalmente trabaja con datos preexistentes y se enfoca en hacer preguntas específicas y obtener respuestas específicas, mientras que un Data Scientist puede trabajar con datos más complejos y desorganizados y enfocarse en encontrar patrones y tendencias más amplias.

En resumen, aunque ambos roles trabajan con datos, un Data Scientist tiende a tener habilidades técnicas más avanzadas y se enfoca en descubrir patrones y tendencias más amplias en los datos, mientras que un Data Analyst se enfoca en responder preguntas específicas y resolver problemas específicos de negocios con datos.

Lo mas seguro es que este equivocado, pero de eso se trata esta es la relación a la que pude llegar.


Analista de Datos:

Este ayuda a establecer estrategias dentro de la empresa a través de la interpretación de los datos.

 

Actividades:

  • Visualización de datos a través de Dashboards.
  • Optimización de modelos de datos.
  • Manipulación de gran volumen de datos.

 

Conocimientos:

  • Resolución de problemas.
  • Análisis.
  • Base de datos.
  • Auto aprendizaje.
     

Herramientas:

  • SQL
  • SAS
  • R
  • Python
  • Power BI
     
     

 
Cientifíco de Datos:

Recopila, procesa y obtiene información valiosa de los datos con el objetivo de responder ptrguntas o resolver problemas de negocio.

 

Actividades

  • Investigar y desarrollar modelos estadísticos que ayuden a influenciar decisiones de negocio.

  • Dirigir proyectos de ciencia de datos de principio a fin.

  • Crear procesos y herramientas que ayuden a monitorear el desempeño del gran volumen de datos.

 

Conocimientos:

  • Estadística.
  • Matématicas.
  • Data Mining.
  • Deep Learning.
  • Analítica predictiva.
  • Visualización de datos (BO, D3, ggplot, etc.)
  • Programación.
  • Servicios Web (Digital Ocean, S3, Spark).
     

Herramientas:

  • Java
  • R
  • Python
  • SQL
  • Hadoop
  • Hive
  • Spark
  • JavaScript
  • TensorFlow
  • Scikit-learn
  • C++
  • Scala
  • Julia
  • Gurobi
  • Matlab
  • Otros

Data Scientist día a día:

*Obtener los datos
*Explorar los datos
*Preparar los datos
*Entrenamiento de modelo
*Evaluación del modelo
*Validación del modelo

Comparto mis apuntes #12 (Notion)

En respuesta al reto de esta clase, me parece que va desde: Preparación de datos, hasta Validación de modelo.

Sujeto a correcciones. 😁

![](https://static.platzi.com/media/user_upload/4-7148d405-ba38-4cf2-8753-c1fe43d726aa.jpg)

Esas predicciones son las que marcan la diferencia especialmente en el salario.

Les comparto mis apuntes de la clase 😄

Data Scientist dia a dia:

  1. OLP (Obtener, Limpiar y procesar) de datos.
  2. Diseñar Modelos de Machine Learning
  3. Automatizar procesos de datos
  4. Generar informes en Tableros.
  5. Incorporar Datos a los productos.

Una de las principales diferencias es que el DA mira el hoy (el presente) y el DS mira hacia adelante y proyecta tendencias futuras. x2

En el esquema, creo que el DS aplica a todas estas etapas

Un Data Scientist es una persona que se encarga de analizar y comprender datos masivos, con el fin de extraer información valiosa y utilizarla para tomar decisiones informadas en una empresa o organización. Esto implica aplicar técnicas de ciencia de datos y análisis estadístico para limpiar, organizar y analizar grandes conjuntos de datos, y utilizar herramientas de visualización para presentar los resultados de manera comprensible. Un Data Scientist también puede desempeñar un papel importante en la implementación de sistemas de inteligencia artificial y aprendizaje automático en una empresa. En resumen, un Data Scientist es responsable de convertir datos en conocimiento valioso para una organización.

Les comparto mis apuntes de Notion, puedes duplicarlo a tu sistema de notas, haciendo clic aquí.

Data Scientist:

  • Obtiene datos de diferentes fuentes
  • Limpieza de los datos y exploración
  • Introduce los datos para el entrenamiento de los modelos ML
  • Valida los resultados del modelo del ML
  • Poner en producción los modelos de ML y hacerle seguimiento

En mi opinion el cientifico de datos esta en todos los pasos dentro del proceso de ciencia de datos.

Los y las científicos de datos son organizadores de big data, recopilan y analizan grandes conjuntos de datos estructurados y no estructurados. El papel de un científico de datos combina la informática, la estadística y las matemáticas. Analizan, procesan y modelan datos y luego interpretan los resultados para crear planes prácticos para empresas y otras organizaciones.

veo que el porceso de obtener datos y limpieza de datos es algo que se hace tanto en data analyst como en data scientist, lo que diferencia al data scientist es el usar algoritmos de machine learning e inteligencia artificial, y otra cosa es crear productos con inteligencia artificial

Una de las diferencias más grandes es que en DA se usa una programación más básica, en cambio en DS se usa una programación más avanzada

Según lo que tengo entendido un data scientist se ve involucrado en la obtención de datos en el proceso de la ciencia de datos y en la preparación, entrenamiento de modelo, evaluación de modelo, validación de modelo y despliegue de modelo en el proceso de integrar machine learning al producto.

Cuanto el Analista de datos simplemente trabaja en el presente.

Introduciendo datos.
validando datos.
preparando datos
valida el modelo
lo presenta.

El científico de datos tiene todo eso, pero también:

-Entrenamiento de modelo.
-Evaluación de modelo
-Validación de modelo

con ello para mirar predicciones a futuro. Se podría decir que es mas completo.

Pero depende del problema a resolver, ahí es donde se vera mejor la diferencia y lo que vas a necesitar.

Data

Scientist vs Analyst

Ambas me llaman la atención aunque para data scientist debes tener un conocimiento mucho mas profundo de ingeniería y programación

Data Analyst se enfoca en analizar el presente de la organización y el Data Scientist en proyectar el futuro con base en la información actual

Data scientist vs Data analyst

Las tareas del día a día de un Data Scientist suelen involucrar las siguientes partes: 1. **Ingesta de datos**: Recopilación de datos desde diversas fuentes. Esto incluye tareas como la extracción, carga y transformación (ETL) de datos para preparar los datos brutos para su análisis. 2. **Validación de datos**: Asegurar la calidad de los datos. Esto implica la limpieza de datos, la identificación de valores faltantes o anomalías, y garantizar que los datos sean adecuados para el análisis. 3. **Preparación de datos**: Incluye la transformación de datos, creación de características (feature engineering), normalización o estandarización de datos, y cualquier otro procesamiento previo que sea necesario antes de entrenar modelos. 4. **Entrenamiento de modelo**: Aquí se seleccionan algoritmos de Machine Learning y se ajustan los modelos a los datos entrenados. También puede incluir la validación inicial del modelo con conjuntos de datos de prueba. 5. **Evaluación de modelo**: Analizar el rendimiento del modelo usando métricas específicas y ajustar los parámetros si es necesario para mejorar la precisión o generalización del modelo. 6. **Validación de modelo**: Confirmar que el modelo funciona bien en datos que no ha visto antes y es capaz de generalizar a nuevas situaciones. Si bien las demás etapas, como el **Despliegue de modelo** y la **Interfaz de usuario**, también son importantes, suelen estar más relacionadas con el equipo de ingeniería o DevOps que con las tareas diarias de un Data Scientist.
![](https://static.platzi.com/media/user_upload/image-442dcb4b-1fc3-437a-b3f5-d073c614898a.jpg)Con respecto a este diagrama podemos decir que estas tareas están enfocadas más a un Data Scientist ya que incluye pasos un poco más complejos, si se quiere decir así, que van más allá de un simple análisis; (Estos pasos serian lo de hacer una pregunta y comunicar resultados). Si bien está muy relacionado con las tareas que también hace un Data Analist, este último se centra más en analizar conjuntos de datos **ya existentes** para encontrar respuestas planteadas **por otras personas dentro de la organización, empresa, etc.** (Las tareas relacionadas serían las de **Obtener, Explorar** y **Analizar Datos**) \_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_ En el siguiente diagrama: ![](https://static.platzi.com/media/user_upload/image-67028636-8199-440d-93ba-d3e95f990dba.jpg) se puede ver que los **3 primeros roles** *(en verde clarito)* **se comparten con el DA y el DS**. **Ingesta de datos**: Ambos roles trabajan con la recolección de datos de diferentes fuentes. **Validación de datos**: Verifican la calidad y exactitud de los datos. **Preparación de datos**: Limpian y organizan los datos para el análisis. Luego la parte de ML ya va más dedicada a un DS, justamente por el manejo de herramientas avanzadas y tecnologías que aplica para obtener o desarrollar modelos predictivos y algoritmos que pueden ser implementados en productos o servicios.
*"En Colombia:* Los salarios para científicos de datos en Colombia varían, oscilando entre COP 2,800,000 y COP 17,000,000 al año, según [Glassdoor](https://www.glassdoor.com.mx/Sueldos/bogot%C3%A1-data-scientist-sueldo-SRCH_IL.0,6_IM1064_KO7,21.htm#:~:text=La%20remuneraci%C3%B3n%20promedio%20de%20efectivo,Data%20Scientist%20en%20Bogota%2C%20Colombia.)." Esas cifras no tienen sentido ya que el salario minimo mensual de Colombia está en 1'300.000
**Un científico de datos es un profesional multifacético que juega un papel crucial en la era del Big Data.**
**¿Qué es un Data Scientist?** Un científico de datos es un profesional que utiliza técnicas avanzadas de análisis de datos y aprendizaje automático para extraer conocimientos y generar valor a partir de conjuntos de datos complejos. Sus responsabilidades suelen incluir la identificación de patrones, la creación de modelos predictivos, la realización de análisis estadísticos y la comunicación de los resultados a los interesados. Para desempeñar esta función, un data scientist necesita una sólida formación en matemáticas y estadísticas, así como habilidades en programación y manejo de bases de datos. Además, es importante tener conocimientos en áreas como el aprendizaje automático, la visualización de datos, la minería de datos y la comprensión de los negocios. Una capacidad importante es también la capacidad de comunicar de manera efectiva los resultados y las implicaciones de los análisis a personas no técnicas.
![](https://static.platzi.com/media/user_upload/image-21413b04-68fd-4ea1-ad8b-1209fadff4fc.jpg) ## Diagrama de las tareas del día a día de un Data Scientist: **El diagrama proporcionado muestra el proceso general de la ciencia de datos, que se puede dividir en las siguientes etapas:** **1. Definición del problema:** * Comprender el problema que se quiere resolver. * Definir los objetivos del proyecto. * Identificar las métricas de éxito. **2. Recopilación de datos:** * Identificar las fuentes de datos relevantes. * Extraer los datos de las fuentes. * Limpiar y preparar los datos para su análisis. **3. Análisis de datos:** * Exploración de datos para identificar patrones y tendencias. * Aplicar técnicas estadísticas y de aprendizaje automático para analizar los datos. * Desarrollar modelos para predecir resultados futuros. **4. Visualización de datos:** * Crear visualizaciones para comunicar los resultados del análisis de datos. * Diseñar visualizaciones que sean informativas y fáciles de entender. **5. Implementación y comunicación:** * Implementar los modelos en producción. * Comunicar los resultados del proyecto a los stakeholders. **Las tareas del día a día de un Data Scientist se llevan a cabo en todas las etapas del proceso de la ciencia de datos.** **A continuación se muestra una descripción de cómo se llevan a cabo las tareas del día a día en cada etapa:** **1. Definición del problema:** * Un Data Scientist se reunirá con stakeholders para comprender el problema que se quiere resolver. * El Data Scientist definirá los objetivos del proyecto y las métricas de éxito. * El Data Scientist identificará las fuentes de datos relevantes. **2. Recopilación de datos:** * Un Data Scientist extraerá los datos de las fuentes identificadas. * El Data Scientist limpiará y preparará los datos para su análisis. * El Data Scientist explorará los datos para identificar patrones y tendencias. **3. Análisis de datos:** * Un Data Scientist aplicará técnicas estadísticas y de aprendizaje automático para analizar los datos. * El Data Scientist desarrollará modelos para predecir resultados futuros. * El Data Scientist evaluará y validará los modelos. **4. Visualización de datos:** * Un Data Scientist creará visualizaciones para comunicar los resultados del análisis de datos. * El Data Scientist diseñará visualizaciones que sean informativas y fáciles de entender. **5. Implementación y comunicación:** * Un Data Scientist implementará los modelos en producción. * El Data Scientist comunicará los resultados del proyecto a los stakeholders. ![](https://static.platzi.com/media/user_upload/image-b306f53f-ec00-4977-9dd9-950c0fd0ecd6.jpg) Diagrama de las tareas del día a día de un Data Scientist: ---------------------------------------------------------- **El diagrama proporcionado muestra el proceso de integración de Machine Learning (ML) a un producto, que se puede dividir en las siguientes etapas:** **1. Ingesta de datos:** * Recopilación de datos de diversas fuentes. * Limpieza y transformación de datos para su análisis. **2. Validación de datos:** * Asegurar que los datos sean precisos y confiables. * Identificar y corregir errores en los datos. **3. Preparación de datos:** * Formatear los datos para que sean compatibles con los algoritmos de ML. * Seleccionar las características relevantes para el modelo. **4. Entrenamiento de modelo:** * Seleccionar un algoritmo de ML adecuado. * Entrenar el modelo en los datos preparados. **5. Validación de modelo:** * Evaluar el rendimiento del modelo en un conjunto de datos de prueba. * Ajustar el modelo según sea necesario. **6. Despliegue de modelo:** * Implementar el modelo en producción. * Integrar el modelo con el producto. **7. Interfaz de usuario:** * Diseñar una interfaz de usuario para que los usuarios interactúen con el modelo. * Proporcionar a los usuarios información sobre las predicciones del modelo. **Las tareas del día a día de un Data Scientist se llevan a cabo en todas las etapas del proceso de integración de ML.** **A continuación se muestra una descripción de cómo se llevan a cabo las tareas del día a día en cada etapa:** **1. Ingesta de datos:** * Un Data Scientist se reunirá con stakeholders para identificar las fuentes de datos relevantes. * El Data Scientist extraerá los datos de las fuentes identificadas. * El Data Scientist limpiará y preparará los datos para su análisis. **2. Validación de datos:** * Un Data Scientist analizará los datos para identificar errores y valores inconsistentes. * El Data Scientist corregirá los errores en los datos. **3. Preparación de datos:** * Un Data Scientist formateará los datos para que sean compatibles con los algoritmos de ML. * El Data Scientist seleccionará las características relevantes para el modelo. **4. Entrenamiento de modelo:** * Un Data Scientist seleccionará un algoritmo de ML adecuado. * El Data Scientist entrenará el modelo en los datos preparados. **5. Validación de modelo:** * Un Data Scientist evaluará el rendimiento del modelo en un conjunto de datos de prueba. * El Data Scientist ajustará el modelo según sea necesario. **6. Despliegue de modelo:** * Un Data Scientist implementará el modelo en producción. * El Data Scientist integrará el modelo con el producto. **7. Interfaz de usuario:** * Un Data Scientist colaborará con un Diseñador de UX/UI para diseñar una interfaz de usuario para que los usuarios interactúen con el modelo. * El Data Scientist proporcionará a los usuarios información sobre las predicciones del modelo.
Bastante bien explicado, pero me distrae el poco respeto al español, aunque Platzi no cree en el respeto al lenguaje, tal vez podría darles un poco más de valor.
estaba leyendo y encontre este error no es nada a seguir aprendiendo Crear reportes detallados en tableros de ( análsisi )para otros equipos.
El día a día de un DS es: * Extraer, limpiar y analizar datos de diversas fuentes. * Diseñar e implementar modelos de Machine Learning. * Supervisar la precisión de los datos. * Automatizar procesos para agilizar la recolección de datos. * Crear informes detallados en paneles de análisis para otros equipos. Y su rol se extiende a organizar volúmenes de datos para mejorar el rendimiento organizacional, es decir, genera alternativas de tendencias futuras de la organización.
![](https://static.platzi.com/media/user_upload/Procesos%20frente%20a%20actividades-a1e8b4f8-cc44-4f11-b216-2a24440b8903.jpg)

En resumen,

la Data Scientist no solo realiza análisis avanzados sino que también lidera equipos de datos en proyectos, utilizando herramientas diversas para comprender el presente y prever el futuro, buscando información valiosa para el negocio o proyecto.

Revisando los procesos de datos veo a Data Scientist involucrado en todos... completamente inmerso en cada paso. Interesante.
Por como hablaron en el curso parece que solo trabajan mujeres, el lenguaje en estas épocas es mas confuso que antes, solo digan científico de datos, o analista de datos... no es la gran cosa, la mayoría somos estudiantes, no nos interesa esto, aprender si ...
Comparto mis apuntes. ![](https://static.platzi.com/media/user_upload/Informacio%CC%81n%20de%20valor%20para%20la%20toma%20de%20decisiones-633a3053-3e92-433f-addd-db568c95a547.jpg)
Data Scientist: 1\. incorporar datos a los productos 2\. programación avanzada 3\. Marchine Learning y estadística Data Analyst 1\. Se enfoca en responder preguntas de negocio. 2\. programación fundamental. 3\. Analiza el presente de la organización.
Aunque el Data Scientist y el Data Analyst a principio tienen funciones muy similares de recopilar, limpiar y analizar la data, su enfoque es diferente. El data Analyst se enfoca en el presente, en dar respuestas a las preguntas del negocio y no es necesario que sepa de programación. Por otro lado el Data Scientist necesita tener mayor conocimiento técnico para poder implementar modelos de ML y su enforque es mayormente predictivo, es decir con los datos que analiza en la primera etapa intenta predecir que pasara en el futuro.
La Ciencia de Datos (Data Science en inglés) es un campo interdisciplinario que combina métodos estadísticos, programación y conocimientos de dominio para analizar y comprender los datos. La Ciencia de Datos se utiliza para resolver problemas complejos en una amplia gama de campos, como negocios, ciencia, ingeniería, medicina, entre otros. Los profesionales de la Ciencia de Datos trabajan con grandes conjuntos de datos para descubrir patrones y tendencias, crear modelos predictivos y diseñar soluciones basadas en datos que mejoren la toma de decisiones.
El trabajo diario de un Data Scientist, implica la ejecución de mútiples etapas del proceo de ciencia de datos compartido en clases anteriores... por lo que generalmente siguen un ciclo continuo... hasta ahora por lo que he aprendido, se tiene en el día a día: **Definición del problema**: trabajando estrechamente con las partes interesadas del problema, para comprenderlo y los objetivos comerciales; así como tambie, identificar preguntas claves, con las cuales se puedan abordar el análisis de datos. **Adquisición y Recopilación de Datos**: Los Data Scientists recopilan datos de diversas fuentes, como bases de datos, archivos, API, sensores, etc. Limpian y preparan los datos para su análisis, lo que implica la eliminación de valores atípicos, datos faltantes y errores. **Exploración y Análisis de Datos**: Utilizan técnicas de análisis exploratorio de datos (EDA) para comprender la estructura y las características de los datos. Visualizan datos, calculan estadísticas descriptivas y exploran relaciones entre variables. **Modelado de Datos**: Los Data Scientists diseñan y construyen modelos predictivos y descriptivos utilizando técnicas de machine learning y estadísticas. Ajustan y evalúan modelos, lo que implica la selección de algoritmos, la optimización de hiperparámetros y la validación cruzada. **Comunicación de Resultados**: Presentan los hallazgos y resultados a las partes interesadas en informes, visualizaciones y presentaciones. Explican las implicaciones de los resultados y cómo pueden influir en las decisiones empresariales. **Implementación y Despliegue**: En algunos casos, los Data Scientists pueden participar en la implementación de modelos en sistemas en producción, como aplicaciones web o sistemas empresariales. **Monitorización y Mantenimiento**: Los Data Scientists pueden ser responsables de monitorear el rendimiento de los modelos en producción y realizar ajustes según sea necesario. **Aprendizaje Continuo**: Los Data Scientists deben mantenerse actualizados sobre las últimas tendencias y avances en ciencia de datos y machine learning. El ciclo de trabajo de un Data Scientist no suele ser lineal y puede requerir iteraciones en varias etapas a medida que se obtienen nuevos conocimientos o se recopilan datos adicionales. La combinación de habilidades técnicas, estadísticas y de comunicación es fundamental para llevar a cabo con éxito estas etapas y proporcionar información valiosa para la toma de decisiones empresariales. Lo que acá plasmé es un resumen de diversas lecturas que he realizado...

En el proceso de la ciencia de datos estaría en analizar explorar y obtener datos pero del entrenamiento evaluación y validación del modelo que esta orientado a integrar ML a un producto.

El Data Scientist se pasa el día en: Entrenamiento de modelo Evaluación de modelo Validación de modelo Aunque también tendría que ver con Preparación de Datos

Una Data Scientist utiliza habilidades analíticas y técnicas avanzadas para extraer conocimientos significativos de los datos y aplicarlos en la toma de decisiones estratégicas.

## Día a día de una *Data Scientist* * **Extraer, limpiar y analizar** los datos de diversas fuentes * Diseñar y utilizar **modelos de *Machine Learning*** * **Monitorear la precisión de los datos,** para una mejor calidad y confiabilidad * **Automatizar procesos de recolección y transformación de datos** para hacer todo mucho más ágil * **Crear reportes** de información en tableros * **Implementar modelos al de *Machine Learning*** al producto * **Incorporar datos** a los productos
Lo que hace un data scientist es obtener datos, analizarlos, crear conclusiones y validarlos.
Hola. Donde estan los recursos que no los veo en la seccion de recursos?

Clase 8 - ¿Qué hace una Data Scientist?


Repaso de la clase


¿Qué hace una Data Scientist?

  • Toma datos de la organización de diversas fuentes, los cuales usa para crear servicios de Machine Learning y encontrar información valiosa.

¿Cuáles son los objetivos que debe cumplir un Data Scientist?

  • Se logren tomar decisiones basadas en datos
  • Se logren incorporar datos a los productos de software.

¿Cuáles son las actividades que realiza un Data Scientist en su día a día?

  • Obtiene, limpia y procesa datos para un análisis exploratorio de los datos. Esto le ayuda a encontrar la información valiosa que necesita para trabajar.
  • Diseña y utiliza modelos de Machine Learning para generar predicciones sobre los datos y ver futuros resultados.
  • Monitora la precisión de los datos y modelos de Machine Learning. Para ello desarrolla herramientas que le ayuden a obtener datos de mayor calidad.
  • Automatiza procesos de recolección y limpieza de datos, para evitar tareas repetitivas.
  • Crea reportes de información en forma de tableros para informar a las demás personas del negocio.
  • Ayuda a incorporar datos e inteligencia artificial a los productos, trabajando de la mano con el equipo de ingeniería y los Machine Learning Engineer.

¿Cuál es la diferencia entre los roles de Data Scientist y el Data Analyst?

  • El Data Scientist se enfoca en analizar datos para producir distintos modelos de Machine Learning con los que pueda predecir el futuro. Para ellos se apoya con conocimientos de Programación avanzada con el paradigma de programación orientada a objetos (POO).
  • El Data Analyst se enfoca en responder preguntas del negocio de las demás áreas, usando el análisis de datos del presente, usando programación fundamental.

Para mí en el diagrama de “Proceso de ciencia de datos: integrar ML a producto”, el data scientist interviene en las fases de:

Ingesta de datos. El los obtiene y según entendí también optimiza la manera de adquirirlos.

Validación de datos: Yo entiendo que acá hace el análisis de si los datos son o no adecuados para las tareas a desarrollar en la organización.

Preparación de los datos: Acá los limpia y hace los respectivos análisis exploratorios de datos.

Entrenamiento, evaluación y validación del modelo. En esta parte su rol es muy activo en cuánto el data scientist parece ser el delegado a interactuar y preparar los modelos de machine learning.
Por otro lado, en los procesos de la imagen “Proceso de la ciencia de datos”, según mi criterio:

Interviene en todas las fases menos en la primera, el obtiene los datos, realiza el análisis exploratorio, con este proceso pasa por los procesos de exploración y análisis que se muestran. Finaliza comunicando y visualizando poderosos insights, usando tabloides y comunicando los resultados.

El Data scientist interviene en el entrenamiento del modelo, evaluación del modelo y validación del modelo.

Etapas del proceso de ciencia de datos en los que participa el DATA SCIENTIST:

  • Entrenamiento del Modelo
  • Evaluación del modelo
  • Validación del modelo
    Está en constante comunicación con ML Engineer y con el equipo de desarrollo.

Una Data Scientist está involucrada en los procesos de entrenamiento, evaluación y validación del modelo. Una Data Analyst está enfocada en la identificación de necesidades, la obtención, exploración y análisis de datos y la comunicación de hallazgos.

Un Data Sientist esta enfocado en analizar y producir nuevos modelos para anticipar y tomar desiciones a futuro

Un Data Analyst es quien responde a las diferentes preguntas de las areas por medio del analisis que realiza en tiempo presente.

uno prepara para predicir el futuro y el otro da informacion en tiempo real

En el diagrama del Proceso de Ciencia de Datos: integrar ML al producto, se puede visualizar que en cada acción se incorporan las actividades que lleva a cabo el DS, desde la ingesta de datos donde se obtienen, limpia y procesan los datos pasando por la validación de los mismos, las tareas del DS van incorporadas casi de que forma explícita al diagrama, terminado con el displiegue del modelo e incoporando los datos obtenidos al producto de software que sería la interfaz del usuario.

En el diagrama de Proceso de Ciencia de Datos, se reflajan en líneas generales cada paso que puede ser aplicado a las actividades de un DS, pero desde mi punto de vista muy personal, se asocia más a las actividades de un DA

Un DS Crea reporte de métricas de datos que ayuden a la toma de decisiones e incorpora datos a los productos de software, en resumen puede intrepretarse como el creador de las estratégias técnicas del proceso científico del tratamiento de los datos que ayudarán a la toma de decisiones de la organización.

Un Data Scientist tambien hace seguimiento de la precisón de los datos y de los modelos de machine learning con los que trabaja y para estos desarrolla herramienta que lo ayude a este monitoreo. Automatizalos los procesos de recolección y transformaicón de los datos para optimizar el trabajo.

Un Data Scientist toma datos de diversas fuentes, internas y externas con el propósito para tomar decisiones dentro de la organización y para incorporar datos en la producción de software. Para ellos el Data Sicentist, toma los datos, los limpia y procesa con el fin de ponerlos a tono para hacer un annálisis exploratorio de datos, este análisis sumnistra la información de valor que se necesita para crear modelos de machine learning

el dta Scientist procesa y toma decisiones en la empresa basado en datos y métricas

Como extra si se tienen conocimientos en R, SAS y VBA es mejor para las vacantes

Que es un Analisis exploratorio de Datos ?

😦

Principales diferencias entre un DA y un DS

Data Analyst:

Enfoque Principal: Los Data Analysts se centran en examinar datos existentes para obtener información útil y respuestas a preguntas específicas. Trabajan con datos históricos y actuales para analizar tendencias, patrones y relaciones.
Tareas Típicas: Realizan consultas y análisis de bases de datos, crean informes y visualizaciones para comunicar hallazgos, identifican anomalías y resumen datos para facilitar la toma de decisiones.
Herramientas Comunes: Utilizan herramientas como Excel, SQL, y herramientas de visualización de datos para explorar y presentar resultados.

Data Scientist:

Enfoque Principal: Los Data Scientists se dedican a trabajar con datos para generar conocimientos y modelos predictivos. Se enfocan en procesar grandes conjuntos de datos, desarrollar algoritmos de aprendizaje automático y crear modelos estadísticos.
Tareas Típicas: Preparan y procesan datos para el análisis, diseñan y desarrollan modelos de aprendizaje automático para predecir comportamientos o resultados, optimizan algoritmos y evalúan la calidad de los modelos.
Herramientas Comunes: Utilizan lenguajes de programación como Python o R, bibliotecas de aprendizaje automático como TensorFlow o scikit-learn, y herramientas para visualización y análisis avanzado.

En base a los diagramas de los archivos de la clase Esto es un día a día de un Data Sciense.

  1. Encontrar las fuentes de los datos internet , redes sociales…
  2. Obtener los datos.
    3.Validación de los datos obtenidos.
    4.Preparación de los datos.
    5.Entrenamiento al modelo.
    6.Evaluación del modelo.
    7.Validación del modelo.
    8.Despliegue del modelo.
    9.Introduccion a la del interfaz del usuario.

Por favor denme Fitback gracias

Estoy ancioso por aprender acerca de machine learning. Me llama mucho la atención que una máquina pueda aprender cada vez más sin la necesidad de haber sido programada explícitamente para eso.
De los roles vistos hasta ahora, voy por Data Science sin duda, por el uso de machine learning y de análisis predictivos.

Realizando el reto de la clase:

Las actividades principales del DS es en primera instancia el mismo que el de DA, extraer, procesar y analizar los datos para obtener información valiosa.

A partir de ahi, el DS se encarga de entrenar un modelo de machine learning para realizar predicciones basadas en datos y evaluar la precisión de los datos y del modelo para mayor eficiencia del proceso.

Data scientist: Ingresar Datos, Validación de datos, preparación de datos, Entrenamiento de Modelo, evaluación del Modelo, Despliegue de modelo, Interfaz de usuario
Data analysis: analizar los datos, comunicar y visualizar datos.

Reto: En el proceso de ciencia de Datos interpreto que el Data Scientist participa en los siguientes puntos:
a. Entender la pregunta objeto de investigación. La recibe y la debe entender para asegurar la respuesta que se quiere buscar.
b. En obtener datos. Porque debe buscar las fuentes y las debe extraer para analizar.
c. En Explorar datos. Porque debe revisar los datos, normalizarlos y limpiarlos para poder dar un análisis preciso de los datos que respondan a la pregunta a resolver. En este punto se emplea al ML para mejorar y optimizar las búsquedas y para realizar acciones que ayuden a limpiar datos de manera automatizada.
d. En Análisis de datos. Una vez se tiene la data normalizada, se debe confirmar si los datos extraídos, limpiados y normalizados, responden a la pregunta y entregan tendencias que sirvan para responder temas futuros.
e. En comunicar y visualizar, porque si se responde adecuadamente al problema, se pueden mostrar en un dashboard simple y contundente.

El data Scientist se encarga mas que todo de los procesos entrenamiento de modelo, evolución de modelo y de validación de modelo.

El data scientist esta con constante trabajo con el ingreso de los datos, validacion de los datos preparacion de los datos y entrenamiento de modelos, por consiguiente dentro del proceso de la ciencia de datos establece el cuestionamiento, obtiene los datos, los explora y analiza

Gracias

.

  • Toma datos y los utiliza para con machine learning encontrar información valiosa.
  • Toma decisiones basadas en datos.
  • Incorporar datos a los productos de software.

Día a día de Data Scientist

  • Obtener, limpiar y procesar datos.
  • Diseñar y utilizar modelos de machine learning.
  • Monitorear la precisión de los datos.
  • Automatizar procesos de recolección y transformación de datos.
  • Crear reportes de información en tableros.
  • Incorporar datos a los productos.

Investigar las distintas organizaciones y sectores industriales para mejorar procesos y sistemas.
Recopilar datos que beneficiarán a la compañía y comunicar qué secciones de dichos datos son importantes.
Filtrar la información no deseada mediante técnicas de limpieza de datos.
Desarrollar algoritmos para facilitar las búsquedas de datos y racionalizar futuras búsquedas.
Organizar datos y comunicar información a la dirección, poniendo de relieve los patrones de información relevantes.
Presentar conclusiones y recomendar acciones, tanto a la dirección como a los departamentos potencialmente implicados. (MP)

¿Porqué a los científicos de datos les dicen unicornios?

Porque un profesional que se desempeña en esta disciplina requiere del dominio de habilidades matemáticas, de programación computacional y de visualización en un alto nivel de profundización, equivalente a muchos años de estudio. Sin embargo, independiente del nivel de dominio de esas áreas, es fundamental el conocimiento del negocio, para que los datos tengan un sentido y una utilidad para quienes los consumen. Es por ello que en Data Science UC trabajamos desde tus conocimientos y habilidades, reconociendo tu experiencia laboral y los intereses que tengas, y te ofrecemos especialización en estas 3 áreas para complementar tus habilidades.

IA y programación. Creo aplico más para Data Scientist.

Un Data scientist es alguien que es mejor en estadística que cualquier ingeniero de software y mejor en ingeniería de software que cualquier estadístico.

Se centra en el entrenamiento, evaluación y validación del modelo. También cubre parte de la obtención y a análisis de datos.

El /La DAta Scientis está en los procesos de Preparación de Datos, entrenamiento, evaluación y validación del Modelo.

Data scientis: recibe los datos verifica que es correcto e incorrecto, los deja listos para empezar a entrenar el software, monitorea que tan eficiente y preciso es el modelos decide si está completado, lo pone en producción y crea su interfaz para hacer que sea mas simple trabajar con él.
Data Analyst: Formula sus hipotesis para entender cada caso, busca extraer la información a través de encuestas u otros medios como tablas de datos , los inspecciona para encontrar lo mas relevante, luego los analiza es decir les da sentido para encontrar que está ocurriendo de una forma mas precisa, por ultimo le comunica los hallazgos a todos aquellos que no forman parte del equipo de analisis.

Básicamente el cientifico de datos es un perfil más completo que el de analista. Por eso es lógico que al inicio del desarrollo de esta profesión hace unos años el cientifico de datos era el de todero de los datos en las organizaciones hasta se estableció el rol del analista desempeñando un cargo más junior en las funciones del área.

Hola, la diferencia radica que el DS crea modelos de predicción y utiliza herramientas de programación más complejos, mientras que el DA se enfoca en el estado actual de la información y utiliza programación más básica o en ocasiones no la utiliza.

Diferencia entre data scientist vs data analyst.

Concepto de una data scientist.

Un science Data necesitaÑ
Elaborar de manera adecueda una pregunta a un problema en particular.
Saber que datos necesita para evaluarlo y pedirlos.
Ordenarlos.
Sacar conclusiones
Mostrar resultados.