El mundo de los datos: data science y machine learning

1

Aprende ciencia y análisis de datos para optimizar las estrategias de tu negocio

2

Retos para aprender ciencia de datos

3

¿Qué es ciencia de datos y big data? ¿Cómo afectan a mi negocio?

4

¿Qué tipo de información podemos analizar?

5

¿Cómo crear empresas y culturas data-driven?

6

¿Qué es inteligencia artificial y machine learning?

7

¿Qué es deep learning? Análisis de imagen, audio y video

Herramientas y roles de trabajo en ciencia de datos

8

Flujo de trabajo en ciencia de datos: fases, roles y oportunidades laborales

9

Herramientas para cada etapa del análisis de datos

10

¿Qué es y cómo usar una base de datos relacional con SQL?

11

Cómo estructurar queries en SQL

12

Conflictos y retos actuales sobre la ética y tratamiento de datos

Problema de negocio: análisis

13

Aplica técnicas de storytelling para convertir problemas de datos en historias

14

Cómo estructurar un caso de negocio

15

Análisis cuantitativo en un caso de negocio

16

Análisis cualitativo en un caso de negocio

17

Fusión cuanti-cualitativa en un caso de negocio

18

¿Qué es minería de texto? ¿Cómo usarla para obtener información adicional?

19

Variación de comportamientos a partir de la geolocalización

Problema de negocio: implementación

20

Acciones, algoritmos y toma de decisiones según los resultados del análisis

21

Apuntes y cursos para aprender ciencia de datos

22

Continúa aprendiendo ciencia y análisis de datos para ejecutar estrategias efectivas

23

👥🦾 Actividades de la comunidad de la Escuela de Data Science e Inteligencia Artificial

Aprende ciencia y análisis de datos para optimizar las estrategias de tu negocio

1/23
Recursos
Transcripción

Aportes 123

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

¿Qué es y qué hace el Científico de datos o Data Scientist?
Científico de datos: Persona que sabe más de estadística que cualquier programador y que a la vez sabe más de programación que cualquier estadístico.
Profesional dedicado a analizar e interpretar grandes bases de datos.

■Recopilar grandes cantidades de datos revueltos y transformarlos a un formato más utilizable.
■Resolver problemas relacionados con negocios empleando técnicas basadas en datos.
■Trabajar con diversos lenguajes de programación, incluidos SAS, R y Python.
■Dominar técnicas analíticas como el machine learning, deep learning y analítica de texto.
■Buscar orden y patrones en datos, además de detectar tendencias que puedan ayudar a la base de
operación de una empresa.

buscando en Reddit me encontré con un post muy bueno sobre aquellos detalles que alguien trabajando con datos debe desarrollar. Algo así como el día a día de un Data Scientist más como resaltar aptitudes en el CV, se los comparto En este enlace

Wow que emoción empezar este curso 😃

Me gustó mucho este artículo y me parece muy bueno para introducirnos en el curso.
https://www.innoarchitech.com/blog/what-is-data-science-does-data-scientist-do

Además del conocimiento en programación y matemáticas, una habilidad elemental de un científico de datos es el conocimiento del negocio. Recuerden que por muchas habilidades y conocimientos que tenga el científico de datos, si no sabe nada del negocio, no podrá darle sentido a los datos

Un científico de datos es aquel capaz de recopilar y analizar datos para resolver problemas de negocios.

¡Estoy muy feliz de iniciar mi ruta de data science!

“Data for good”

Todos los que se dediquen a estudiar los datos tienen un superpoder.

Un superpoder de crear un gran impacto social positivo analizando cantidades masivas de datos.

Analizando el pasado, presente y futuro.

“El futuro influencia el presente tando como el pasado” - Friedrich Nietzsche

Los que lean esto, que sepan que pueden mejorar a latinoamérica y al mundo.

Data for good!

Toda la fe le tengo a este curso!!!

Vi una pregunta que decía ¿Qué es la teoría de juegos?
La quisiera responder desde mi rama de estudio, soy economista y mire mucha teoría de juegos en mi carrera. La teoría de juegos es la implementación de modelos predictivos basados en la lógica matemática, estadística y económica, que busca predecir las decisiones de otro individuo o individuos que se desenvuelvan en el mismo sector, asumiendo el costo de oportunidad. Ejemplo: lograr predecir una acción del otro bando en guerra en base a mis decisiones.

Aquí pueden encontrar material para complementar el aprendizaje:

Cómo aprender ciencia de datos desde principiantes hasta maestros en solo 1 año.
https://towardsdatascience.com/how-to-learn-data-science-from-beginners-to-masters-in-just-1-year-my-personal-experience-6152bedd8157

Gran curso Silvia.

Estoy muy emocionado de empezar este curso !

Muy emocionada por comenzar en este curso !

Muy buen lema “Data for Good”!!

Gracias por poner este curso. Me parece fundamental este tipo de introducción. Voy por el séptimo curso y tenía bastantes vacíos acerca de la ciencia de Datos. Bien jugado.

tengo un repositorio donde estoy tomando todos los apuntes que deja la comunidad de la ruta de Inteligencia Artificial y Machine Learning
lees comparto el repo para aquellos que deseen contribuir
https://github.com/elmergustavo/Inteligencia-Artificial-y-Machine-Learning

Ya estoy a punto de graduarme de la universidad. Ser Data science es una rama que me llama demasiado la atención. Sería recomendable o sería una buna opción elegir ese “camino” de la ciencia de datos o ingeniero de datos o ingeniero de ML una vez finalice la carrera?. Qué pensais?

Me siento emocionado por conocer más de este mundo de los datos, que hasta ahora es extraño para mí. Motivación y ganas de aprender al 200% .

Objectives:
- What is data?
- What is the data for?
- What types of data exist?
- What is the ethics of date?
- Create your role this universe
- Data is for me
- Solve a problem using storytelling

Emocianádo por este curso!! 😃

Un curso fundamental para la escuela de Ciencia de Datos. Y resaltando la importancia que tiene los datos y el análisis de negocios o Business Analysis(BA)

Gracias a Datacademy estoy acá iniciando este camino de Datos.
Gracias Platzi 💚

Les recomiendo mucho este enlace, me ayudo a comprender mejor el camino que voy a tomar.

https://platzi.com/datos/

Es de suma importancia conocer los términos siguientes:

https://platzi.com/blog/que-es-un-etl/
ETL por sus siglas en inglés (Extract, Transform, Load) representa extracción, transformación y carga. Básicamente consiste en “Extraer” los datos crudos desde su origen (Source), “Transformarlos” según nuestras necesidades de analítica o la estructura que deseamos y “Cargarlos” a una base de datos orientada a procesos analíticos (Target).

Porque es importante el proceso de ETL?
¿todos los datos están listos para ser analizados? La respuesta es NO, la gran mayoría de los datos nacen con una estructura que no es adecuada para el análisis de datos, vienen en formatos desestructurados como JSON o XML, con valores nulos, datos errados, caracteres inválidos, registros duplicados y demás problemas a los que los científicos de datos e ingenieros de datos nos enfrentamos día a día. Pero calma, a pesar de este caos hay una solución: un proceso de ETL.

Extracción:
Acá nace la magia. En este punto es cuando, valga la redundancia, extraemos los datos. Vale la pena resaltar que nuestro origen de datos o “source” puede contener múltiples fuentes de datos. Imagina que requieres extraer la información de una base de datos en PostgreSQL, otra base de datos en Oracle y un archivo CSV que te genera a diario el área de contabilidad. Es muy importante que en este punto tengas en cuenta cuál es el formato y las características de nuestros datos, pues esto nos indicara la mejor manera de extraerlos.
Un ejemplo de esto es si quieres consultar millones de registros de una base de datos, posiblemente hacerlo en un solo “select” estresara el motor de base de datos y tu proceso ETL empezará a tener inconvenientes, lo mejor seria ejecutar este proceso en pequeños lotes incrementales hasta terminar el total de los datos. El éxito de una buena extracción es que cause el menor impacto en el origen de los datos.
Teniendo eso en cuenta puedes hacer tus extracciones de dos formas:
Totales: cada ejecución de extrae en un único llamado la totalidad de tus datos a procesar .
Incremental: el ETL extrae los datos en pequeños lotes múltiples veces. Un ejemplo es un ETL que se ejecuta diariamente, pero solo consulta los datos del día anterior a su ejecución para trabajar con ellos.
Transformación:
En este punto aplicaremos las reglas que tu negocio demanda para realizar un buen proceso de analítica, estas reglas suelen incluir procesos como:
Filtrar filas por ciertas características.
Eliminar duplicados.
Transformar datos (por ejemplo, si el país es Colombia, reemplázalo por 1) México, 2) Perú, 3) Ecuador, etc.).
Calcular datos nuevos (por ejemplo, con la fecha de nacimiento calcular la edad).
Agrupar datos (máximo valor, mínimo valor, promedios, conteos, etc.).
Unir o combinar datos de distintas fuentes.
Pivotar las tablas.
Dividir columnas (nombre completo se puede transformar en primer nombre, segundo nombre, primer apellido y segundo apellido).
Y estas solo son algunas de las transformaciones más comunes, este proceso depende mucho de lo que quieras obtener de los datos una vez la cargues al destino o “Target”.
Tal vez en este punto te preguntes “¿y en dónde se realizan estas transformaciones? ¿En el “Source” o en el “Target”?”. Y la respuesta es: ninguna de las dos. Estas transformaciones se realizan en el área de “Staging”, un repositorio temporal para procesar estos datos, funciona por medio de tablas o archivos planos dependiendo de la herramienta de ETL que uses, una vez los datos pasan al destino, este repositorio temporal es eliminado.
Carga:
Este es el proceso final de nuestro ETL. Nuestros datos deben estar transformados y listos en el área de staging, así que ahora debemos proceder a cargarlos a nuestra base de datos de analítica. Esta base de datos comúnmente es un datawarehouse en donde conviven distintos repositorios de datos de una manera no normalizada (como en una base de datos relacional) y con una estructura lista para realizar análisis de datos.
En este punto también debemos tener en cuenta qué motor corre nuestra base de datos de destino, pues dependiendo de esto existen distintas formas más eficientes de cargar la información. Por ejemplo, una base de datos en Redshift es mucho más eficiente haciendo un “Copy” basados en un archivo plano y no realizando tareas de “insert” registro a registro, bases de datos como Oracle son muy buenas haciendo “Bulk Collect” de inserción de datos.
Una vez realizado el cargue de datos tus tablas están listas para ser consultadas en cualquier proceso de analítica y darle valor a tu organización basados en datos.
Sácale provecho
En la economía actual la demanda de datos es muy alta y una base muy importante son los procesos recolección e ingesta de datos y acá un ETL es el rey del baile. Te invito a que aprendas más de este tema pues la clave de un buen proceso de analítica está en el origen de los datos, si basura entra, basura sale, un buen proceso de ETL es fundamental para darle valor a tus datos.
Te recomiendo seguir estos cursos para saber más acerca del tema:
Curso de Ingeniería de Datos con Python: https://platzi.com/clases/ingenieria-datos/
Fundamentos de Bases de Datos: https://platzi.com/clases/bd/
Curso de Big Data en AWS: https://platzi.com/clases/big-data/
Cuéntame en los comentarios si te quedo alguna duda al respecto o como te puedo ayudar. Recuerda: Nunca Pares De Aprender.

¿Qué es un Data Warehouse?

Un Data Warehouse es esencial para realizar procesos de analítica y toma de decisiones, en especial para los proyectos de Bussines Intelligence (BI) de cualquier empresa.

Cuáles son los Data Warehouse más populares?
• Amazon RedShift
• Google BigQuery
• Oracle
• Microsoft Azure Synapse
• Cloudera

¿Qué es visualización de datos y para qué sirve?
https://platzi.com/blog/visualizacion-de-datos/

Libros de BI

https://platzi.com/blog/libros-inteligencia-negocios/

Curso de Tableu:
https://platzi.com/cursos/tableau/

Este curso es mucho más importante de lo que parece, más allá de los conocimientos de programación y matemáticas. El domain knowledge o conocimiento del entorno es básicamente comprender la realidad del negocio que vas a analizar para afrontarlo con suficiente perspectiva y tomar buenas decisiones!

¡Qué interesante se ve este curso!

Data Science, un resumen del video " Estrategias para empezar en Data Science" de Yesi Díaz, excelente:

CIENTÍFICO DE DATOS
"Persona que sabe más de estadística que cualquier programador y sabe más, de programación que cualquier estadístico"
Josh Wills

Dominar 3 aspectos fundamentales

  • Matemáticas y estadísticas

  • Ciencias de la computación

  • Experiencia en el campo

BASES

  • Machine Learning

  • IA

Estrategias para triunfar

  • Crea valor a través de los datos

  • Mejorar habilidades técnicas (fundamentos matemáticos y estadísticos)

  • No Temer a las matemáticas y la estadística

  • Hacer la preguntas correctas para resolver problemas reales

  • Nunca olvidar a quién va dirigido

We will see if it is my way to continue my career in data science.

Iniciando el cuso, me llama bastante el mundo de los datos y quiero explorarlo
data for good excelente

17 de Septiembre sin procrastinar mas a comenzar a ver la escuela de Data Science.
Hay mucho que aprender y espero que cada uno de ustedes logren ser el Data Scienst que sueñan! .

Suerte a todos en este camino!.

Interesante curso para sentar las bases del analisis de los datos.

Vamos con todo.

Aquí inicio mi trayectoria a la Ciencia de Datos. 😱♥️🍀🛩️🚁⚡

Increible! emocionado de emprender este camino en la ciencia de datos.

Esta ruta esta cada vez más pro, Nunca pares de aprender!

Hoy inicio la ruta de ciencia de datos, tengo muchas ganas de aprender.

A pulir más esta apasionante carrera!

Con toda en este curso!!!

Hoy 26 de 12 de 21 empiezo la escuela de data science e IA. A por todo y más.

Iniciando esta aventura con voluntad, miedo, entusiasmo, inseguridad, pero sobre todo con muchas ganas de hacerlo bien.

Lo mejor para el presente y futuro “La Ciencia de Datos”. Vamos con toda!

Dentro del mundo de las compras, la ciencia de datos se está volviendo un tema primordial, ya que como es ley, sin información no puede haber toma de decisiones, no se pueden generar KPI’S, SLA’S etc. y sin ello no se pueden medir ahorros, (hard & soft) eficiencias, manejo de la cadena de procure to pay, etc.

Desde hoy comienzo el reto de data science, vamos!

El marketing sin datos es como conducir con los ojos cerrados. Mejorar la toma decisiones es emocionante poder aplicar los datos y saber cuales son los que realmente importan.

Señores:

Estoy muy emocionado enserio, sé que el camino no será facil.
Vamos con toda!

Aqui vamos!!!

¡Ya me muero por empezar! estoy súper animada. ¡Ciencia de Datos allá voy!

No creo ser el único emocionado, pero hoy arranco hacia mi futuro como data scientist siguiendo la ruta de aprendizaje de la Escuela de Data Science.

fundamental este curso! hacia falta algo así para darnos introducción a lo que veremos más adelante en otros cursos!

Super contenta de estar estudiando este tema!!!..demasiado interesante!!!..

A la expectativa con este curso, iniciando un nuevo aprendizaje en mi vida y en búsqueda de mejorar mi perfil profesional y laboral. Muchos éxitos a todos los que inician este nuevo camino.

Muy emocionada por tomar este curso!

MI camino en el Data Science

Vamos con toda la actitud.

chicos estoy muy emocionada por estudiar ciencia de datos !!!

Excelente!

Cómo es la cosa entonces ?
ciencia de datos o “deira saiens”

Vamos!!!

Soy estudiante de Física pero quiero adentrarme en este mundo que avanza a pasos agigantados que es la Data Science

Esperando este curso desde semanas atrás

GENIAL!!!
Tiempo esperandolo!
Vamos con toda! 😄

Data for good 💪🏼

Información resumida de esta clase
#EstudiantesDePlatzi

  • Bienvenidosss 😃
  • Vamos a aprender mucho

Data For Good!!! Excelente!

Emocionado por empezar la carrera de Data Analyst 🔥
  • ¿qué son los datos?
  • ¿para qué sirven?
  • diferentes tipos de datos
  • ética de los datos
  • rol en ciencias de datos
  • fase de los datos
  • hipótesis a solución
  • storytelling

Me gusta que la profe, su especialidad es en politicas públicas

Iniciando en el mundo de los datos. Nuevo reto 2022!

Empecemos!

Hoy 26/01/22 empezamos con esta carrera de data science 😄 I am so eager to learn a lot from it.

Algunas Golden Nuggets de este increíble aporte en Reddit sobre que es una Data Science y como encontrar tu primer puesto con junior.

  • Eres ridículamente caro: muéstrame cómo agregarás valor. Hay un equipo en cada empresa privada que todos los demás departamentos temen y temen. Se llaman “Finanzas” y son la ruina de la vida de todos los gerentes
  • La forma más rápida de llevar su CV a la cima de la pila: asegúrese de que pueda ver su manipulación de datos, así como sus habilidades en ciencia de datos.
  • gran parte de la ciencia de datos es especulativa, tendrá 10 ideas por cada pieza real de trabajo sólido que realice. Para esas ideas, por lo general necesitará juntar una muestra de datos, darle un vistazo, arreglarlo un poco, hacer un trabajo básico y ver si es práctico. Eso significa que 9 de cada 10 de esas tareas que hagas serán desechables.
  • “Monería de datos”: no estás haciendo ciencia, estás jugando con los datos. De manera realista, en el transcurso de un año, probablemente pasará el 50% de su tiempo haciendo trabajo de Data Monkey en lugar de Data Science real.
  • Aprenda a lidiar con la basura Los datos del mundo real son, por lo general, basura. Tienes que ser MUY bueno lidiando con la basura.
  • Aprende a contar una historia y no dar miedo.
  • Mostrar adaptabilidad y aprendizaje continuo, pero también equilibrio, Sé lo suficientemente consciente de lo que eres y muéstralo a los reclutadores, si eres un entusiasta, MUÉSTRALO . Si es un 9-5er, MUÉSTRALO .
  • Comprenda, no solo aprenda, algo de informática y algo de física.


Link al comentario https://www.reddit.com/r/datascience/comments/3m78k1/i_hire_data_scientists_this_is_the_stuff_this/?utm_medium=android_app&utm_source=share

  • Que aprenderás en el curso.
  • Entender que son y para que sirven los datos.
  • Saber si me quiero dedicar a los datos.

Todo esto es nuevo para mi y es uno de mis retos #NuncaParesDeAprender
No existen brechas si sabemos construir puentes

Venga a darle con todo

Este es el primer curso de éste año que hago en un área que desconozco totalmente, donde ni siquiera tengo bases sobre desarrollo de software, programación o (como un refuerzo bastante útil, seguramente) matemáticas. Lo hago únicamente por abrirme, porque siento curiosidad y creo firmemente en que mi entusiasmo me está trayendo a un buen lugar cuando veo el contenido del curso. Daré todo por sacarle el máximo provecho para aprender de ello.

Resumen:

  • Aprender el mundo de los datos.
  • Entender qué son, para qué sirven.
  • Qué tipo de datos hay en nuestro entorno y en la industria.
  • Ética de datos.
  • Crear rol dentro de este universo.
  • Saber si quiero dedicarme a los datos y en qué fase.
  • Hacer problema completo de storytelling con caso de problema hipótesis, solución y estrategia.

Aprende ciencia y análisis de datos para optimizar las estrategias de tu negocio
¿Qué aprenderás en este curso?

  • Entender qué son los datos y para qué sirven.
  • Cuáles son los tipos de datos en la industria.
  • Cuál es tu rol en ese sector.
  • Lograrás identificar si quieres dedicarte a los datos y en qué fase de los mismos.
  • Desarrollarás un problema completo de Storytelling.

Muy bien, empecemos!!!

Feliz de empezar este curso!

Actualmente con datos mejoramos todo nuestro entorno conocerlos es lo mejor, Gracias silvia por este curso y la experiencia brindada.

Definición de ciencia de datos

La ciencia de datos combina múltiples campos, como las estadísticas, los métodos científicos, la inteligencia artificial (IA) y el análisis de datos para extraer el valor de los datos. Los practicantes de la ciencia de datos se llaman científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, teléfonos inteligentes, clientes, sensores y otras fuentes para obtener información útil.

La ciencia de datos abarca la preparación de los datos para el análisis, incluida la limpieza, la agregación y la manipulación de los datos para realizar análisis avanzados. Las aplicaciones analíticas y los científicos de datos pueden revisar los resultados para descubrir patrones y permitir que los líderes empresariales obtengan información fundamentada.
Ciencia de datos: Un recurso inexplotado para el aprendizaje autónomo

La ciencia de datos es uno de los campos más emocionantes que existen en la actualidad. Pero, ¿por qué es tan importante?

Porque las empresas disponen un tesoro de datos sin aprovechar. Ahora que la tecnología moderna ha permitido la creación y el almacenamiento de cantidades cada vez mayores de información, el volumen de datos explotó. Se estima que el 90% de los datos en el mundo se crearon en los últimos dos años. Por ejemplo, los usuarios de Facebook suben 10 millones de fotos por hora.

Pero estos datos frecuentemente solo están inmóviles en las bases de datos y los lagos de datos, básicamente sin tocar.

La gran cantidad de datos recopilados y almacenados por estas tecnologías puede generar beneficios transformadores para las organizaciones y sociedades de todo el mundo, pero solo si sabemos interpretarlos. Ahí es donde entra en acción la ciencia de datos.

La ciencia de datos revela tendencias y genera información que las empresas pueden utilizar para tomar mejores decisiones y crear productos y servicios más innovadores. Quizás lo más importante es que permite que los modelos de aprendizaje autónomo (ML) aprendan de las grandes cantidades de datos que se les suministran en vez de depender principalmente de los analistas de negocios para ver qué pueden descubrir a partir de los datos.

Los datos son la base de la innovación, pero su valor proviene de la información que los científicos pueden extraer y luego utilizar a partir de estos.
¿Cuál es la diferencia entre la ciencia de datos, la inteligencia artificial y el aprendizaje autónomo?

Para comprender mejor la ciencia de datos (y cómo puede aprovecharla) es igual de importante conocer otros términos relacionados con el campo, como inteligencia artificial (IA) y aprendizaje autónomo. Frecuentemente, encontrará que estos términos se usan indistintamente, pero hay matices.

Este es un breve resumen:

IA significa hacer que una computadora imite de alguna manera el comportamiento humano.
La ciencia de datos es un subconjunto de la IA que se refiere más a las áreas superpuestas de las estadísticas, los métodos científicos y el análisis de datos, que se utilizan todas para extraer significado y conocimientos de los datos.
El aprendizaje autónomo es otro subconjunto de la IA y consiste en las técnicas que permiten que las computadoras descubran cosas a partir de los datos y realicen aplicaciones de IA.
Y, por si acaso, incluimos otra definición.
Aprendizaje profundo, que es un subconjunto del aprendizaje autónomo que permite que las computadoras resuelvan problemas más complejos.

Cómo la ciencia de datos está transformando los negocios

Las organizaciones están utilizando la ciencia de datos para convertir los datos en una ventaja competitiva al perfeccionar los productos y servicios. Algunos casos de uso de la ciencia de datos y el aprendizaje autónomo incluyen:

Determinar la fuga de clientes analizando los datos que se recopilan de los centros de llamadas, para que el departamento de Marketing pueda tomar medidas a fin de retenerlos.
Mejorar la eficiencia al analizar los patrones de tráfico, las condiciones climáticas y otros factores para que las empresas de logística puedan mejorar los tiempos de entrega y reducir los costos.
Mejorar los diagnósticos de los pacientes mediante el análisis de los exámenes médicos y los síntomas informados para que los médicos puedan diagnosticar antes las enfermedades y tratarlas de manera más eficaz.
Optimizar la cadena de suministro al predecir cuándo se producirán fallos en los equipos.
Detectar los fraudes en los servicios financieros mediante el reconocimiento de los comportamientos sospechosos y las acciones anómalas.
Mejorar las ventas al crear recomendaciones para los clientes basadas en las compras anteriores.

Muchas empresas han hecho de la ciencia de datos una prioridad y están realizando grandes inversiones en ella. En la última encuesta de Gartner a más de 3000 directores de informática, los encuestados clasificaron el análisis y la inteligencia empresarial como las tecnologías más importantes para diferenciar a sus organizaciones. Los directores de informática encuestados ven estas tecnologías como las más estratégicas para sus empresas y están realizando las inversiones correspondientes.
Cómo se lleva a cabo la ciencia de datos

El proceso de analizar y utilizar los datos es iterativo más que lineal, pero este es el flujo normal del ciclo de vida de la ciencia de datos para un proyecto de modelado de datos:

Planificación: Definir un proyecto y sus posibles resultados.

Construir un modelo de datos: Los científicos de datos frecuentemente usan una variedad de bibliotecas de código abierto o herramientas en la base de datos para construir modelos de aprendizaje autónomo. A menudo, los usuarios necesitan API para que los ayuden con la ingestión de datos, la visualización y creación de perfiles de datos o la ingeniería de funciones. Necesitan las herramientas adecuadas, así como acceso a los datos correctos y otros recursos como la capacidad de proceso.

Evaluar un modelo: Los científicos de datos deben lograr un alto porcentaje de exactitud en sus modelos antes de poder implementarlos con confianza. La evaluación del modelo habitualmente genera un conjunto completo de métricas de evaluación y visualizaciones para medir el rendimiento del modelo frente a los datos nuevos y también para clasificarlos a lo largo del tiempo a fin de permitir un comportamiento óptimo en la producción. La evaluación del modelo va más allá del rendimiento en bruto para tener en cuenta el comportamiento de referencia esperado.

Explicar los modelos: No siempre hemos sido capaces de explicar la mecánica interna de los resultados de los modelos de aprendizaje autónomo en términos humanos, pero esto es cada vez más importante. Los científicos de datos desean recibir explicaciones automatizadas de la ponderación relativa y la importancia de los factores que intervienen en la generación de una predicción, junto con detalles explicativos específicos del modelo sobre las predicciones del modelo.

Implementar un modelo: Tomar un modelo de aprendizaje autónomo entrenado e implementarlo en los sistemas correctos es frecuentemente un proceso difícil y laborioso. Esto se puede simplificar operacionalizando los modelos como API escalables y seguras, o usando modelos de aprendizaje autónomo dentro de la base de datos.

Monitorear los modelos: Desafortunadamente, la implementación del modelo no es el paso final. Los modelos siempre deben monitorearse después de la implementación para garantizar que funcionen correctamente. Con el paso del tiempo, los datos con los que se entrenó el modelo pueden quedar obsoletos para las predicciones futuras. En la detección de fraudes, por ejemplo, los delincuentes siempre encuentran nuevas formas de piratear las cuentas.
Herramientas para la ciencia de datos

Crear, evaluar, implementar y monitorear los modelos de aprendizaje autónomo puede ser un proceso complejo. Es por eso que la cantidad de herramientas de ciencia de datos ha aumentado. Los científicos de datos utilizan muchos tipos de herramientas, pero una de las más comunes son los cuadernos de código abierto, que son aplicaciones web para escribir y ejecutar código, visualizar datos y ver resultados, todo dentro de un mismo entorno.

Algunos de los cuadernos más populares son Jupyter, RStudio y Zepplin. Los cuadernos son muy útiles para realizar análisis, pero presentan ciertas limitaciones cuando los científicos de datos tienen que trabajar en equipo. Para resolver este problema, se crearon las plataformas de ciencia de datos.

Para determinar qué herramienta de ciencia de datos es adecuada para usted, es importante formular las siguientes preguntas: ¿Qué tipo de lenguajes utilizan sus científicos de datos? ¿Qué tipo de métodos de trabajo prefieren? ¿Qué tipo de fuentes de datos usan?

Por ejemplo, algunos usuarios prefieren tener un servicio independiente de la fuente de datos que utilice bibliotecas de código abierto. Otros prefieren la velocidad de los algoritmos de aprendizaje autónomo en la base de datos.

Resumenn de la clase:
Vas a entender:

  • Que son los datos
  • Para que sirven
  • Que tipos de datos hay
  • Ética de los datos
  • Tu rol
  • Si quieres dedicarte a los datos y en que fase de los datos

Reto de story tale de negocio: desde la hipótesis hasta la solución

Tengo muchas expectativas con este curso, necesito aprender mucho para mis prácticas universitarias!!!

Tomaba el curso de “Introducción a Data Science” de IBM, y formulé mi concepto xd:

“Data would be a hidden element in Avatar The Last Airbender, and non even the Avatar could
control it, but a data scientist can. To do so, It requires mastering, comprehension, and a
paradigm shift. But it is not as simple as controlling it, it is almost all about what we can do
with it.”

Apasionado por los datos, aprender a crear un rol y manejar los datos con etica

En esta clase aprendí que mi es:

Data for Good.

Doy inicio a mi carrera como cientifico de datos!

Data for good 💯

🤗Qué emoción iniciar este curso y sobre todo la escuela de Data Science, le quiero apostar fuerte a esta rama de la tecnología porque me apasiona mucho la forma en que los datos pasan de ser simples cadenas de texto a conocimiento valiosísimo para toda empresa.

Emocionado por nuevos retos 😄

Por mera coincidencia comencé a trabajar con los datos y me encantó el tema ya que facilita muchísimo la toma de decisiones y se han vuelto la mejor fuente de argumentación para la planes de acción que se realizan en las empresas.

Hola, soy nuevo en PLATZY, espero poder aprender mucho e impulsar mi carrera tengo como base estudios el área de ciencias económicas.

Estoy iniciando en este campo del manejo y analisis de datos, viendolo como un opción de cambio de carrera (actualmente soy Ing. Ambiental). Algún consejo?