1

APUNTES DEL CURSO 🥰

Luisa
LuisaC
3023
  • Guía para Empezar una Carrera en Data Science e Inteligencia Artificial

    Data science es el proceso de descubrir información valiosa de los datos, con objetivos de:

    • Toma de decisiones y así de la creación de estrategias de negocio
    • Crear software mas inteligente y funcional

El proceso trata de:

  • Obtener datos
  • Limpiar los datos
  • Explorar, analizar y visualizar lo datos
  • Usar ML
  • Integración de los datos

El proceso de basa en el método científico:

  • Hacer una pregunta interesante
  • Obtener los datos
  • Explorar los datos
  • Analizar los datos
  • Comunicar y visualizar resultados

Es un ciclo, logrando volver al paso que sea dependiendo del caso.

Inteligencia artificial es diferente al Data science, sin embargo trabajan en conjunto.

La inteligencia artificial son algoritmos que pretenden emular la inteligencia natural, sobre aprender, ver, escuchar, reconociendo patrones en archivos para así aprender y reconocer. El machine learning es una de las ramas de la inteligencia artificial, cuyo objetivo es hacer que las maquinas aprendan ya que se le pasan muchos datos y arroja un modelo con el que se pueden resolver muchos problemas.

Los datos de entrenamiento son diferentes a los de entrada, pueden venir dela misma fuente, pero son distintos. Con este entrenamiento y el modelo que arroja se pueden predecir ciertas cosas, por ejemplo perdidas de clientes en empresas, productos, etc

En Data Science se usa la IA como herramienta para las predicciones.

Roles en la industria:

  • Data Scientist
  • Data Analyst
  • Data Engineer
  • ML Engineer (Machine Learning Engineer)

Data Science NO es:

  • Magia
  • IA
  • Tener métricas sin hallazgos de valor
  • Pura matemática
  • Trabajar solo con Big Data

IMPORTANTE:

  • Para Data Science el aprendizaje constante es parte de tu vida
  • Hay trabajo sucio, limpiar los datos y quesean confiables
  • Hay que comunicar y negociar lo que logras
  • Motivación para ayudar a otras personas para que conozcan información de valor

¿Por qué SI aprender Data Science?

  • Te emociona la información de valor en datos o gráficas
  • Te interesa la aplicación de las matemáticas y algoritmos
  • Quieres crear software que cambien al mundo con IA

¿Qué hace una Data Analyst?

El objetivo dela Data Analyst es analizar informaciónde valor para ayudar a resolver las necesidades de cada una de las áreas de una organización, lo hace de manera que:

Extra, limpia, analiza y reporta los datos, con diferencia de un Data scientist es que el Analyst se ocupa de analizar el presente. Importante identificar las necesidades de informaciónque surgen dedía a día, formulados con preguntas quese pueden responder con datos y extraer los datos a través de sql o python, limpiar y ordenar los datos, para poder analizar e identificar patrones, y luego comunica los hallazgos.

Herramientas y tecnologías para Data Analysts

  • Consultas de bases de datos con SQL
  • Software para la visualización como Power BI y Tableau
  • Excel y Google Sheets
  • Porgramación con Python o R
  • Jupyter Notebooks
  • Librerias de visualizacion Pandas, Matplotlib, Numpy
  • Matemáticas, probabilidad y estadística descriptiva

¿Cómo empezar?: Cómo usan los datos las organizaciones con Business Intelligence, Consultar bases de datos con SQL, herramientas para análisis de datos, estadística aplicada a análisis de datos

¿Qué hace una Data Scientist?

Toma datos de diferentes fuentes sea interno o externo a la empresa, los usa para encontrar valiosa información o servicios de Machine Learning, para así tomar decisiones basadas en datos, e incorporar datos a los productos de software. Obtiene, limpia y procesa datos, también diseña y utiliza modelos deML y ver hacia el futuro de los resultados, supervisar la precisiónde los datos, automatizar procesos para agilizar la recolecciónde datos, crear informes detallados en paneles deanálisis para otros equipos, ayuda a crear productos basados en datos trabajando dela mano con el equipo de ingeniería.
Herramientas y tecnologías para Data Scientists

  • Python, R y Paradigma de programación orientada a objetos
  • Librerías de Python: NumPy, Pandas y Matplotlib
  • Jupyter Notebooks
  • SQL y No SQL.
  • Algoritmos y librerías de Machine Learning como: Scikit-learn y TensorFlow
  • Álgebra
  • Estadística descriptiva y estadística inferencial
  • Probabilidad
  • Álgebra lineal
  • Cálculo

¿Cómo comenzar tu camino en el mundo de Data Science?

1. Entender cómo se utilizan los datos, aprender Business Intelligence y cómo es el proceso de datos en las organizaciones
2. Programar con Python
3. Saber las principales librerías de procesamiento, análisis y visualizaciónde datos en Python
4. Conocer las Jupyter Notebooks
5. Aprender estadística y probabilidad aplicada a Data Science
6. Crear tus primeros proyectos

Todos estos conocimientos y habilidades son los que debes tener para convertirte en una Data Scientist.

¿Qué hace una Data Engineer?

El data Engineer toma los datos crudos y los almacena en bases de datos, para que las demas personas tengan datos con los que trabajar, creando pipelines ETL (Extracción, transformación, Load(Carga))

Día a día de una Data Engineer

  • Desarrolla y mantiene pipelines de ETL y bases de datos, para transformar los datos crudos
  • Extraer datos de diferentes fuentes, ya sean internas o externas. Lo importante es que sean de valor para el negocio
  • Transformar los datos crudos para el análisis, ya que estos en su forma original no se pueden analizar
  • Almacenar datos limpios en bases de datos especializadas para el análisis. Debido a que las bases de datos usadas en producción suelen ser OLTP (Online Transactional Processing) y si se hacen análisis en estas se pueden romper. Por lo tanto, los datos se deben transportar a bases de datos OLAP (Online Analytical Procesing)
  • Crear automatizaciones para que los datos estén constantemente actualizados

Este es un breve resumen del curso, espero les sirva y sea de apoyo.

Escribe tu comentario
+ 2