Regálate acceso ilimitado a todos los cursos por 1 año a precio especial de Navidad 🎄

Antes: $199

Currency
$149/año
regístrate

termina en:

15D
23H
51M
38S

¿Qué es la Ciencia e Ingeniería de Datos?

3/38
Recursos

La Ciencia de Datos es la disciplina que se encarga de extraer conocimiento de los datos disponible. Casi siempre cuando te realizas una pregunta sobre datos estas fuentes se encuentran escondidas, ocultas o de difícil acceso. A nuestro alrededor hay datos en tu computadora, mesa, reloj, etc.

Los datos están por todas partes.

La Ciencia de datos es multidisciplinaria. A diferencia de muchos otros ámbitos profesionales dentro del mundo de la tecnología cuando hablamos de un científico de datos es una persona que sabe de matemáticas, ingeniería de software y sabe de negocios.

Se apoya en la Computer science, Matemáticas(Regresiones e Inferencias),

También se auxilia de:

  • Bases de Datos
  • Análisis de texto y procesamiento de lenguaje natural
  • Análisis de redes
  • Visualización de datos
  • Machine learning e Inteligencia Artificial
  • Análisis de señales digitales
  • Análisis de datos en la nube(Big Data)

Aportes 68

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Bueno el señor era abogado y no tenia ninguna de esas 3 habilidades y si el pudo hasta el punto de dar el presente curso Yo también puedo.

¿Qué es la ciencia de datos?
Disciplina encargada de extraer conocimiento de los datos disponibles. Hay muchas fuentes de datos, pero normalmente están ocultas o son de difícil acceso. Por ejemplo, una mesa tiene datos: longitudes, marcas, año de fabricación, etc.
Un científico de datos sabe de matemáticas, ingeniería de software y de negocio. Si únicamente se tiene una de esas disciplinas, difícilmente se podrá trabajar de manera efectiva.
Se apoya en:
• Computer science: Las computadoras son la mejor herramienta para procesar datos. Se apoya de algoritmos, estructura de datos, visualizaciones que nos puede dar la computadora, conectar varias computadoras en paralelo en la nube, programación.
• Estadística (Math): se realizan regresiones, inferencias, identificación de variables y relación de variables.
• Conocimiento del dominio: Conocimiento sobre el negocio donde trabajamos. Hacer las preguntas correctas para interpretar los resultados correctamente.
Se auxilia de:
• Bases de datos: SQL (MySQL y Postgress) y NoSQL(Cassandra, Spark, etc).
• Análisis de texto y procesamiento de lenguaje natural.
• Análisis número de datos y minado de datos.
• Análisis de redes: Nodos y sus conexiones. Teoría de grafos
• Visualización de datos: Permite entender, contar historia sobre los datos y analizarlos rápidamente.
• Machine Learning e Inteligencia Artificial: Predecir y determinar el futuro.
• Análisis de señales digitales: Análisis de datos en tiempo real.
• Análisis de datos en la nube (Big Data): Data center que podemos utilizar eficientemente para procesar grandes cantidades de datos

La moneda de muchas empresas: los datos

Disciplinas de la ciencia de datos:

  • matematicas
  • ingenieria de software
  • negocios

los datos estan en todas partes como aporte el internet de las cosas ayudara mucho a obtener todos estos datos en los proximos años ya todo estara conectado a internet cuando se masifiquen las conexiones 5G.

El Dpto para la cual trabajo ha venido experimientando profundos cambios desde que se empezo con el analisis de datos, la informacion obtenida y el potencial que ofrece para mejora es increible. Ya la compañia ha creado un area de analisid de datos. Este es el futuro y espero ser parte activa de el.

WAU, creo que una persona para llegar a ser un experto en esto le llevará años, son muchas cosas que hay que saber… pero la clave es la matemática

Entre el minuto 7.02 y el 7.13 hace una comparación, entre presentar los datos en una hoja de excel y un starter plot o algo así… alguien sabe que es?

wow esto fue muy impecionante y me gusto mucho, realmente el campo de la programacion y la ciencia de datos son una herramienta muy poderosa y sus alcances ni digamos. "Aunque parezca una montaña alta, pero con trabajo y esfuerzo la podras alcanzar"
La NUBE // es para los programadores un conjunto de data center donde podemos analizar grandes cantidades de datos.
entre otros conceptos solo con la Intro…😎

Muy Buena descripción

Con muchas expectativas!!
“Datos por todas partes”

Nadie me preguntó verdad¿? igual se los platico:

He tomado varios cursos, pero mi compu tiene Windows, entonces en algunos cursos ha habido activiades que no pude hacer por mi SO: de plano me cambié a linux y voy a retomar los cursos (voy a tener que aprender este SO). sería bueno que me desearan suerte.

Hay mas de 20 K millones de dispositivos conectados a Internet (20 billions of IOTdevices), en la actualidad y todos estos dispositivos generan datos.

/* en español no son billones porque en español un billón es un millón de millones */

https://www.statista.com/statistics/471264/iot-number-of-connected-devices-worldwide/

Una introducción muy amplia con respecto al tema. El interés aumenta.

Datos por todos lados!

Datos, datos, datos … uno de los recursos mas importantes en la actualidad.

Excelente la introduccion, hay mucho que aprender.

Que mundo tan interesante. Ingeniería de datos

Hay que resaltar que David ha aprendido a expresarse mejor en los videos, llevar un hilo de temas y hasta puede que llevar un guíon, se ve que divaga menos y es mas concreto en las ideas, sin embargo, los slides aun se quedan cortos para captar las ideas de lo que dice, no importa si deben ser mas con tal de que no se pierda información.

Convengamos que es cierto lo multidisciplinario, pero en programacion no es solo saber python, tambien se puede saber R

En nuestro cerebro hay una base de datos que nos ayuda a aprender, comprender, reconocer, analizar y llegar al 100% comparando las cosas por su nombre, tipo, tamaño y mas características similares a tiempo real.

Que es la ciencia de datos?

Exprimir los datos para ganar CONOCIMIENTOS

Que disciplinas necesita un cientifico de datos?

Computer science

  • Estructuras de datos
  • Algoritmos
  • Visualizacion
  • Big Data support
  • Programacion

Estadistica

  • Regresiones
  • Inferencias

Conocimiento del negocio

  • Hacer las preguntas correctas
  • Interpretar los resultados

Campos que llegan a la ciencia de datos

  • Bases de datos
  • Analisis de texto y lenguaje natural
  • Analisis de redes
  • Analisis numerico y minado de datos
  • Visualizacion de datos
  • Machine learning e inteligencia artificial
  • Analisis de señales digitales
  • Analisis de Big Data

Hasta donde llevo estudiado de esta nueva (para mí) ciencia de datos, siempre he visto, leído, escuchado que Python es la mejor opción, porqué?, debido a su robustez en cuanto a la cantidad de data que suele manejar. Ahora la ciencia de datos no es solo aplicada en la Computación puede ser aplicada en cuantas disciplinas te puedas imaginar, medicina, ambiente, hospitalaria, etc; un universo donde podemos aplicar estos conocimientos para hacer predicciones, cálculos, manejo de datos y con esto podemos lograr un mejor manejo de costos, inventarios, etc.
La ciencia de datos te permite realizar infinidad de cosas de una manera y una visión mas amplia d lo que podríamos lograr prediciendo o haciendolo de la manera antigua XD.

Aroesti siempre el mejor

¿La ciencia e ingeniería de datos requiere de gran experiencia en código y programación para iniciarse o puede entenderse sin estos conocimientos previos?

La clase esta muy interesante.

Excelente explicación.

Muy bien, me interesa el análisis predictivo en tiempo real.

Que es lo que tengo que conocer de negocios y en que cursos de platzi puedo obtener esos conocimientos, para ser un data science…

Muy buena explicación e introducción. Muy interesado en el curso.

Vamos por otro conocimiento mas.

Genial la explicación del panorama que engloba la Ciencia de Datos.

Listo para aprender todo lo necesario

he estado haciendo el curso de introducción al ml y a ratos me pierdo en algunas cosas, debería ver este curso antes de ese para entenderlo mejor?

La ciencia de datos es una de las disciplinas mas útiles en este mundo moderno, se encarga de extraer conocimiento a partir de los datos disponibles, es multidisciplinaria.

  • Computer science
  • Estadística
  • Conocimiento del dominio
    El científico de datos efectivo debe tener conocimientos de matemáticas, ingeniera de software y saber o conocer del negocio.

El científico de datos debe tener las habilidades de trabajar con datos estructurados y no estructurados (SQL y NoSQL).

Excelente explicación y resumen muy bueno.

vamos a probar el curso lml

Las personas mienten, los DATOS no 😄

Interesante.

Muy interesante este tema…

Muy interesante el tema…

Me esta encantando este curso

La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados,​ lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.

Es increíble el hecho de predecir con herramientas como machine learning e inteligencia artificial.

Ser Científico de Datos es toda una ciencia. Vamos por mas …

interesante!

Muy buena introducción !

muy interesante espero

¿Python o R?

Mis avanzadas sus mamás sobre la nube, para la mía sigue siendo de donde cae la lluvia.

Me encanta, gracias David!! Tus explicaciones siempre ayudan a orientarnos, resuelves esas dudas que es sumamente complicado por tratarse de clases autodidactas

En mi opinión, los datos siempre han estado presentes a lo largo de la evolución de la humanidad. Lo que actualmente vemos es que con la invención de la computación y el acelerado avance en las TICs se ha venido modelando todo el mundo (los objetos) en computadoras, partiendo de estos datos para hacer predicciones. En la medida que nuestra sociedad se va digitalizando más, uno de los grandes poderes de los países será no solo de disponer de la información sino el saber analizarla y obtener información útil para tomar decisiones. Y es aquí donde el papel de los científicos de datos toma gran relevancia sobre otras áreas del conocimiento.

Buena explicación, definitivamente los datos es el oro que hay en internet y gratis…

Ahora imaginen encontrar la intersección entre el Data Science y el Business Inteligence. Magia.

El conocimiento del dominio, he visto que es clave. Y es un diferencial dentro de los científicos de datos.

Muy buena introducción, seguimos adelante!!

Excelente y motivador

Queda muuucho por aprender



Apuntes

Es una de las disciplinas en el mundo moderno, otorgan una ventaja competitiva a las empresas que cuentan con ella frente a las que no están digitalizadas

Sobre sus pares analógicos

Las empresas los usan porque les ayuda a determinar cómo ajustar sus recursos para llegar a sus objetivos empresariales

Hay demasiadas fuentes de datos, pero casi siempre se encuentran escondidas, ocultas

Solo con voltear a nuestro alrededor, hay datos por todos lados
Una silla tiene patas ( con una media, altura, volumen) la computadora, una capacidad de procesamiento, en mi cuarto, una cantidad de basura, polvo, arañas, telarañas, cucarachas, ratones)
Reloj tiene datos
Objetos tienen datos, colores, fechas de fabricación, marcas, olores, sabores, longitudes, volumen.

Las empresas hoy en día están implementando sistemas para obtener estos datos, analizarlos y actuar acorde a ellos

La ciencia de datos es multidisciplinaria

El compute science sabe de matemáticas, sabe de ingeniería de software y sabe de ingeniería de negocios

Si solo se cuenta con una de estas habilidades, es muy difícil realizar esta actividad de manera efectiva

Se apoya de una computadora, la mejor herramienta para procesar datos, de hecho es su única función

Se apoya de estructuras de datos, de algoritmos, de visualizaciones, de computadoras conectadas en paralelo ( servidores) y de lenguaje

También se apoya de las matemáticas, específicamente de la estadística, mediante inferencias y regresiones, estudiando el comportamiento de las variables y sus relaciones

Se apoya del conocimiento del dominio
Es decir conocer bien el negocio, conocimiento profundo, porque solo así se podrán hacer las preguntas correctas y con esto determinar si el resultado de nuestro análisis es útil o no

Que otros campos nos permiten auxiliarnos
Bases de datos

Debemos aprender BigQuery, spark

Se apoya del analisis de texto y del lenguaje natural
Porque la mayoria de la información ( la web como una mina enorme) viene siempre en lenguaje natural

Analisis numerico

Se inició la grabación de vídeo: 10:44 p. m. sábado, 3 de octubre de 2020

Como la bolsa, patrones del clima

Redes: nodos y sus conexiones como fb, para analizarlo usaríamos teoría de grafos

Visualización de los datos nos permiten ver distribuciones y contar historias alrededor de estos datos y nos permiten analizarlo rápidamente

Es mas facil entender una gráfica y sus tendencias que una tabla de datos

Machine learning, herramienta fundamental cuando hay analisis predictivos y proyectivos

Una vez teniendo datos, saber que viene en el futuro y hasta determinarlo

Predecir si un cliente va a comprar o no
Detonar la compra

Técnicas para procesar los datos en tiempo real,

La nube significa muchas cosas
Para los ingenieros la nube son los data centers

Resumen;
La ciencia de datos es una de las disciplinas más útiles en el mercado, y ofrecen ventajas a quien posee un análisis certero.
Se sirve de otras disciplinas de ciencias computacionales, de ciencias exactas, como las matemáticas o estadística, del conocimiento profundo del negocio para poder sacar buenas conclusiones y análisis, también de bases de datos tanto relacionales como no relacionales

Adjunto este aporte interesante de Oracle:
https://www.oracle.com/co/data-science/what-is-data-science.html

Extraer conocimientos de los datos disponibles.

La ciencia de datos es todo un arte,

Es fascinante que la ciencia de datos es una herramienta que permite potenciar negocios, y al usarse como herramienta se puede ir aprendiendo y convirtiéndose en experto en diferentes habilidades, temas, modelos de negocio que te vuelven una combinación única de conocimientos.

En informática y programación

La arquitectura en pipeline (basada en filtros) consiste en ir transformando un flujo de datos en un proceso comprendido por varias fases secuenciales, siendo la entrada de cada una la salida de la anterior.

Esta arquitectura es muy común en el desarrollo de programas para el intérprete de comandos, ya que se pueden conectar comandos fácilmente con tuberías (pipe).

También es una arquitectura muy natural en el paradigma de programación funcional, ya que equivale a la composición de funciones matemáticas.

Tomado de Wikipedia: https://es.wikipedia.org/wiki/Arquitectura_en_pipeline_(informática)