Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Fuentes de datos

9/38
Recursos

Web

  • Es una mina enorme con datos financieros, de startups, del clima, precipitación fluvial, astronómicos, de negocios, etc.

APIs

  • Endpoints que viven en la web y nos devuelven JSON. Por ejemplo, la API de twitter, google, facebook.

User Analytics

  • Son el comportamiento del usuario dentro de nuestra aplicaciones, algo similar a los que nos ofrece Google Analytics.

IoT

  • Se ha vuelto una mina espectacular en los últimos años. Como automóviles.

Aportes 78

Preguntas 5

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

De Kaggle me gustaría resaltar los kernels que ofrece. Ahí podemos usar un notebook (identico al de Jupyter) en el cual corremos el código en un ambiente remoto con excelentes especificaciones:

Especificaciones de CPU:

  • 4 CPU cores
  • 17 Gigabytes de RAM
  • 6 horas de tiempo de ejecución
  • 5 Gigabytes de espacio de autoguardado
  • 16 Gigabytes de espacio temporal en el disco de bloc de notas

Especificaciones GPUs:

  • 2 CPU cores
  • 14 Gigabytes de RAM

En Colombia pueden ir a: https://www.datos.gov.co/

Recientemente google centralizo todo en AI HUB

Google AI HUB
Allí podemos encontrar:

  • Datasets
  • pipelines
  • notebooks
    y mucho más!!

Les dejo otra web que es una maravilla
https://ourworldindata.org/
Tienen que ir a Sources y ahí encontraran donde descargar los datos de cada gráfico (:

Google Dataset Search. Datsets públicos. Muy útil.

Yo me vine a enterar 2 años despues de este curso. Que grande el profe Aroesti antes de ser Head of Education en Platzi

Para los que estamos en Colombia estos son los datos abiertos que publican el Gobierno https://www.datos.gov.co/ Más datasets https://wiki.dbpedia.org/ Aqui repositrios interesantes https://github.com/dbpedia

Mucho Oro en un 1 solo video, genial




En Colombia datos.gov.co puede ser muy útil.

Sabía que el Internet era fuente de información, pero ahora se que es en SERIO UNA MINA.

Excelentes páginas para comenzar a obtener datos y generar información útil al probar nuestros conocimientos con Python

Google da un impulso al Open Data al publicar 25 millones de datasets gratuitos.
Al pensar en qué datos están disponibles como Open Data, no solo debemos limitarnos a datos estructurados en un fichero formateado, sino también a documentos, cartografía o imágenes: se cubren casi todas las categorías
https://www.datacentric.es/blog/google-open-data-datasets-gratuitos/
https://datasetsearch.research.google.com/

Datasets en Argentina: https://datos.gob.ar/

nombre es un agasajo de datos, que emocionante la verdad.

Una pequeña confución. En la infografia anterior aparecía HTML como No estricturado, yo tambien pensé que era semiestructurado cuando ví la infografía, ahora el profesor lo confirma. La infografía esta mal en ese aspecto entonces?

Hay muchos lugares de donde obtener datos! Lo importante es que hacer con ellos! 😄 En Chile se puede obtener datos: https://desarrolladores.datos.gob.cl/

excelente clase, buena info en los enlaces que dejaron.

Copio dataframe de casos de covid19 al 29/03/2020
https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_daily_reports/03-29-2020.csv

Feliz con el curso.

Datasearch en tiempos de cuarentena

este data set se ve interesante 😮 😮 European Soccer Database
25k+ matches, players & teams attributes for European Professional Football

Si quieren saber de mayores data sets esta pagina es muy buena
kaggle

Seria interesante indagar y explorar en las API’s de aprendizaje automático en google, en el API library, se ven muy interesantes para estudiar y aprender, más cuando estamos desarrollando la ruta de aprendizaje de inteligencia artificial.

En la actualidad, la data de Covid-19 es fundamental, poder realizar analisis de una problematica global

Jejeje Me agobia la cantidad casi infinita de fuentes de datos, que aunque tengo muchos años trabajando en el área tecnológica, no conocía y la cantidad que todavía me falta por conocer.

Excelente lo de la busqueda de los datasets

Considero que son de mucha utilidad para el análisis de temas relevantes a nivel internacional los datasets del World Bank.

Bastante buena la info, en lo personal estoy interesado en precios de acciones que pertenezcan a los indices SP500 y Nasdaq 100, voy a buscar y les aviso, si alguien sabe seria de gran utilidad que lo mencione

Les comparto dos bases de datos de datos astronómicos, pueden ser facilmente usadas por no profesionales en el área.
si alguien quiere algún tutorial de cómo usarlas, me puede dejar un mensaje!!

http://simbad.u-strasbg.fr/simbad/
https://ned.ipac.caltech.edu/

kaggle no la conocía, excelente.

les comparto una que dentro de mi sector creo que es importante:
https://www.enerdata.net/

Me pareció muy interesante que a pesar del poco desarrollo de las páginas del gobierno, se encuentren una página con datasets. Lo que me preocupa es saber si la información se encuentra actualizada.

disculpe estimado profesor ese servicio de los apis que ofrece google cloud plataform son gratis ???

Kaggle se ve completamente diferente ahora. Muestra un poco su edad el video jeje

Platzeritos les recomiendo google colab https://colab.research.google.com/ aquí pueden correr jupyter notebooks en la nube de google con buenas maquinas y mucho mas! 😃

Por experiencia recomiendo las siguientes páginas de donde normalmente suelo extraer datasets en diferentes formatos:
KAGEL – https://www.kaggle.com/
World Bank Open Data – https://data.worldbank.org/

Fuentes:

La web via Html
apis como seria la de google

Web de datasets como :
google dataset search
dataword
kaggle
apis de datos de los estados

Encontre un dataset en kaggle que me impresiono, se trata de todos los artículos publicados por el periódico New York Times desde hace 100 AÑOS (1920-2020 ).
Su peso: 7gb, 4gb(zip).
Los artículos están en carpetas organizadas por año.

LINK:
https://www.kaggle.com/tumanovalexander/nyt-articles-data
Aún no dejo de imaginar todo el potencial de este dataset, por lo que quiero compartirlo.
¿Igual tienes ideas de como aprovecharlo?

Muy buenos los aportes que comparte el profesor, en cuanto a los recursos en internet.

Datos de muchas fuentes podemos obtener, en los aportes de los compañeros hay muchisimos, ahora a aprender que podemos hacer con ellos y como usarlos.

En Google Dataset Search encontré datos de Statista sobre el estado de Startups en Latam. Esto puede ser muy útil para inversionistas, aceleradoras y comunidades de startups: https://datasetsearch.research.google.com/search?query=startups in latam&docid=lXNmP%2FGA8g%2FcaS9jAAAAAA%3D%3D

Datos de Chile https://datos.gob.cl/

excelente video, la web es una gran fuente de datos

El mas conocido sitio para buscar datasets es kaggle, todo mundo lo recomienda, pero tambien hay que echarle un ojito a las recomendaciones de este curso

Esto es simplemente increible! Data is everywhere.
Si logras modelar datos de una manera beneficiosa puedes crear negocios millonarios!

Esto es fascinante!!

En este link tiene datos del salario por ocupación y genero en USA.

html = datos semi estructurados

Me parece muy interesante el Data Set del gobierno , si bien no tenemos mucho acceso , un dataset que actualice las cifras , por ejemplo , de empleabilidad , permitiria conocer como reacciona tan importante medida a los sucesos del diario. O por ejemplo lo del coronavirus .

www.kaggle.com es un gran sitio para encontrar datos estructurados.

Solo con esta información se abre un mundo de posibilidades.

Clase muy chevere

Con toda esa cantidad de información se abre un mundo infinito de posibilidades!!

Muy interesante la clase. Dejo pagina de datos abiertos de Argentina
https://datos.gob.ar/

Muy Claro

Interesante todo lo que se puede minar. Pero ¿Cómo se puede monetizar esa info? Es entretenido el web scrapping, me encanta. Pero no se si es rentable seguir haciendolo. Hasta ahora lo he hecho por hobby.

Les paso unos enlaces con datasets

https://archive.ics.uci.edu/ml/index.php
https://www.kaggle.com/

Este último tiene unos tutoriales (gratuitos) de machine learning

Excelente para investigar datos en esta cuarentena.

interesante!

Donde puedo encontrar datos referente al clima de mi ciudad?

Excelente información y clase.

Excelentes aportes para busqueda de datos…gracias

Que buen dato, 😃

Me gusta mucho la data que nos ofrece google con las APIs. Es bastante diversa y muy útil en todo sentido.