Esta buenisimo el curso, siempre un grande david
Introducción
Qué aprenderás sobre la ingeniería de datos
Archivos del curso y Slides
¿Qué es la Ciencia e Ingeniería de Datos?
Roles
Configuración del ambiente
Jupyter Notebooks
Profundizando en tipos de datos
Tipos de datos
Fuentes de datos
ETL
Web scraping
Introducción a las tecnologías web
Realizar solicitudes HTTP con Python
¿Cómo trabajar con un documento HTML?
Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping
Solicitudes a la web: Requests
Implementando nuestro web scrapper: Configuración
Implementando nuestro web scrapper: Obteniendo enlaces del front page
Implementando nuestro web scrapper: Obteniendo artículos
Obtención de datos del Artículo
Persistiendo la información "scrapeada"
Pandas
Introducción a Pandas
Estructura de datos: Series
Estructura de datos: DataFrames
Índices y selección
Data wrangling con Pandas
Creación de la receta: preparando la automatización
¿Cómo trabajar con datos faltantes?
Operaciones con Series y DataFrames
Limpiando detalles adicionales
Limpiando detalles en nuestro proyecto
Enriquecimiento de los datos
Valores duplicados en Jupyter
Valores duplicados en Python
Visualización de datos
Intro a Sistemas de Datos
Introducción a los sistemas de datos
Automatización del Pipeline
Cargando datos a SQLite
Contenido Bonus
¿Por qué usar la nube?
Aún no tienes acceso a esta clase
Crea una cuenta y continúa viendo este curso
Las tecnologías web en principio podemos pensarlas como el internet, pero el internet es mucho más grande, es la red de redes, la forma en la que millones de computadores se conectan entre ellas para transferirse información.
El internet también se compone de otros pedazos como telefonía(voip), mail(pop3, imap), compartir archivos(ftp). El internet es una red que une varias redes públicas, privadas, académicas, de negocios, de gobiernos, etc.
La web específicamente es un espacio de información en el cual varios documentos(y otros recursos web) se pueden acceder a través de URLs y vínculos(links). La comunicación se da a través del protocolo HTTP.
Elementos básicos de la web:
Aportes 55
Preguntas 9
Esta buenisimo el curso, siempre un grande david
Notas de la clase
<h1>Tecnologias web</h1>Un problema muy comun es no encontrar el data set correcto, y no poder encontrar los datos que te permitiran responder la pregunta que te has planteado
por eso debes ser capaz de construir tus propios datasets
Las teconologias web, se suele pensar que es el internet pero esto es erroneo ya que el internet es millones de veces mas grande y representa solamente el canal en el que existe la web.
el internet esta conformado tambien por APIs, email, http, protocolos de transferencia entre otras
esto es importante de conocer a la hora de buscar de donde es posible extraer datos
La web es una parte del internet donde se puede acceder a diversos documentos a traves de vinculos en forma de URL accediendo a archivos HTML que interactuan o no con un backend.
la web posee varios elementos basicos:
HTML Estructura (importante)
CSS. Presentacion
Javascript, interactividad y computo.
Es importante de considerar, ya que al accederse de forma programatica a una pagina web si no se ejecuta el javascript es posible que no hay informacion visible, ya que esta carga por medio de la ejecucion del javascript
Json transferencia de datos por API (importante)
Hola, vengo del futuro, para poder entender este modulo para mi fue necesario hacer los cursos de:
Web Scraping: ¿legal o ilegal?
uno de los mejores profesores de Platzi
No sabía que la web era solo una parte del enorme Internet
Es de los pocos instructores o docentes (no sé que nombre es el correcto) que realmente me han atrapado con su forma de expresar, bastane claro.
Me gusta su enfoque.
Tecnologias web: Html, css, js, json.
Protocolos web: voip, pop3, imap, ftp, http
Me gusta como explica el profesor, es bastante claro en los conceptos.-
Para los que les interese, hay un curso en Platzi que enseña a usar selenium para poder manejar el javascript con Python.
La web es el espacio de información en el cual de documentos se pueden accesar a través de URLs y vinculos. La comunicación se da a através del protocolo HTTP.
<h3>Elementos básicos de la web</h3>HTML: da la estructura.
CSS: presentación.
JavaScript: interactividad y cómputo
Json: transferencia de datos.
interesante!
Excelente clase, buena explicación sobre las tecnologías que debemos manejar.
Excelente clase e introduccion a la tecnologia web
excelente introducción.
CSS es un lenguaje de hojas de estilos creado para controlar el aspecto o presentación de los documentos electrónicos definidos con HTML y XHTML. CSS es la mejor forma de separar los contenidos y su presentación y es imprescindible para crear páginas web complejas
En la vida real, qué aplicación tiene hacer Web Scraping ??
que temas tan interesantes, muchas gracias.
Yo estoy usando Scrapy para web scraping y me gusta porque es muy fácil de aprener.
una pregunta: Cómo puedo simular js usando scrapy?
muy buena la explicación
bastante clara la clase, gracias
XML, RSS y Atom son tecnologías que se usan mucho en la web
Se ve super interesante, vamos con todas las herramientas a scrapear la web.
El Web Scraping lo haremos sobre archivos HTML
muy buena explicacion… gran tema
Aquí pueden ver una página web muy básica, pero muy cool que ha permanecido allí desde que se creó: https://spacejam.com/ ⛹️♂️🏀🪐
Elementos basicos de la web
Las tecnologías web en principio podemos pensarlas como el internet, pero el internet es mucho más grande, es la red de redes, la forma en la que millones de computadores se conectan entre ellas para transferirse información.
El internet también se compone de otros pedazos como telefonía(voip), mail(pop3, imap), compartir archivos(ftp). El internet es una red que une varias redes públicas, privadas, académicas, de negocios, de gobiernos, etc.
La web específicamente es un espacio de información en el cual varios documentos(y otros recursos web) se pueden acceder a través de URLs y vínculos(links). La comunicación se da a través del protocolo HTTP.
Elementos básicos de la web:
Lord Aroesti
A tool that will help us to extract web data for our later use
Is the webs web. It connect all computers connecteds to internet and can communicate them.
Are the languages that let’s the web works
Structure
Style
Interactivity
Data transfer
Buenas noches, podrian ayudarme dandome una definicion de automatizacion de un pipeline y web scrapping? Muchas gracias de antemano. saludos
Hola Justo ahora tengo batsantes lagunas respecto a Data Extraction y creacion de Data Pipelines,
pense que spark servia para hacer Data Extraction (y creo que si, con Spark Streaming), tambien lei que apache flik y Kafka
pero todo se torna confuso, aqui se explica como hacer web scrapping con python, pero y donde puedo ver como extraer datos de una API?
Siempre me a costado un poquito estos temas, pero me ha permitido entender como funciona lo que uno consume a diario, muy interesante, la verdad es increíble todo loque e puede llegar a lograr para que las industrias logren ser competitivas.
Diferencia entre Internet y Web, el Internet es una red de ordenadores conectados al rededor del mundo, mientras que la Web es una colección de paginas.
Este curso parece una gran pelicula. Me prometí iniciarlo y trabajar 5 videos y mañana continuar, pero ya voy 11 videos y no lo he podido dejar.
También existe una muy buena alternativa llamada Pattern. Es una biblioteca para hacer scraping y tiene también módulos para scraping en redes sociales y Web Graph.
También viene con Librerias para Procesar Lenguaje Natural entre otras
Bien explicado
me gusta mucho su forma de dar clases, se entiende muy bien el tema y conoce mucho del tema
Aunque creo es más lento me gusta usar selenium para hacer scrapping. Lo sé es para pruebas automatizadas pero pues me gusta.
No entiendo muy bien el tema de los protocolos, http, pop3, imap. Alguna guía?
Estoy bajando post de comentarios, pero la página HTML solo muestra una parte del comentario y tiene un botón de Javascript para abrirlo completamente ¿Cómo o con qué puedo hacer que los comentarios se abran completos antes de bajar la información a python?
Cuando dice renderizar, exactamente a que se refiere? es un término que aun no lo comprendo bien
Buenas tardes creo que si hay tecnologías usadas en la web no mencionadas como es el caso de xml. para servicios web soap, rest que es casi todo json no todos la usan. un abrazo!!
David es un gran profesor 😃
Super bueno la introduccion al curso
He entendido mucho! Gracias David
Excelente curso!
Un excelente curso con un excelente profesor
Para Google Chrome hay una extensión útil para inspeccionar una página: SelectorGadget
conocen algun curso que utilice pupeteer? hay alguno en platzi?
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.