Introducción y definiciones

1/30
Recursos
Transcripción

Aportes 41

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Ese acento Argentina papáa vamo bokita

Les comparto mis notas del curso en formato markdown, espero les sean de ayuda

https://github.com/rb-one/webscraping_by_platzi/blob/master/Notes/notes.md

Este es mi curso preferido por mucho. Espero que puedan continuar agregando mas contenidos similares (Intermedio/Avanzado).

Enhorabuena! @Martin Sokolowicz

Algunos apuntes de la clase.
Web Scraping: Proceso de extracción de datos almacenados en la Web.
Objetivo: Recopilar información almacenada de un servidor web.
Ejm: Podemos scrapear los productos de una Eccomerce y sus reseñas, noticias de un pagina, tweets

Web Crawling: Proceso de mapeo e indexación de páginas web para conocer su contenido.
Objetivo: Conocer la estructura de la Web.


Web Scraping: Proceso de extracción de datos almacenados en la web.

Objetivo: Recopilar información almacenada en un servicio web.

Aplicación: Productos, reseñas, noticias para hacer posteriormente un análisis.


Web Crawling: Proceso de mapeo e indexación de páginas web para conocer su contenido

Objetivo: Conocer la estructura de la web.

Aplicación: Conocer la estructura de la web con el fin de indexar en motores de búsqueda.


Herramientas del curso:

  • Python
  • Jupyter
  • Requests
  • BeautifulSoup
  • Selenium
  • Scrapy

Iniciando 👌🏻

Hola, necesito conocimientos previos antes de iniciar este curso?

Necesitaba este curso desde hace mucho, ojalá sea capaz de implementar un proyecto que tengo en mente en la empresa para la cual trabajo.

Web Scrapping.
Es el proceso de extracción de datos almacenados en la web, el cual, busca recopilar la información almacenada en un servidor web. Se usa para analizar información, como los productos que puedes encontrar en un e-commerce, reseñas, valoraciones, comentarios, así como noticias, tweets y posts.

Web Crawling.
Es el proceso de mapeo e indezación de páginas web para conocer su contenido (usando html, es recomendable que tomes el curso de SEO para complementar en aplicaciones). Con esto, podemos conocer la estructura de las páginas.

Mis tres intereses principales en tres proyectos distintos, noticias, viajes y música. Qué más le puedo pedir a la vida? ❤️

Web Sacraping

Es el proceso de extracción de datos almacenados en la web. Su objetivo es recopilar información alacenada en un servidor web.

Web Crawling

Mapeo de páginas web para conocer su contenido. Su objetivo es conocer la estructura de la web.

Just I neeed it. Esto en el plan de marketing vale oro, en las secciones de marketing, en el estudio de mercado… Thats amazing stuff, guys

Interesante

Muy bueno el curso, siempre lo hacia con PHP usando librerias como SimpleHTMLDom o Hquery, pero habian muchas restricciones, que espero viendo este curso me complementen. Entusiasmado

ya desde hace rato esperaba este curso

webscrapping obtencion de datos de paginas web
web crawling mapeo e indexación de esas paginas

Con las mejores expectativas para este curso.
Sl2

Yo igual estaba esperando este tipo de curso, ojalá parta desde lo básico sin saltarse nada

Tengo tantas ganas de certificarme en web scraping gracias platzi

Tremendo martin!! muy buen curso el que te armaste. Saludos!

Web Scrapping es el proceso de extracción de datos almacenados en la web.

Web Crawling es para mapear e indexar páginas web para conocer su contenido, así como hace Google y varios buscadores.

Vengo de hacer Scrapping con Java, y me había llamado la atención probar con Python y Selenium… Espero poder sacarle provecho…

Empecemos

Me gusta la presentacion, y los proyectos ufff tienes toda mi atencion.

Bastante interesaaanteee!! 😮

**Eliminaron el repositorio del proyecto del GutHub de Platzi,

alguien alcanzo a sacarle una copia?**

No lo hice en el momento de tomar el curso…me arrepiento!

Genial los proyectos!

Este curso tiene muy buena pinta!

El curso promete ¡VAMOS!

Uy, este curso promete mucho con los proyectos 😀 … Desde hace tiempo quiero aprender a hacer scraping a páginas de aerolíneas 🥳🥳🥳

En cuanto a la legalidad, depende del pais para poder determinarlo?

Super Vamos con toda en el curso, y a sacar estos proyectos en modo dios

Web Scraping

Es el proceso de extracción de datos almacenados en la web.

Su objetivo es recopilar información almacenada en un servidor web

Se puede scrapear:

  • Los productos de un e-commerce y sus reseñas.
  • Noticias de una página de un diario.
  • Tweets

Web Crawling

Es el proceso de mapeo e indexación de paginas web para conocer su contenido.

Su objetivo es conocer la estructura de la web

Vine desde el curso de introducción a node. Y justo acabo de utilizar puppeeter para datos de real estate.

Mis notas de la clase

Muy interesante el curso!

Podríamos extraer los enlaces de una pagina web lo que sería Web Crawling, teniendo el objeto resutado de un requests podemos extrar todas las etiquetas de anclaje (a), lo guardamos en una variable la cual va a contener todas las etiquetas que tengan hipervinculos y para cada una de ella imprimimos el contenido del atributo href, que son todos los enlaces que tiene esa URL:

import urllib.requests
from bs4 import BeautifulSoup
data = urllib.requests.urlopen('https://tupaginadestino.com').read().decode()
tree = BeautifulSoup(data)
tags = soup('a')

for tag in tags: print(tag.get('href'))

En un navegador lo que hacemos es escribir una URL esto lo que hace es enviar una petición GET
a través del protocolo HTTP a un servidor y esto nos devuelve el código HTML para ser visualizado
e interpretado por el navegador en un aspecto visual

Web Scrapping.
Es el proceso de extracción de datos almacenados en la web, el cual, busca recopilar la información almacenada en un servidor web.
Web Crawling.
Es el proceso de mapeo e indexación de páginas web para conocer su contenido. Con esto, podemos conocer la estructura de las páginas.

Vamos!!

Es Legal hacer web Scraping en Peru?