CursosEmpresasBlogLiveConfPrecios

XPath Axes

Clase 14 de 21 • Curso de Fundamentos de Web Scraping con Python y Xpath

Clase anteriorSiguiente clase

Contenido del curso

Introducción al web scraping
  • 1
    ¿Qué es el web scraping?

    ¿Qué es el web scraping?

    02:06
  • 2
    ¿Por qué aprender web scraping hoy?

    ¿Por qué aprender web scraping hoy?

    03:05
  • 3
    Python: el lenguaje más poderoso para extraer datos

    Python: el lenguaje más poderoso para extraer datos

    03:21
Fundamentos de la web
  • 4
    Entender HTTP

    Entender HTTP

    07:02
  • 5
    ¿Qué es HTML?

    ¿Qué es HTML?

    08:08
  • 6
    Robots.txt: permisos y consideraciones al hacer web scraping

    Robots.txt: permisos y consideraciones al hacer web scraping

    05:41
XML Path Language
  • 7
    XML Path Language

    XML Path Language

    03:35
  • 8
    Tipos de nodos en XPath

    Tipos de nodos en XPath

    05:18
  • 9
    Expresiones en XPath

    Expresiones en XPath

    08:18
  • 10
    Predicados en Xpath

    Predicados en Xpath

    05:34
  • 11
    Operadores en Xpath

    Operadores en Xpath

    05:51
  • 12
    Wildcards en Xpath

    Wildcards en Xpath

    06:11
  • 13
    In-text search en Xpath

    In-text search en Xpath

    08:21
  • 14
    XPath Axes

    XPath Axes

    05:16
  • 15

    Resumen de XPath

    00:01
  • 16
    Aplicando lo aprendido

    Aplicando lo aprendido

    08:52
Proyecto: scraper de noticias
  • 17
    Un proyecto para tu portafolio: scraper de noticias

    Un proyecto para tu portafolio: scraper de noticias

    10:08
  • 18
    Construcción de las expresiones de XPath

    Construcción de las expresiones de XPath

    10:29
  • 19
    Obteniendo los links de los artículos con Python

    Obteniendo los links de los artículos con Python

    10:56
  • 20
    Guardando las noticias en archivos de texto

    Guardando las noticias en archivos de texto

    14:53
Conclusiones
  • 21
    Cómo continuar tu ruta de aprendizaje

    Cómo continuar tu ruta de aprendizaje

    02:13
    Juan David Sánchez

    Juan David Sánchez

    student•
    hace 5 años

    He encontrado este Cheat sheet que espero pueda ser útil: https://devhints.io/xpath

      Camilo Puentes

      Camilo Puentes

      student•
      hace 5 años

      Creo que está mejor organizado que la misma documentacion de la w3school

      Cristian Córdova

      Cristian Córdova

      student•
      hace 5 años

      Gran documentación. Gracias!

    Pablo Perez

    Pablo Perez

    student•
    hace 5 años
    anchestors.png
      Antonio Mesa Casares

      Antonio Mesa Casares

      student•
      hace 5 años

      Gracias por el aporte, muy bien escquematizado

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Buena representación visual.

    Carolina Acosta Muñoz

    Carolina Acosta Muñoz

    student•
    hace 5 años

    Azucar sintáctica: se refiere a los añadidos a la sintaxis de un lenguaje de programación diseñados para hacer algunas construcciones más fáciles de leer o expresar. self::div -> se abrevia con . y se refiere al mismo nodo o div en este caso child::div -> Trae los hijos del div descendant::div -> Trae todos los nodos que están en niveles inferiores descendant-or-self::div -> Trae la unión entre los descendientes y el mismo nodo div

      César Daniel Carrasco Gutiérrez

      César Daniel Carrasco Gutiérrez

      student•
      hace 4 años

      Muchas gracias por la explicación.

    Camilo Quiceno Quintero

    Camilo Quiceno Quintero

    student•
    hace 5 años
      Carlos Andres Ocampo Pabon

      Carlos Andres Ocampo Pabon

      student•
      hace 5 años

      Super la ilustración :)

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Muy didáctico.

    Alejandro Giraldo Londoño

    Alejandro Giraldo Londoño

    student•
    hace 5 años

    RESUMEN: Xpath Axes

    ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

    Un eje representa una relación entre el nodo actual. Es usado para localizar nodos relativos a el nodo en el DOM tree.

    $x('/html/body/div/self::div') $x('/html/body/div/descendant-or-self::div')

    Para ver más: Axes

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Buen resumen.

    Julio César Zaravia Paredes

    Julio César Zaravia Paredes

    student•
    hace 5 años

    Antes de entrar a Platzi vi por mi cuenta el uso de BeautifulSoup para hacer web scrapping, luego de ver estos videos (que están muy buenos) se me vino a la mente cuál sería la ventaja de usar XPath, sobre BS, ya que XPath a mi parecer es un poco más complejo de usar.

    Según pude averiguar en la web, varios programadores se inclinan hacía XPath por el tema de performance, es decir, ante volúmenes elevados de data puede tener un mejor desempeño que BS u otra librería para scrapping. Sin embargo, también indican que toma mucho menos tiempo programar un script en BeautifulSoup que en XPath, para un programador promedio.

    Por lo visto, no hay un consenso general, o una métrica que considere diferentes dimensiones para elegir una u otra opción. Parece que muchas cosas en el mundo de la programación dependen de diferentes variables, y una herramienta puede resultar más útil que otra de acuerdo a casos específicos.

    Si alguien tiene data, o ha podido indagar sobre esto, le agradecería que me deje un comentario ya que estoy por iniciar un proyecto personal referente a esto y quisiera iniciar de manera informada. Gracias y slds!

      alvaro peña

      alvaro peña

      student•
      hace 4 años

      Estimado Julio. Interesante comparacion, gracias. Como te fue con el proyecto?

    Santiago Gomez Florez

    Santiago Gomez Florez

    student•
    hace 5 años

    Les comparto este material para profundizar sobre las Xpath Axes

      Gerardo Alvarado Garcia

      Gerardo Alvarado Garcia

      student•
      hace 5 años

      Buen material. Gracias.

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      https://devhints.io/xpath

    Kevin Naranjo

    Kevin Naranjo

    student•
    hace 5 años

    hay alguna manera de crear graficamente la representacion del DOM??

      Juan Castro

      Juan Castro

      teacher•
      hace 5 años

      Algo así: https://gojs.net/latest/samples/DOMTree.html

      Pablo Perez

      Pablo Perez

      student•
      hace 5 años

      https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

    Jose Reinaldo Roca Cruz

    Jose Reinaldo Roca Cruz

    student•
    hace 5 años

    Excelente curso, muy resumido y bien explicado los Xpath

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Sí, demasiado resumido ya en la práctica se profundiza .

    Carlos Javier Guevara Contreras

    Carlos Javier Guevara Contreras

    student•
    hace 5 años

    XPath Axes

    Un eje representa una relación con el nodo de contexto (actual) y se utiliza para ubicar nodos en relación con ese nodo en el árbol.

    ![](

    axes.jpg

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Thanks

    Christian C RO

    Christian C RO

    student•
    hace 5 años
    • ancestor: Selecciona todos los ancestros, como nodos padres, abuelos, etc.
    • ancestor-or-self: Selecciona todos los ancestros, incluyendo el nodo mismo.
    • attribute: Selecciona todos los atributos del nodo actual.
    • child: Selecciona todos los hijos del nodo actual.
    • descendant: Selecciona todos los descendientes, como hijos, nietos, etc. del nodo actual.
    • descendant-or-self: Selecciona todos los descendientes, incluyendo el nodo mismo.
    • following: Selecciona todo en el documento, que este después de la etiqueta de cierre del nodo.
    • following-sibling: Selecciona todos los hermanos, después del nodo actual.
    • namespace: Selecciona todos los nodos de nombre de espacio del nodo actual.
    • parent: Selecciona todos los padres del nodo actual.
    • preceding: Selecciona todos los nodos que aparecen antes del nodo actual del documento, excepto los ancestros, nodos de atributo y nodos de espacio de nombre.
    • preceding-sibling: Selecciona todos los hermanos, antes del nodo actual.
    • self: Selecciona el nodo actual.
      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Thanks.

    César Ernesto Rivas Martínez

    César Ernesto Rivas Martínez

    student•
    hace 5 años
    $x('/html/body/div/descendant-or-self::div')
      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Para traer los nodos desendientes & el mismo nodo.

    Gonzalo Flores

    Gonzalo Flores

    student•
    hace 5 años

    Vaya, cada vez se complica mas, pero curiosamente se entiende

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      seee & en la práctica estará más confuso pero entendible.

    Pablo Perez

    Pablo Perez

    student•
    hace 5 años

    Extensión de Chrome Para ver el DOM de forma grafica!

    https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

    Dan Isaac Rodríguez Delgado

    Dan Isaac Rodríguez Delgado

    student•
    hace 4 años

    Soy el único al que le va medio lento los videos de este curso?? va como con lag 🤔

      Sonia Mavridis

      Sonia Mavridis

      student•
      hace 4 años

      lo mismo

      Pablo Joaquín Cruz

      Pablo Joaquín Cruz

      student•
      hace 4 años

      Ah! Pensaba que era mi PC. Sí, al parecer tienen algo de lag :c

    Martin DAVILA

    Martin DAVILA

    student•
    hace 5 años
    "Xpath Axes" $x('/html/body/div/self::div') $x('/html/body/div/child::div') $x('/html/body/div/decendant::div') $x('/html/body/div/decendant-or-self::div')```
      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Thanks (:

    Luis Rogelio Reyes Hernandez

    Luis Rogelio Reyes Hernandez

    student•
    hace 5 años

    Cheatsheet

    $x('/html/body/div/self::div') // referiendose al mismo nodo div actual $x('/html/body/div/.') // sugar syntax del ejemplo anterior $x('/html/body/div/child::div') // trae los hijos del nodo div $x('/html/body/div/descendant::div') // trae todos los descendientes de este nodo $x('/html/body/div/descendant-or-self::div') // trae el nodo actual y todos sus descendientes
    Sebastian Calderón Araque

    Sebastian Calderón Araque

    student•
    hace 4 años

    HTML Tree Generator

    Encontré esta extensión de Chrome que sirve para generar un arbol básico con los elementos del HTML

    Fidel Parabacuto

    Fidel Parabacuto

    student•
    hace 3 años

    Un cheatsheet con el contenido de lo visto https://lzone.de/cheat-sheet/XPath

    Joseph Tapia

    Joseph Tapia

    student•
    hace 4 años
    ancestros.png

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads