CursosEmpresasBlogLiveConfPrecios

XPath Axes

Clase 14 de 21 • Curso de Fundamentos de Web Scraping con Python y Xpath

Clase anteriorSiguiente clase

Contenido del curso

Introducción al web scraping

  • 1
    ¿Qué es el web scraping?

    ¿Qué es el web scraping?

    02:06 min
  • 2
    ¿Por qué aprender web scraping hoy?

    ¿Por qué aprender web scraping hoy?

    03:05 min
  • 3
    Python: el lenguaje más poderoso para extraer datos

    Python: el lenguaje más poderoso para extraer datos

    03:21 min

Fundamentos de la web

  • 4
    Entender HTTP

    Entender HTTP

    07:02 min
  • 5
    ¿Qué es HTML?

    ¿Qué es HTML?

    08:08 min
  • 6
    Robots.txt: permisos y consideraciones al hacer web scraping

    Robots.txt: permisos y consideraciones al hacer web scraping

    05:41 min

XML Path Language

  • 7
    XML Path Language

    XML Path Language

    03:35 min
  • 8
    Tipos de nodos en XPath

    Tipos de nodos en XPath

    05:18 min
  • 9
    Expresiones en XPath

    Expresiones en XPath

    08:18 min
  • 10
    Predicados en Xpath

    Predicados en Xpath

    05:34 min
  • 11
    Operadores en Xpath

    Operadores en Xpath

    05:51 min
  • 12
    Wildcards en Xpath

    Wildcards en Xpath

    06:11 min
  • 13
    In-text search en Xpath

    In-text search en Xpath

    08:21 min
  • 14
    XPath Axes

    XPath Axes

    Viendo ahora
  • 15

    Resumen de XPath

    00:01 min
  • 16
    Aplicando lo aprendido

    Aplicando lo aprendido

    08:52 min

Proyecto: scraper de noticias

  • 17
    Un proyecto para tu portafolio: scraper de noticias

    Un proyecto para tu portafolio: scraper de noticias

    10:08 min
  • 18
    Construcción de las expresiones de XPath

    Construcción de las expresiones de XPath

    10:29 min
  • 19
    Obteniendo los links de los artículos con Python

    Obteniendo los links de los artículos con Python

    10:56 min
  • 20
    Guardando las noticias en archivos de texto

    Guardando las noticias en archivos de texto

    14:53 min

Conclusiones

  • 21
    Cómo continuar tu ruta de aprendizaje

    Cómo continuar tu ruta de aprendizaje

    02:13 min
  • Tomar el examen del curso
    • Juan David Sánchez

      Juan David Sánchez

      student•
      hace 5 años

      He encontrado este Cheat sheet que espero pueda ser útil: https://devhints.io/xpath

        Camilo Puentes

        Camilo Puentes

        student•
        hace 5 años

        Creo que está mejor organizado que la misma documentacion de la w3school

        Cristian Córdova

        Cristian Córdova

        student•
        hace 5 años

        Gran documentación. Gracias!

      Pablo Perez

      Pablo Perez

      student•
      hace 5 años
      anchestors.png
        Antonio Mesa Casares

        Antonio Mesa Casares

        student•
        hace 5 años

        Gracias por el aporte, muy bien escquematizado

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Buena representación visual.

      Carolina Acosta Muñoz

      Carolina Acosta Muñoz

      student•
      hace 5 años

      Azucar sintáctica: se refiere a los añadidos a la sintaxis de un lenguaje de programación diseñados para hacer algunas construcciones más fáciles de leer o expresar. self::div -> se abrevia con . y se refiere al mismo nodo o div en este caso child::div -> Trae los hijos del div descendant::div -> Trae todos los nodos que están en niveles inferiores descendant-or-self::div -> Trae la unión entre los descendientes y el mismo nodo div

        César Daniel Carrasco Gutiérrez

        César Daniel Carrasco Gutiérrez

        student•
        hace 4 años

        Muchas gracias por la explicación.

      Camilo Quiceno Quintero

      Camilo Quiceno Quintero

      student•
      hace 5 años
        Carlos Andres Ocampo Pabon

        Carlos Andres Ocampo Pabon

        student•
        hace 5 años

        Super la ilustración :)

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Muy didáctico.

      Alejandro Giraldo Londoño

      Alejandro Giraldo Londoño

      student•
      hace 5 años

      RESUMEN: Xpath Axes

      ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

      Un eje representa una relación entre el nodo actual. Es usado para localizar nodos relativos a el nodo en el DOM tree.

      $x('/html/body/div/self::div') $x('/html/body/div/descendant-or-self::div')

      Para ver más: Axes

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Buen resumen.

      Julio César Zaravia Paredes

      Julio César Zaravia Paredes

      student•
      hace 5 años

      Antes de entrar a Platzi vi por mi cuenta el uso de BeautifulSoup para hacer web scrapping, luego de ver estos videos (que están muy buenos) se me vino a la mente cuál sería la ventaja de usar XPath, sobre BS, ya que XPath a mi parecer es un poco más complejo de usar.

      Según pude averiguar en la web, varios programadores se inclinan hacía XPath por el tema de performance, es decir, ante volúmenes elevados de data puede tener un mejor desempeño que BS u otra librería para scrapping. Sin embargo, también indican que toma mucho menos tiempo programar un script en BeautifulSoup que en XPath, para un programador promedio.

      Por lo visto, no hay un consenso general, o una métrica que considere diferentes dimensiones para elegir una u otra opción. Parece que muchas cosas en el mundo de la programación dependen de diferentes variables, y una herramienta puede resultar más útil que otra de acuerdo a casos específicos.

      Si alguien tiene data, o ha podido indagar sobre esto, le agradecería que me deje un comentario ya que estoy por iniciar un proyecto personal referente a esto y quisiera iniciar de manera informada. Gracias y slds!

        alvaro peña

        alvaro peña

        student•
        hace 4 años

        Estimado Julio. Interesante comparacion, gracias. Como te fue con el proyecto?

      Santiago Gomez Florez

      Santiago Gomez Florez

      student•
      hace 6 años

      Les comparto este material para profundizar sobre las Xpath Axes

        Gerardo Alvarado Garcia

        Gerardo Alvarado Garcia

        student•
        hace 5 años

        Buen material. Gracias.

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        https://devhints.io/xpath

      Kevin Naranjo

      Kevin Naranjo

      student•
      hace 5 años

      hay alguna manera de crear graficamente la representacion del DOM??

        Juan Castro

        Juan Castro

        teacher•
        hace 5 años

        Algo así: https://gojs.net/latest/samples/DOMTree.html

        Pablo Perez

        Pablo Perez

        student•
        hace 5 años

        https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

      Jose Reinaldo Roca Cruz

      Jose Reinaldo Roca Cruz

      student•
      hace 6 años

      Excelente curso, muy resumido y bien explicado los Xpath

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Sí, demasiado resumido ya en la práctica se profundiza .

      Carlos Javier Guevara Contreras

      Carlos Javier Guevara Contreras

      student•
      hace 5 años

      XPath Axes

      Un eje representa una relación con el nodo de contexto (actual) y se utiliza para ubicar nodos en relación con ese nodo en el árbol.

      ![](

      axes.jpg

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Thanks

      Christian C RO

      Christian C RO

      student•
      hace 5 años
      • ancestor: Selecciona todos los ancestros, como nodos padres, abuelos, etc.
      • ancestor-or-self: Selecciona todos los ancestros, incluyendo el nodo mismo.
      • attribute: Selecciona todos los atributos del nodo actual.
      • child: Selecciona todos los hijos del nodo actual.
      • descendant: Selecciona todos los descendientes, como hijos, nietos, etc. del nodo actual.
      • descendant-or-self: Selecciona todos los descendientes, incluyendo el nodo mismo.
      • following: Selecciona todo en el documento, que este después de la etiqueta de cierre del nodo.
      • following-sibling: Selecciona todos los hermanos, después del nodo actual.
      • namespace: Selecciona todos los nodos de nombre de espacio del nodo actual.
      • parent: Selecciona todos los padres del nodo actual.
      • preceding: Selecciona todos los nodos que aparecen antes del nodo actual del documento, excepto los ancestros, nodos de atributo y nodos de espacio de nombre.
      • preceding-sibling: Selecciona todos los hermanos, antes del nodo actual.
      • self: Selecciona el nodo actual.
        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Thanks.

      César Ernesto Rivas Martínez

      César Ernesto Rivas Martínez

      student•
      hace 6 años
      $x('/html/body/div/descendant-or-self::div')
        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Para traer los nodos desendientes & el mismo nodo.

      Gonzalo Flores

      Gonzalo Flores

      student•
      hace 5 años

      Vaya, cada vez se complica mas, pero curiosamente se entiende

        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        seee & en la práctica estará más confuso pero entendible.

      Pablo Perez

      Pablo Perez

      student•
      hace 5 años

      Extensión de Chrome Para ver el DOM de forma grafica!

      https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

      Dan Isaac Rodríguez Delgado

      Dan Isaac Rodríguez Delgado

      student•
      hace 5 años

      Soy el único al que le va medio lento los videos de este curso?? va como con lag 🤔

        Sonia Mavridis

        Sonia Mavridis

        student•
        hace 4 años

        lo mismo

        Pablo Joaquín Cruz

        Pablo Joaquín Cruz

        student•
        hace 4 años

        Ah! Pensaba que era mi PC. Sí, al parecer tienen algo de lag :c

      Martin DAVILA

      Martin DAVILA

      student•
      hace 5 años
      "Xpath Axes" $x('/html/body/div/self::div') $x('/html/body/div/child::div') $x('/html/body/div/decendant::div') $x('/html/body/div/decendant-or-self::div')```
        Moisés Manuel Morín Hevia

        Moisés Manuel Morín Hevia

        student•
        hace 5 años

        Thanks (:

      Luis Rogelio Reyes Hernandez

      Luis Rogelio Reyes Hernandez

      student•
      hace 5 años

      Cheatsheet

      $x('/html/body/div/self::div') // referiendose al mismo nodo div actual $x('/html/body/div/.') // sugar syntax del ejemplo anterior $x('/html/body/div/child::div') // trae los hijos del nodo div $x('/html/body/div/descendant::div') // trae todos los descendientes de este nodo $x('/html/body/div/descendant-or-self::div') // trae el nodo actual y todos sus descendientes
      Sebastian Calderón Araque

      Sebastian Calderón Araque

      student•
      hace 4 años

      HTML Tree Generator

      Encontré esta extensión de Chrome que sirve para generar un arbol básico con los elementos del HTML

      Fidel Parabacuto

      Fidel Parabacuto

      student•
      hace 3 años

      Un cheatsheet con el contenido de lo visto https://lzone.de/cheat-sheet/XPath

      Joseph Tapia

      Joseph Tapia

      student•
      hace 4 años
      ancestros.png

    Escuelas

    • Desarrollo Web
      • Fundamentos del Desarrollo Web Profesional
      • Diseño y Desarrollo Frontend
      • Desarrollo Frontend con JavaScript
      • Desarrollo Frontend con Vue.js
      • Desarrollo Frontend con Angular
      • Desarrollo Frontend con React.js
      • Desarrollo Backend con Node.js
      • Desarrollo Backend con Python
      • Desarrollo Backend con Java
      • Desarrollo Backend con PHP
      • Desarrollo Backend con Ruby
      • Bases de Datos para Web
      • Seguridad Web & API
      • Testing Automatizado y QA para Web
      • Arquitecturas Web Modernas y Escalabilidad
      • DevOps y Cloud para Desarrolladores Web
    • English Academy
      • Inglés Básico A1
      • Inglés Básico A2
      • Inglés Intermedio B1
      • Inglés Intermedio Alto B2
      • Inglés Avanzado C1
      • Inglés para Propósitos Específicos
      • Inglés de Negocios
    • Marketing Digital
      • Fundamentos de Marketing Digital
      • Marketing de Contenidos y Redacción Persuasiva
      • SEO y Posicionamiento Web
      • Social Media Marketing y Community Management
      • Publicidad Digital y Paid Media
      • Analítica Digital y Optimización (CRO)
      • Estrategia de Marketing y Growth
      • Marketing de Marca y Comunicación Estratégica
      • Marketing para E-commerce
      • Marketing B2B
      • Inteligencia Artificial Aplicada al Marketing
      • Automatización del Marketing
      • Marca Personal y Marketing Freelance
      • Ventas y Experiencia del Cliente
      • Creación de Contenido para Redes Sociales
    • Inteligencia Artificial y Data Science
      • Fundamentos de Data Science y AI
      • Análisis y Visualización de Datos
      • Machine Learning y Deep Learning
      • Data Engineer
      • Inteligencia Artificial para la Productividad
      • Desarrollo de Aplicaciones con IA
      • AI Software Engineer
    • Ciberseguridad
      • Fundamentos de Ciberseguridad
      • Hacking Ético y Pentesting (Red Team)
      • Análisis de Malware e Ingeniería Forense
      • Seguridad Defensiva y Cumplimiento (Blue Team)
      • Ciberseguridad Estratégica
    • Liderazgo y Habilidades Blandas
      • Fundamentos de Habilidades Profesionales
      • Liderazgo y Gestión de Equipos
      • Comunicación Avanzada y Oratoria
      • Negociación y Resolución de Conflictos
      • Inteligencia Emocional y Autogestión
      • Productividad y Herramientas Digitales
      • Gestión de Proyectos y Metodologías Ágiles
      • Desarrollo de Carrera y Marca Personal
      • Diversidad, Inclusión y Entorno Laboral Saludable
      • Filosofía y Estrategia para Líderes
    • Diseño de Producto y UX
      • Fundamentos de Diseño UX/UI
      • Investigación de Usuarios (UX Research)
      • Arquitectura de Información y Usabilidad
      • Diseño de Interfaces y Prototipado (UI Design)
      • Sistemas de Diseño y DesignOps
      • Redacción UX (UX Writing)
      • Creatividad e Innovación en Diseño
      • Diseño Accesible e Inclusivo
      • Diseño Asistido por Inteligencia Artificial
      • Gestión de Producto y Liderazgo en Diseño
      • Diseño de Interacciones Emergentes (VUI/VR)
      • Desarrollo Web para Diseñadores
      • Diseño y Prototipado No-Code
    • Contenido Audiovisual
      • Fundamentos de Producción Audiovisual
      • Producción de Video para Plataformas Digitales
      • Producción de Audio y Podcast
      • Fotografía y Diseño Gráfico para Contenido Digital
      • Motion Graphics y Animación
      • Contenido Interactivo y Realidad Aumentada
      • Estrategia, Marketing y Monetización de Contenidos
    • Desarrollo Móvil
      • Fundamentos de Desarrollo Móvil
      • Desarrollo Nativo Android con Kotlin
      • Desarrollo Nativo iOS con Swift
      • Desarrollo Multiplataforma con React Native
      • Desarrollo Multiplataforma con Flutter
      • Arquitectura y Patrones de Diseño Móvil
      • Integración de APIs y Persistencia Móvil
      • Testing y Despliegue en Móvil
      • Diseño UX/UI para Móviles
    • Diseño Gráfico y Arte Digital
      • Fundamentos del Diseño Gráfico y Digital
      • Diseño de Identidad Visual y Branding
      • Ilustración Digital y Arte Conceptual
      • Diseño Editorial y de Empaques
      • Motion Graphics y Animación 3D
      • Diseño Gráfico Asistido por Inteligencia Artificial
      • Creatividad e Innovación en Diseño
    • Programación
      • Fundamentos de Programación e Ingeniería de Software
      • Herramientas de IA para el trabajo
      • Matemáticas para Programación
      • Programación con Python
      • Programación con JavaScript
      • Programación con TypeScript
      • Programación Orientada a Objetos con Java
      • Desarrollo con C# y .NET
      • Programación con PHP
      • Programación con Go y Rust
      • Programación Móvil con Swift y Kotlin
      • Programación con C y C++
      • Administración Básica de Servidores Linux
    • Negocios
      • Fundamentos de Negocios y Emprendimiento
      • Estrategia y Crecimiento Empresarial
      • Finanzas Personales y Corporativas
      • Inversión en Mercados Financieros
      • Ventas, CRM y Experiencia del Cliente
      • Operaciones, Logística y E-commerce
      • Gestión de Proyectos y Metodologías Ágiles
      • Aspectos Legales y Cumplimiento
      • Habilidades Directivas y Crecimiento Profesional
      • Diversidad e Inclusión en el Entorno Laboral
      • Herramientas Digitales y Automatización para Negocios
    • Blockchain y Web3
      • Fundamentos de Blockchain y Web3
      • Desarrollo de Smart Contracts y dApps
      • Finanzas Descentralizadas (DeFi)
      • NFTs y Economía de Creadores
      • Seguridad Blockchain
      • Ecosistemas Blockchain Alternativos (No-EVM)
      • Producto, Marketing y Legal en Web3
    • Recursos Humanos
      • Fundamentos y Cultura Organizacional en RRHH
      • Atracción y Selección de Talento
      • Cultura y Employee Experience
      • Gestión y Desarrollo de Talento
      • Desarrollo y Evaluación de Liderazgo
      • Diversidad, Equidad e Inclusión
      • AI y Automatización en Recursos Humanos
      • Tecnología y Automatización en RRHH
    • Finanzas e Inversiones
      • Fundamentos de Finanzas Personales y Corporativas
      • Análisis y Valoración Financiera
      • Inversión y Mercados de Capitales
      • Finanzas Descentralizadas (DeFi) y Criptoactivos
      • Finanzas y Estrategia para Startups
      • Inteligencia Artificial Aplicada a Finanzas
      • Domina Excel
      • Financial Analyst
      • Conseguir trabajo en Finanzas e Inversiones
    • Startups
      • Fundamentos y Validación de Ideas
      • Estrategia de Negocio y Product-Market Fit
      • Desarrollo de Producto y Operaciones Lean
      • Finanzas, Legal y Fundraising
      • Marketing, Ventas y Growth para Startups
      • Cultura, Talento y Liderazgo
      • Finanzas y Operaciones en Ecommerce
      • Startups Web3 y Blockchain
      • Startups con Impacto Social
      • Expansión y Ecosistema Startup
    • Cloud Computing y DevOps
      • Fundamentos de Cloud y DevOps
      • Administración de Servidores Linux
      • Contenerización y Orquestación
      • Infraestructura como Código (IaC) y CI/CD
      • Amazon Web Services
      • Microsoft Azure
      • Serverless y Observabilidad
      • Certificaciones Cloud (Preparación)
      • Plataforma Cloud GCP

    Platzi y comunidad

    • Platzi Business
    • Live Classes
    • Lanzamientos
    • Executive Program
    • Trabaja con nosotros
    • Podcast

    Recursos

    • Manual de Marca

    Soporte

    • Preguntas Frecuentes
    • Contáctanos

    Legal

    • Términos y Condiciones
    • Privacidad
    • Tyc promociones
    Reconocimientos
    Reconocimientos
    Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
    Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
    Logo reconocimientoPrimera Startup EdTech · 2018
    Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
    Logo reconocimientoCEO Mejor Emprendedor del año · 2024
    De LATAM conpara el mundo
    YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads