CursosEmpresasBlogLiveConfPrecios

XPath Axes

Clase 14 de 21 • Curso de Fundamentos de Web Scraping con Python y Xpath

Contenido del curso

Introducción al web scraping

  • 1
    ¿Qué es el web scraping?

    ¿Qué es el web scraping?

    02:06 min
  • 2
    ¿Por qué aprender web scraping hoy?

    ¿Por qué aprender web scraping hoy?

    03:05 min
  • 3
    Python: el lenguaje más poderoso para extraer datos

    Python: el lenguaje más poderoso para extraer datos

    03:21 min

Fundamentos de la web

  • 4
    Entender HTTP

    Entender HTTP

    07:02 min
  • 5
    ¿Qué es HTML?

    ¿Qué es HTML?

    08:08 min
  • 6
    Robots.txt: permisos y consideraciones al hacer web scraping

    Robots.txt: permisos y consideraciones al hacer web scraping

    05:41 min

XML Path Language

  • 7
    XML Path Language

    XML Path Language

    03:35 min
  • 8
    Tipos de nodos en XPath

    Tipos de nodos en XPath

    05:18 min
  • 9
    Expresiones en XPath

    Expresiones en XPath

    08:18 min
  • 10
    Predicados en Xpath

    Predicados en Xpath

    05:34 min
  • 11
    Operadores en Xpath

    Operadores en Xpath

    05:51 min
  • 12
    Wildcards en Xpath

    Wildcards en Xpath

    06:11 min
  • 13
    In-text search en Xpath

    In-text search en Xpath

    08:21 min
  • 14
    XPath Axes

    XPath Axes

    Viendo ahora
  • 15

    Resumen de XPath

    00:01 min
  • 16
    Aplicando lo aprendido

    Aplicando lo aprendido

    08:52 min

Proyecto: scraper de noticias

  • 17
    Un proyecto para tu portafolio: scraper de noticias

    Un proyecto para tu portafolio: scraper de noticias

    10:08 min
  • 18
    Construcción de las expresiones de XPath

    Construcción de las expresiones de XPath

    10:29 min
  • 19
    Obteniendo los links de los artículos con Python

    Obteniendo los links de los artículos con Python

    10:56 min
  • 20
    Guardando las noticias en archivos de texto

    Guardando las noticias en archivos de texto

    14:53 min

Conclusiones

  • 21
    Cómo continuar tu ruta de aprendizaje

    Cómo continuar tu ruta de aprendizaje

    02:13 min
Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads
        Juan David Sánchez

        Juan David Sánchez

        student•
        hace 6 años

        He encontrado este Cheat sheet que espero pueda ser útil: https://devhints.io/xpath

          Camilo Puentes

          Camilo Puentes

          student•
          hace 6 años

          Creo que está mejor organizado que la misma documentacion de la w3school

          Cristian Córdova

          Cristian Córdova

          student•
          hace 6 años

          Gran documentación. Gracias!

        Pablo Perez

        Pablo Perez

        student•
        hace 6 años
        anchestors.png
          Antonio Mesa Casares

          Antonio Mesa Casares

          student•
          hace 5 años

          Gracias por el aporte, muy bien escquematizado

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Buena representación visual.

        Carolina Acosta Muñoz

        Carolina Acosta Muñoz

        student•
        hace 5 años

        Azucar sintáctica: se refiere a los añadidos a la sintaxis de un lenguaje de programación diseñados para hacer algunas construcciones más fáciles de leer o expresar. self::div -> se abrevia con . y se refiere al mismo nodo o div en este caso child::div -> Trae los hijos del div descendant::div -> Trae todos los nodos que están en niveles inferiores descendant-or-self::div -> Trae la unión entre los descendientes y el mismo nodo div

          César Daniel Carrasco Gutiérrez

          César Daniel Carrasco Gutiérrez

          student•
          hace 4 años

          Muchas gracias por la explicación.

        Camilo Quiceno Quintero

        Camilo Quiceno Quintero

        student•
        hace 5 años
          Carlos Andres Ocampo Pabon

          Carlos Andres Ocampo Pabon

          student•
          hace 5 años

          Super la ilustración :)

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Muy didáctico.

        Alejandro Giraldo Londoño

        Alejandro Giraldo Londoño

        student•
        hace 6 años

        RESUMEN: Xpath Axes

        ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

        Un eje representa una relación entre el nodo actual. Es usado para localizar nodos relativos a el nodo en el DOM tree.

        $x('/html/body/div/self::div') $x('/html/body/div/descendant-or-self::div')

        Para ver más: Axes

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Buen resumen.

        Julio César Zaravia Paredes

        Julio César Zaravia Paredes

        student•
        hace 5 años

        Antes de entrar a Platzi vi por mi cuenta el uso de BeautifulSoup para hacer web scrapping, luego de ver estos videos (que están muy buenos) se me vino a la mente cuál sería la ventaja de usar XPath, sobre BS, ya que XPath a mi parecer es un poco más complejo de usar.

        Según pude averiguar en la web, varios programadores se inclinan hacía XPath por el tema de performance, es decir, ante volúmenes elevados de data puede tener un mejor desempeño que BS u otra librería para scrapping. Sin embargo, también indican que toma mucho menos tiempo programar un script en BeautifulSoup que en XPath, para un programador promedio.

        Por lo visto, no hay un consenso general, o una métrica que considere diferentes dimensiones para elegir una u otra opción. Parece que muchas cosas en el mundo de la programación dependen de diferentes variables, y una herramienta puede resultar más útil que otra de acuerdo a casos específicos.

        Si alguien tiene data, o ha podido indagar sobre esto, le agradecería que me deje un comentario ya que estoy por iniciar un proyecto personal referente a esto y quisiera iniciar de manera informada. Gracias y slds!

          alvaro peña

          alvaro peña

          student•
          hace 4 años

          Estimado Julio. Interesante comparacion, gracias. Como te fue con el proyecto?

        Santiago Gomez Florez

        Santiago Gomez Florez

        student•
        hace 6 años

        Les comparto este material para profundizar sobre las Xpath Axes

          Gerardo Alvarado Garcia

          Gerardo Alvarado Garcia

          student•
          hace 6 años

          Buen material. Gracias.

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          https://devhints.io/xpath

        Kevin Naranjo

        Kevin Naranjo

        student•
        hace 6 años

        hay alguna manera de crear graficamente la representacion del DOM??

          Juan Castro

          Juan Castro

          teacher•
          hace 6 años

          Algo así: https://gojs.net/latest/samples/DOMTree.html

          Pablo Perez

          Pablo Perez

          student•
          hace 6 años

          https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

        Jose Reinaldo Roca Cruz

        Jose Reinaldo Roca Cruz

        student•
        hace 6 años

        Excelente curso, muy resumido y bien explicado los Xpath

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Sí, demasiado resumido ya en la práctica se profundiza .

        Carlos Javier Guevara Contreras

        Carlos Javier Guevara Contreras

        student•
        hace 5 años

        XPath Axes

        Un eje representa una relación con el nodo de contexto (actual) y se utiliza para ubicar nodos en relación con ese nodo en el árbol.

        ![](

        axes.jpg

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Thanks

        Christian C RO

        Christian C RO

        student•
        hace 5 años
        • ancestor: Selecciona todos los ancestros, como nodos padres, abuelos, etc.
        • ancestor-or-self: Selecciona todos los ancestros, incluyendo el nodo mismo.
        • attribute: Selecciona todos los atributos del nodo actual.
        • child: Selecciona todos los hijos del nodo actual.
        • descendant: Selecciona todos los descendientes, como hijos, nietos, etc. del nodo actual.
        • descendant-or-self: Selecciona todos los descendientes, incluyendo el nodo mismo.
        • following: Selecciona todo en el documento, que este después de la etiqueta de cierre del nodo.
        • following-sibling: Selecciona todos los hermanos, después del nodo actual.
        • namespace: Selecciona todos los nodos de nombre de espacio del nodo actual.
        • parent: Selecciona todos los padres del nodo actual.
        • preceding: Selecciona todos los nodos que aparecen antes del nodo actual del documento, excepto los ancestros, nodos de atributo y nodos de espacio de nombre.
        • preceding-sibling: Selecciona todos los hermanos, antes del nodo actual.
        • self: Selecciona el nodo actual.
          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Thanks.

        César Ernesto Rivas Martínez

        César Ernesto Rivas Martínez

        student•
        hace 6 años
        $x('/html/body/div/descendant-or-self::div')
          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Para traer los nodos desendientes & el mismo nodo.

        Gonzalo Flores

        Gonzalo Flores

        student•
        hace 6 años

        Vaya, cada vez se complica mas, pero curiosamente se entiende

          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          seee & en la práctica estará más confuso pero entendible.

        Pablo Perez

        Pablo Perez

        student•
        hace 6 años

        Extensión de Chrome Para ver el DOM de forma grafica!

        https://chrome.google.com/webstore/detail/site-dom-tree/heflndjaabdpflafhdboiijhahgmffch?hl=es

        Dan Isaac Rodríguez Delgado

        Dan Isaac Rodríguez Delgado

        student•
        hace 5 años

        Soy el único al que le va medio lento los videos de este curso?? va como con lag 🤔

          Sonia Mavridis

          Sonia Mavridis

          student•
          hace 5 años

          lo mismo

          Pablo Joaquín Cruz

          Pablo Joaquín Cruz

          student•
          hace 4 años

          Ah! Pensaba que era mi PC. Sí, al parecer tienen algo de lag :c

        Martin DAVILA

        Martin DAVILA

        student•
        hace 5 años
        "Xpath Axes" $x('/html/body/div/self::div') $x('/html/body/div/child::div') $x('/html/body/div/decendant::div') $x('/html/body/div/decendant-or-self::div')```
          Moisés Manuel Morín Hevia

          Moisés Manuel Morín Hevia

          student•
          hace 5 años

          Thanks (:

        Luis Rogelio Reyes Hernandez

        Luis Rogelio Reyes Hernandez

        student•
        hace 5 años

        Cheatsheet

        $x('/html/body/div/self::div') // referiendose al mismo nodo div actual $x('/html/body/div/.') // sugar syntax del ejemplo anterior $x('/html/body/div/child::div') // trae los hijos del nodo div $x('/html/body/div/descendant::div') // trae todos los descendientes de este nodo $x('/html/body/div/descendant-or-self::div') // trae el nodo actual y todos sus descendientes
        Sebastian Calderón Araque

        Sebastian Calderón Araque

        student•
        hace 4 años

        HTML Tree Generator

        Encontré esta extensión de Chrome que sirve para generar un arbol básico con los elementos del HTML

        Fidel Parabacuto

        Fidel Parabacuto

        student•
        hace 3 años

        Un cheatsheet con el contenido de lo visto https://lzone.de/cheat-sheet/XPath

        Joseph Tapia

        Joseph Tapia

        student•
        hace 5 años
        ancestros.png