No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

XML Path Language

7/21
Recursos

Aportes 39

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

XPath es a HTML, lo que las expresiones regulares son a texto, ambas se utilizan para buscar patrones.

RESUMEN: XPATH

鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲鈻犫枲

XML Xtensible markup lenguage .Sirvio para definir interfaces, es un lenguaje de nodos o etiquetas.
Una t茅cnica para extraer datos de all铆 es Xpath.

Xpath es a HTML lo que las REGEX son a un texto.
Es decir, Xpath es un lenguaje de patrones, expresiones que me permitir谩 extraer datos de un HTML. Puntualmente sirve para apuntar a partes de un documento XML.

Les comparto un recurso.

En http://labs.timtom.ch/library-webscraping/extras/xpath-cheatsheet.md.pdf pueden encontrar m谩s informaci贸n de XPath.

A mi parecer es mejor usar CSS Selectors, tienen una sintaxis mas resumida, mas limpia, entendible y tiene la ventaja de que si sabes frontend o si sabes usar CSS mas especificamente, es exactamente lo mismo ( Yo no se mucho de Frontend )
Estare dejando en los aportes la 鈥榯raducci贸n鈥 usando CSS Selectors, y asi ustedes pueden decidir cual usar e ir viendo las diferencias entre los dos 鈥榣enguajes鈥 c:

Las expresiones regulares tambien son bastante importates en esta area, he tenido casos en que lo que hay para obtener la informacion es texto plano (nada de html) y lo que me ha salvado son las expresiones regulares

a por el curso de expresiones regulares

XPath tester facilita la construcci贸n y el debugger de las expresiones, nos indica en primera medida si es v谩lida.

Expresiones Regulares, tambi茅n conocidas como Patrones.

XPATH es un lenguaje que es utilizado para la extracci贸n de datos por las similitudes que comparte con html. Define la ruta que se debe seguir para llegar al lugar dentro de html de donde queremos extraer la informaci贸n.

XPath: XML Path Lenguage

Lenguaje muy parecido a HTML, sirvi贸 para definir interfaces, formado por etiquetas, es un lenguaje de patrones que permite extraer datos de un HTML.

Xpath cheatsheet

Me fui al curso de expresiones regulares y me envici茅 a eso!!! es una herramienta super importante para todo programador, recomiendo much铆simo el curso!

A dem谩s que complementa super bien con el Scraping

Dejo aqu铆 un enlace con los recursos URL

Que motivacion Facundo !!!

con XML configuraba los scaneres de cedula en mi antiguo empleo, tambien en las impresoras de etiquetas

驴Qu茅 es Xpath? Es un lenguaje con el que podemos crear expresiones parecidas a Regex con una serie de condiciones para recorrer un documento estructurado XML y localizar elementos concretos que est谩n incluidos dentro de ese.

https://www.youtube.com/watch?v=6S0x9MAxBVM&ab_channel=Miguel脕ngelPau

XML Path Language

XML (Xtensible Markup Language) sirvio para definir interfaces, es un lenguaje que esta formado por nodos (etiquetas). Una t茅cnica para extraer informaci贸n de este lenguaje es mediante XPath. Como HTML es similar a XML, podemos usar XPath para extraer informaci贸n de paginas web.

XPath es a HTML lo que son las Expresiones Regulares a un texto

Expresion en XPath

//div/span/h1[@class="title"][1]

Indica que queremos extraer un titulo de un span que esta dentro de un div

datasheet https://devhints.io/xpath

Este te permite probar xpath online y te marca las coincidencias https://xpather.com/

XPath: XML Path Language

XPath es un lenguaje que permite construir expresiones que recorren y procesan un documento XML.

*XPath es para extraer datos pero utiliza como url de referencia las etiquetas de html por as铆 decirlo

Xpath es un lenguaje de patrones, expresiones que me permitir谩 extraer datos de un HTML. Sirve para apuntar a partes de un documento XML.

XPath

//div

selecciona todos los nodos del documento html

Extraer titulo de un SPAN dentro de un DIV //div/span//h1[@class=鈥渢itle鈥漖[1]

XPath (XML Path Language) es un lenguaje que permite construir expresiones que recorren y procesan un documento XML. La idea es parecida a las expresiones regulares para seleccionar partes de un texto sin atributos (plain text). XPath permite buscar y seleccionar teniendo en cuenta la estructura jer谩rquica del XML. https://es.wikipedia.org/wiki/XPath

Me agrada mucho la confianza que transmite Facundo:

鈥ara eso est谩 este curso para que los meses de conviertan en semanas e incluso dias鈥

XPath Path Language

  • 驴Qu茅 es XML?: es un lenguaje parecido a html
  • Lenguaje formado por nodos/etiquetas
  • Una t茅cnica para extraer esta informacion es usar XPath
  • XPath es a html, lo que las expresiones regulares son a un texto
    • Las expresiones regulares son una forma de buscar ciertos patrones en una cadena de texto
  • Asi se ve una expresion XPath:
    • //div/span//h1[@class=鈥渢itle鈥漖[1]

Una consulta XPath (Lenguaje de rutas XML) puede especificarse como parte de una direcci贸n URL o dentro de una plantilla.
XPath es un lenguaje de navegaci贸n de grafos que se usa para seleccionar un conjunto de nodos de un documento XML.

XPath (XML Path Language) es un lenguaje que permite construir expresiones que recorren y procesan un documento XML

Excelente explicaci贸n.

XPath es a HTML, lo que las expresiones regulares (RegEx) son a un texto (strings), ambas se utilizan para buscar patrones.

Algo que me ayud贸 a entender esta clase:

XPath es a HTML, lo que las expresiones regulares son a texto, ambas se utilizan para buscar patrones.

  • XPath
  • CSS Selectors
    Ambos son muy 煤tiles para realizar pruebas automatizadas E2E y para el desarrollo de robots implementando RPA.

XML Path Language
Formado por nodos(etiquetas)
Parecido al HTML
Expresiones regulares: Definir patrones.
Expresi贸n Xpath, es el html que voy a extraer.

Hola a todos, os dejo mis apuntes de esta clase, sin embargo, he creado un respositorio en github donde estan todos los apuntes de este curso: https://github.com/fer2002743/web-scraping

<h1>XML Path Langugage</h1>

Extensible Markup Language es un lenguaje muy parecido a HTML que se utilizo para crear interfaces y que al igual que HTML esta integrado por etiquetas. Una tecnica para extraer datos de este lenguaje es usando XPATH. Entonces, como HTML es un lenguaje tan parecedo a Extensive Markup Language, podemos usar Xpath para extraer datos de HTML sin ningun problema.