CursosEmpresasBlogLiveConfPrecios

¿Qué es HTML?

Clase 5 de 21 • Curso de Fundamentos de Web Scraping con Python y Xpath

Clase anteriorSiguiente clase

Contenido del curso

Introducción al web scraping
  • 1
    ¿Qué es el web scraping?

    ¿Qué es el web scraping?

    02:06
  • 2
    ¿Por qué aprender web scraping hoy?

    ¿Por qué aprender web scraping hoy?

    03:05
  • 3
    Python: el lenguaje más poderoso para extraer datos

    Python: el lenguaje más poderoso para extraer datos

    03:21
Fundamentos de la web
  • 4
    Entender HTTP

    Entender HTTP

    07:02
  • 5
    ¿Qué es HTML?

    ¿Qué es HTML?

    08:08
  • 6
    Robots.txt: permisos y consideraciones al hacer web scraping

    Robots.txt: permisos y consideraciones al hacer web scraping

    05:41
XML Path Language
  • 7
    XML Path Language

    XML Path Language

    03:35
  • 8
    Tipos de nodos en XPath

    Tipos de nodos en XPath

    05:18
  • 9
    Expresiones en XPath

    Expresiones en XPath

    08:18
  • 10
    Predicados en Xpath

    Predicados en Xpath

    05:34
  • 11
    Operadores en Xpath

    Operadores en Xpath

    05:51
  • 12
    Wildcards en Xpath

    Wildcards en Xpath

    06:11
  • 13
    In-text search en Xpath

    In-text search en Xpath

    08:21
  • 14
    XPath Axes

    XPath Axes

    05:16
  • 15

    Resumen de XPath

    00:01
  • 16
    Aplicando lo aprendido

    Aplicando lo aprendido

    08:52
Proyecto: scraper de noticias
  • 17
    Un proyecto para tu portafolio: scraper de noticias

    Un proyecto para tu portafolio: scraper de noticias

    10:08
  • 18
    Construcción de las expresiones de XPath

    Construcción de las expresiones de XPath

    10:29
  • 19
    Obteniendo los links de los artículos con Python

    Obteniendo los links de los artículos con Python

    10:56
  • 20
    Guardando las noticias en archivos de texto

    Guardando las noticias en archivos de texto

    14:53
Conclusiones
  • 21
    Cómo continuar tu ruta de aprendizaje

    Cómo continuar tu ruta de aprendizaje

    02:13
    Juan Nuñez

    Juan Nuñez

    student•
    hace 5 años
    <script> hace referencia a un código ejecutable <meta> aporta información extra al documento (metadatos) <iframe> colocar paginas externas dentro de la página actual
    José Manuel Piña Rodríguez

    José Manuel Piña Rodríguez

    student•
    hace 5 años

    **1. Para que sirve la etique script? ** Sirve para controlar el comportamiento de un programa en especifico o para interactuar con el sistema operativo

    **2.Que son los metadatos? ** Son elementos HTML que tienen como función describir la página web que los contiene. Estos son usados por los motores de búsqueda para hacer un análisis de dicho sitio web en cuanto a qué tipo de contenido se ofrece y cuál es la temática que allí se maneja

    3.Cual es la etiqueta para colocar un sitio web dentro de otro? Etiqueta <iframe>

      Cristian Barros

      Cristian Barros

      student•
      hace 5 años

      Te ganaste el cielo!

      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 3 años

      Like 👍

    Alejandro Giraldo Londoño

    Alejandro Giraldo Londoño

    student•
    hace 5 años

    RESUMEN: HTML

    ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

    HTML es una lenguaje que permite definir la estructura de una página web. Estrucutra, estilo, partes interactivas. En el contexto de webscraping HTML es muy importante

    Etiquetas está encerrado en angle brakets.<> Una etiqueta peude contener a otras etiquetas, las etiquetas tienen atributos.


    El conocimiento de los atributos será crucial porque con ellos podremos conectar el scraper para extraer información.


    • script Se utiliza para insertar o hacer referencia a un script ejecutable dentro de un docuemnto HTML.

    • meta aporta información extra al documento, metadatos como autor, título, fehca, palabras clave es de suma importancia para el navegador.

    • iframe Puedo anidar un elemento HTML sobre otro elemento.


      Franco Manca

      Franco Manca

      student•
      hace 5 años

      Excelentes tus resumenes...

      David Amador Morales

      David Amador Morales

      student•
      hace 5 años

      Excelentes resumen y respuestas, Alejandro.

    Xavier Carrera

    Xavier Carrera

    student•
    hace 5 años

    Facundo presumiendo sus 26mil puntos XD

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      xD vamos a alcanzarlo !

    JAVIER SANTIAGO SALGADO

    JAVIER SANTIAGO SALGADO

    student•
    hace 5 años
    AllTheTags.jpg
      Bryan

      Bryan

      student•
      hace 5 años

      Gran aporte

      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 3 años

      Muy didáctico, gracias 👍

    Alan Vazquez

    Alan Vazquez

    student•
    hace 5 años

    iframe (de inline frame) representa un contexto de navegación anidado, el cual permite incrustrar otra página HTML en la página actual.

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Vale, tenía la duda.

      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 3 años

      Buena definición 💡

    jorge andres pachon vallejo

    jorge andres pachon vallejo

    student•
    hace 5 años
    <SCRIPT> CÓDIGO se utiliza para insertar código o una ruta donde esta el codigo que ejecuta una acción dentro de una página web. <meta>METADATOS en términos generales los metadatos son datos sobre los datos, algo así como un índice de cosas; por ejemplo los metadatos de una biblioteca serían las fichas donde se relacionan los libros por género, estantería donde está el libro, escritor etc. En el contexto HTML Los metadatos son atributos que no se muestran en la página web, pero que sirven para identificar cosas como el autor de la página, el lenguaje en que está escrito, palabras clave para que los motores de búsqueda las indexen etc. estos metadatos se crean con la etiqueta <META> y aunque no son visibles al usuario de un sitio web si se pueden analizar de forma automática por código.
    Luis Fernando Úbeda Camacho

    Luis Fernando Úbeda Camacho

    student•
    hace 5 años

    HTML: Hypertext Markup Language

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Lenguaje de marcado de hipertextos.

      Diego Jurado

      Diego Jurado

      student•
      hace 3 años

      Y que representa el hiper texto?

    Cristian Nicolás Pereira

    Cristian Nicolás Pereira

    student•
    hace 5 años

    la etiqueta <script></script> se utiliza para insertar o hacer referencia a un script ejecutable dentro de un documento HTML o XHTML., un ejemplo podría ser:

    <script src="javascript.js"></script>
      Juan R. Vergara M.

      Juan R. Vergara M.

      student•
      hace 3 años

      Brillante 💡

    bryan Quispe Valeriano

    bryan Quispe Valeriano

    student•
    hace 5 años

    https://brandominus.com/blog/creatividad/todas-etiquetas-html5/

    aquí encontrarán muchas etiquetas html, con su respectiva función, espero les ayude

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Usemoslas todas !

    Luis Fernando Úbeda Camacho

    Luis Fernando Úbeda Camacho

    student•
    hace 5 años

    F12: Para ver la estructura HTML de una página web

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      También click derecho -> Inspeccionar

    Cesar Elías Armendariz Ruano

    Cesar Elías Armendariz Ruano

    student•
    hace 5 años

    la etiqueta <script>...</script>: se utiliza para insertar o hacer referencia a un script ejecutable dentro de un documento HTML o XHTML. Los scripts sin atributo async o defer, así como las secuencias de comandos en línea, son interpretados y ejecutados inmediatamente, antes de que el navegador continúe procesando la página.

    Los metadatos se refiere a aquellos datos que hablan de los datos por lo que describen el contenido de los archivos o la información de los mismos. Se caracterizan por:

    • Ser datos altamente estructurados que describen características de los datos, como el contenido, calidad, información y otras circunstancias o atributos.
    • Presentan diferenciaciones que dependerán, en última instancia, de las reglas incluidas en las aplicaciones para determinar la estructura interna de los esquemas de datos.
    • Pueden clasificarse en función de distintos criterios, como su contenido, variabilidad o función.

    El elemento HTML <iframe> (de inline frame) representa un contexto de navegación anidado, el cual permite incrustrar otra página HTML en la página actual.

    Martin DAVILA

    Martin DAVILA

    student•
    hace 5 años
    <script> hace referencia a un código ejecutable <meta> aporta información extra al documento (metadatos) <iframe> colocar paginas externas dentro de la página actual
      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Thanks (;:

    Arnau Izquierdo

    Arnau Izquierdo

    student•
    hace 5 años

    ¿QUÉ ES HTML?

    Nos permite definir la estructura que va a tener nuestra página web.

    Por otro lado usaremos CSS para dar color y estilos a nuestro HTML.

    Para dar dinamismo e interacción a nuestro código HTML y CSS, usaremos JavaScript.

      Moisés Manuel Morín Hevia

      Moisés Manuel Morín Hevia

      student•
      hace 5 años

      Un buen resumen.

    Esteban Pablo Hernández Ramírez

    Esteban Pablo Hernández Ramírez

    student•
    hace 5 años

    1.- etiqueta script: para meter un script (codigo) que se ejecuta sólo 2.- Son elementos que no se ven directamente en el navegador que están en el texto HTML que le ofrecen información del sitio a los buscadores; ejemplos: descripción del sitió, palabras claves, Author.. 3.- la etiqueta es iframe es la que sirve para insertar otras web's, en ella puedes definir el tamaño.. 4.- El archivo Robots es donde el creador de la página te dice que partes de la página debe indexar y cuales no, es decir cuales deben ser visibles desde buscadores y cuales no.

    Jose Reinaldo Roca Cruz

    Jose Reinaldo Roca Cruz

    student•
    hace 5 años

    Que es un Script? Es un código de programación, usualmente sencillo, que contiene comandos y ordenes que se van ejecutando de manera secuencia.

    Que son los meta datos?? Son datos que describen a otros datos,tienen muchos usos,los principales la búsqueda que información, y análisis.

    Cual es la etiqueta html que permite poner un sitio web dentro de otro? Me corrigen porfa si esta mal, según entendí la pregunta es el tag <a> con su atributo href.

      David Esteban Solorzano Taborda

      David Esteban Solorzano Taborda

      student•
      hace 5 años

      La etiqueta a permite crear vinculos el cual sirve para movernos entre paginas, o sitios web, mas no poner un sitio web en otro, para esto esta la etiqueta iframe , en la etiqueta se le pasa la url de la pagina que va a estar dentro del iframe.

      En cuanto a Script, si es lo que defines, pero la etiqueta script se utiliza para incluir codigo Javascript dentro de la pagina web, sea por medio de un archivo aparte o incluido en el mismo archivo html

      Jose Reinaldo Roca Cruz

      Jose Reinaldo Roca Cruz

      student•
      hace 5 años

      @estebansolorzano gracias por la aclaración

    José Tuzinkievicz

    José Tuzinkievicz

    student•
    hace 5 años

    Metadatos

    Nicoll Idaly Angulo Mejia

    Nicoll Idaly Angulo Mejia

    student•
    hace 5 años

    ¿Qué es iframe? un ejemplo?

      Daniel Adolfo Ordoñez Rubio

      Daniel Adolfo Ordoñez Rubio

      student•
      hace 5 años

      Hola, Nicoll :) La etiqueta <iframe> nos permite "incrustar" contenido externo en nuestra página, es como tener otra página dentro de nuestra página. A menudo se usa para incluir contenido de otros sitios, por ejemplo, un video de YouTube.

      Nicoll Idaly Angulo Mejia

      Nicoll Idaly Angulo Mejia

      student•
      hace 5 años

      uff genial, muchas gracias

    Roberto Morini

    Roberto Morini

    student•
    hace 3 años

    El elemento HTML Script (<script>) se utiliza para insertar o hacer referencia a un script ejecutable dentro de un documento HTML o XHTML.

    En HTML ciertos detalles no se pueden cubrir sólo con HTML (lenguaje de marcas) y CSS (lenguaje de estilos). Para ello tenemos que hacer uso de un lenguaje de programación llamado Javascript.

    Para utilizar Javascript, lo que se hace normalmente es indicar al HTML que se desea cargar un script (generalmente, un archivo de texto con código Javascript) y hacerlo funcionar sobre la página actual. Para hacer esto, se utiliza la etiqueta <script>, que permite indicar una serie de atributos:

    • src: dirección URL del script externo que se va a cargar; • type: tipo de script a cargar. Por defecto: text/javascript; • nomodule: cuando se define, el script no se carga en navegadores modernos; • async: (asíncrono) el script se ejecuta cuando se haya descargado, sin bloquear el navegador; • defer: posterga la ejecución del script hasta que se haya descargado por completo.

    La etiqueta <script> puede funcionar de dos modos:

    • script en línea: el código Javascript se incluye en el HTML, dentro de la etiqueta. • script externo: El código Javascript se incluye en el fichero Javascript enlazado en src.

    Ejemplos de ambos:

    <script> alert('¡Hola!'); </script> <script src="/js/script.js"></script>
    Roberto Morini

    Roberto Morini

    student•
    hace 3 años

    Metadatos: el elemento <meta>

    Los metadatos son datos que describen datos, y HTML tiene una forma «oficial» de introducir metadatos en un documento: el elemento <meta>. Hay muchos diferentes tipos de elementos <meta> que se pueden incluir en el <head> de la página.

    Un ejemplo: <meta charset="utf-8">. Este elemento simplemente especifica la codificación de caracteres del documento, es decir, el conjunto de caracteres que el documento puede usar. (“utf-8” es un conjunto de caracteres universal que incluye casi todos los caracteres de casi cualquier idioma humano). Significa que la página web podrá gestionar la visualización de cualquier idioma.

    Muchos elementos <meta> incluyen atributos name y content:

    • name especifica el tipo de metadato del que se trata; es decir, qué tipo de información contiene. • content especifica el contenido del metadato en sí.

    Ejemplo:

    <meta name="author" content="Chris Mills"> <meta name="description" content="Esta área de aprendizaje pretende brindar todo lo necesario para empezar a desarrollar páginas y aplicaciones web.">

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads