Obtener los datos de cada URL

Clase 14 de 28Curso de Estrategia y Planeación de Contenidos para SEO (2020)

Contenido del curso

Resumen

Automatizar la extracción de datos SEO desde un sitio web es una habilidad fundamental para cualquier auditoría de contenido. En lugar de copiar manualmente cada título y descripción, existe una fórmula en Google Sheets que permite traer esa información directamente desde las URLs: IMPORTXML. A continuación se explica paso a paso cómo obtener el título de SEO, la meta description y el título H1 de cada página de forma automatizada.

¿Qué elementos SEO necesitas extraer de cada URL?

Cuando observas los resultados de búsqueda de Google, conocidos como SERPs (Search Engine Results Pages), cada resultado muestra tres elementos visibles [0:08]:

  • URL: la dirección web de la página.
  • Título de SEO: el texto azul en el que se hace clic.
  • Meta description: el fragmento de texto que aparece debajo del título.

Al ingresar al contenido de la página, existe un cuarto elemento clave: el título H1, que es el encabezado principal visible dentro del artículo o la página. Es importante entender que el título de SEO y el título H1 pueden ser diferentes, ya que cada uno se puede personalizar de forma independiente [0:35].

Estos elementos forman la base de una auditoría inicial de contenidos porque revelan cómo está estructurada y presentada cada página tanto para Google como para los usuarios.

¿Cómo funciona la fórmula IMPORTXML para obtener datos SEO?

La fórmula IMPORTXML es exclusiva de Google Sheets en Google Drive; no funciona en Microsoft Excel tradicional [0:55]. Esta fórmula recibe dos parámetros: la URL de la página y una consulta llamada XPath Query que indica qué dato específico se quiere extraer del código HTML.

¿Cómo extraer el título de SEO?

Para obtener el título de SEO de una página, la fórmula es muy sencilla [1:15]:

=IMPORTXML(B2, "//title")

  • B2 es la celda donde está la URL.
  • //title le indica a la fórmula que busque la etiqueta <title> en el código HTML.

Una vez obtenido el primer resultado, basta con extender la fórmula hacia abajo para que traiga automáticamente los títulos de SEO de todas las URLs del inventario [1:35]. En ocasiones la carga puede tardar unos segundos, pero los datos se completan sin intervención manual.

¿Cómo extraer la meta description?

La meta description requiere una consulta XPath un poco más detallada [2:15]:

=IMPORTXML(B2, "//meta[@name='description']/@content")

  • //meta busca la etiqueta meta en el código.
  • [@name='description'] filtra para encontrar específicamente la que tiene el nombre "description".
  • /@content extrae el valor del atributo content, que es el texto de la descripción.

Si el resultado muestra un error indicando que el contenido importado está vacío, significa que esa página no tiene una meta description definida manualmente [2:55]. Esto no es necesariamente un problema grave: Google genera una descripción automática cuando no encuentra una. Sin embargo, redactar una meta description personalizada ayuda a atraer la atención de los usuarios y puede generar más clics, lo cual tiene una influencia indirecta en el posicionamiento SEO [4:35].

¿Cómo extraer el título H1 de cada página?

El título H1 es el encabezado principal del contenido dentro de la página. Para verificar que efectivamente se trata de un H1, se puede hacer clic derecho sobre el título en el navegador y seleccionar Inspeccionar elemento (Inspect), lo que muestra la etiqueta HTML correspondiente [3:20].

La fórmula para extraerlo es directa [3:45]:

=IMPORTXML(B2, "//h1")

En algunos casos el H1 puede aparecer separado en varias celdas debido a la estructura interna del código. Para corregirlo, se utiliza la opción pegar solo valores (paste values only), que elimina la fórmula y deja texto plano editable. Así se pueden unir manualmente las partes del título [4:05].

¿Por qué son importantes estos elementos para el posicionamiento web?

El título de SEO y el título H1 son dos de los factores más relevantes para el posicionamiento orgánico de cualquier contenido [4:25]. Google los utiliza para entender de qué trata una página y determinar su relevancia frente a las búsquedas de los usuarios.

La meta description, aunque no es un factor directo de ranking, cumple un rol estratégico: un texto bien redactado puede incrementar la tasa de clics (CTR), lo que eventualmente mejora la posición en los resultados.

Con las URLs, el título de SEO, la meta description y el título H1 recopilados en un solo archivo, ya se cuenta con la materia prima para comenzar a identificar oportunidades de mejora. ¿Has probado la fórmula IMPORTXML en tus propias auditorías? Comparte tu experiencia y las dificultades que hayas encontrado.