Uso de Seoliser para Auditoría de Páginas Web

Clase 7 de 35 • Curso de Optimización de SEO Técnico

Contenido del curso

SEO: más que robots y palabras clave

Rastreo y accesibilidad

Arquitectura del sitio web

Elementos técnicos en contenidos

Velocidad de carga

Microformatos y schema.org

Optimización Multi-idioma y/o Multi-país

30
Implementación de la etiqueta hreflang para SEO internacional
05:24 min

SEO para sitios en JavaScript

Conclusiones

Tomar examen

Resumen

Saber qué páginas están siendo bloqueadas para los motores de búsqueda es una tarea crítica en cualquier auditoría SEO. SEOlizer es una herramienta gratuita que emula el proceso de rastreo de Google y permite analizar hasta diez mil URLs sin necesidad de instalar software. A continuación se explica paso a paso cómo utilizarla para verificar la etiqueta meta robots y proteger el presupuesto de rastreo de un sitio web.

¿Qué es SEOlizer y por qué usarla en una auditoría SEO?

SEOlizer replica el comportamiento del algoritmo de rastreo de Google sobre un sitio web. Su principal ventaja es que ofrece un plan completamente gratuito para sitios de hasta diez mil URLs, lo que la convierte en una opción accesible para cualquier proyecto.

Para comenzar a usarla solo es necesario crear una cuenta [0:07]:

Ingresar la URL del sitio que se desea auditar.
Completar nombre, correo electrónico y número de teléfono para verificar la identidad.
Asignar una contraseña y confirmar el registro.

Una vez creada la cuenta, se hace clic en el botón "Empezar a rastrear" (Start Crawl) [1:16]. La herramienta comienza a recorrer automáticamente cada página del sitio. El tiempo de rastreo depende del tamaño del sitio; puede tomar entre diez y quince minutos o incluso más.

¿Cómo interpretar los resultados del rastreo?

Al finalizar el rastreo, el dashboard de SEOlizer presenta dos categorías principales [2:42]:

URLs indexables: páginas que Google puede incluir en su índice.
URLs no indexables (unindexable): páginas que están siendo excluidas del índice por alguna razón.

Al hacer clic en las URLs no indexables, la herramienta muestra la razón por la que cada página está bloqueada [2:55]. Las causas más comunes incluyen:

Código HTTP: errores de servidor o redirecciones.
Canonical: la etiqueta canonical apunta a otra URL.
robots.txt: el archivo de exclusión impide el acceso.
Meta robots: la etiqueta dentro del HTML indica que no debe indexarse.

En el ejemplo del curso, ninguna página estaba bloqueada específicamente por la etiqueta meta robots, lo cual se marcó como correcto en el archivo de auditoría [3:18].

¿Cuándo agregar la etiqueta meta robots con valor noindex?

Existen páginas que no aportan valor al usuario desde los resultados de búsqueda, como la página de contacto. Mantenerlas indexadas consume lo que se conoce como presupuesto de rastreo (crawl budget), es decir, la cantidad de recursos que Google destina a recorrer un sitio en cada visita [3:30].

Para indicar a Google que no indexe determinadas páginas, se utiliza la etiqueta meta robots con el valor noindex. La estructura correcta se encuentra en la documentación oficial de Google Developers [3:50]. No es necesario saber programar; basta con copiar la etiqueta y solicitar su implementación en el código HTML de cada página que deba excluirse.

¿Cómo documentar esta acción en la auditoría?

Dentro del archivo de auditoría se registra de la siguiente forma [4:05]:

Estado: necesita optimización.
Prioridad: media, porque las páginas no indexadas desperdician presupuesto de rastreo sin generar tráfico útil.
Acción necesaria: agregar la etiqueta meta robots noindex en las páginas que no deben aparecer en el índice de Google.
Detalle: incluir el listado de URLs afectadas o, si son pocas, agregarlas directamente.
Fecha: registrar cuándo se realizó la auditoría.

Con este proceso completado, el sitio queda mejor preparado para que Google concentre sus recursos de rastreo en las páginas que realmente importan. Si has aplicado estos pasos, comparte tu experiencia y cuéntanos cuántas URLs no indexables encontraste en tu propio sitio.

Comentarios

JOHN VIVAS DURAN

student•

No tenia ni idea que esto existe y que puedo mejorar la posición de mi web yo solito, este curso me abre la mente a un nuevo lugar.

Gracias Prof.Alejandro y eqp Platzi

Alejandro Gonzalez

teacher•

Excelente John!

Sandra Liliana Delgado Gómez

student•

Cuando encuentro páginas no relevantes para las personas y debería bloquearlas de indexación utilizo la etiqueta

<noindex>

Si utilizan wordpress y el plugin de** Yoast** este tiene la opción de agregarla sin necesidad de ingresar código, ver blog post de Yoast donde explican: Indexing in Yoast SEO: Show x in search results?

Al configurar el plugin deben hacer el ajuste en la opción de Apariencia, en "Content Types" en esta sección puede uno realizar los ajustes para las Entradas, Paginas, Categorías, Etiquetas

(Tags)

Y al momento de escribir una entrada, pagina u otro tipo de contenido y necesito modificarle la condición como en el caso la configuración predeterminada según la imagen anterior del ejemplo esta activo para que se indexe o se muestre ante los resultados de búsqueda y se de el caso que quiero que ese post o página en particular no se indexe en la edición del mismo me voy a la opción de Yoast en avanzado y selecciono manual la opción a No Index, les dejo un pantallazo guía

La otra opción es si lo realizas con código siguiendo los lineamientos con el post de desarrolladores de Google

donde en la sección de <head> hay que insertar la etiqueta

<!DOCTYPE html>
<html><head>
<meta name="robots" content="noindex" />
(…)
</head>
<body>(…)</body>
</html>

José Manuel Piña Rodríguez

student•

Gracias, excelente.

Nicole Andrea Plazas Parra

student•

y con prestashop que se podria utilizar para bloquear las pag que no quieres?

María Cristina Tamayo Ossa

student•

Para auditar si se están bloqueando páginas importantes, se puede utilizar la herramienta https://seolyzer.io/

Emula el algoritmo de google para el rastreo del sitio.
Además permite rastrear un sitio web de hasta 10 mil URL gratis.

Victor Marcelo Saavedra Calderon

student•

Esta herramienta no me deja verificar mi cuenta y en el chat ni contestan.

joel bobadilla minaya

student•

Me pasa lo mismo, no he logrado verificar mi cuenta

Juan Sebastian Valencia Jimenez

student•

Cual es la diferencia en usar robots.txt y el tag robots ? entiendo que los dos sirven para no indexar la pagina pero entonces cuando debería usar uno y cuando usar el otro ?

Alejandro Gonzalez

teacher•

Juan el robots.txt sirve para bloquear el acceso a Google, pero lo puede ignorar.

El tag de meta robots sirve para decirle que NO indexe y ese no lo ignora.

José Manuel Piña Rodríguez

student•

se me presento una duda, que diferencia hay si yo coloco una direccion en mi archivo robots.txt que no quiera indexar a colocar la etiqueta

<meta name = "robots" content ="noindex" />

que no desee indexar tambien. Si son similar que practica se recomienda?

Alejandro Gonzalez

teacher•

Son similares pero diferentes:

En el robots.txt le estás diciendo a Google que no entre.

Con la etiqueta de meta robots, Google puede entrar, pero les estás diciendo que no vaya a indexar la URL a la que le pongas la etiqueta.

La recomendación depende del caso. Si es por URLs, con la etiqueta es más fácil. Si es un folder completo, más fácil por robots.txt

José Manuel Piña Rodríguez

student•

Gracias Alejandro, por tu explicacion y tu respuesta inmediata muy clara y concisa. Ten por seguro que van 5 estrellas.

Maria Artavia

student•

¿Qué pasa si hay páginas bloqueadas con la etiqueta Meta Robots?

Alejandro Gonzalez

teacher•

Que Google no las va a indexar en los resultados de búsqueda. Debes revisar si no son páginas importantes para las personas, si no lo son, pues está ok que estén bloqueadas.

Jonathan Wilmer Albán Bonilla

student•

Una genial herramienta que me ha servido mucho es screaming flog.

Brandon Baldeón Martínez

student•

Hola, ¿Cómo ves los meta robots en screaming frog?

Raúl Baltazar

student•

Una herramienta útil que encontré recientemente es seobility, tiene un informe muy completo de varios aspectos de este curso. Seolyzer no funciona :( .

Raúl Baltazar

student•

En marzo 2022, en el sitio se Soelyzer escribí en el chat a Oliver de Seolyzer pidiendo que me diera acceso con mi número de celular (con lada). Me respondió desde su correo de Gmail y así pude usar la plataforma.

Fabio Figueroa Benitez.

student•

el de Neil Patel también funciona

Ivon Lorena López Giraldo

student•

¿Cual es la diferencia entre robots.txt y la etiqueta metarobots?

Anthony Ismael Manotoa Moreno

student•

Ambos sirven para no indexar pero tienen diferencias. En el caso de robots.txt, le dice a Google que esa URL ni la vea y, por lo tanto, que no pierda su tiempo. La etiqueta metarobots le dice que no indexe ese contenido pero puede seguir los enlaces del contenido y darles el voto de confianza; pero esto hace que Google sí pierda su tiempo. Eso se conoce como gastar crawl budget. No te debería preocupar mucho sino hasta que tengas un sitio grande. Según tus necesidades es mejor una opción u otra. Te dejo este artículo que lo explica con más profundidad: https://blog.ensalza.com/desindexando-en-google/

Luis Diego Cárdenas Padilla

student•

Nice

Alejandro Gonzalez

teacher•

Excelente!

Luisa Fernanda Celi Pedreros

student•

A mi me sale ambas todo en verde :P

ARIEL HORACIO FUHR

student•

seolyzer gratis me dejo trabajar solo unos minutos y no pude ver ningun reporte. Luego me pide que me pague una subscripcion. existe alguna alternativa gratuita?

Diana María Betancur Franco

student•

Hola, vi tu comentario y ni siquiera abrí el que recomienda el profe sino que busqué otras alternativas, mira esta que encontré es gratis SEOptimer

ARIEL HORACIO FUHR

student•

Lo voy a probar, muchas gracias por el dato.

César Castro

student•

al parecer la herramienta de SEOLYZER ya no está operando.

CM COMPANY

student•

correcto

JUAN CARLOS BELTRAN FORERO

student•

Ya SEO LYZER ya no es gratis ¿que herramienta puedo usar?

Alejandro Gonzalez

teacher•

Acá puedes usarlo gratis https://seolyzer.io/signup/?offer=free

Cristian Tejos

student•

hola, excelente curso, tengo una pregunta, no entiendo a que de refiere cuando habla del presupuesto, y que para aprovecharlo bien dejamos noindex algunas páginas no relevantes, ¿que es esto del presupuesto que nos asigna google?

Alejandro Gonzalez

teacher•

Google asigna unos recursos para que el algoritmo lea el sitio web.

Cuando el sitio web no está optimizado, esos recursos se pueden acabar y Google no termina de rastrear todo el sitio.

Por eso cuando hay páginas no relevantes para que aparezcan en buscadores, es bueno usar el no index.

Humbert Glaffo

student•

Me confundí. Para las paginas que el usuario no debería ver se usa disallow, como enseñado en la lección anterior o wste modo de noindex?

Alejandro Gonzalez

teacher•

Disallow es para bloquear que Google entre

Noindex. es para decirle a Google que no las indexe

Si el usuario no las debería ver, es otra historia muy diferente

Daniel Felipe Herran Acosta

student•

La herramienta SEOLYZER me arroja que el estado de mi sitio es "unavailable site". En el dashboard me muestra como resultado solo una url indexada.

¿Qué puedo hacer para solucionarlo?

Mayra Lopez

student•

Hola Danielherran. Creo que tendrías que hacer una revisión paso por paso, desde verificar que tu sitemap este correctamente creado. Cual es tu sitio? me dejas darle una revisada?

Sandra Liliana Delgado Gómez

student•

Tengo una consulta frente a la etiqueta meta robots, para el caso de uno de mis sitios webs tengo resultados con esta etiqueta:

Este es mi archivo robots.txt

Cuando analizo el listado de urls correspondientes a la etiqueta meta robots se me genera este listado que la particularidad corresponde a las secciones de:

Category
Tags y una del CDN que utilizo

El sitio web lo manejo con WordPress

¿Esto tiene relación con la configuración de no index que esta en Yoast frente a las categorías y etiquetas?

Aquí yo active esta configuración siguiendo los consejos de Romuald Fons en su video LOS 8 MEJORES PLUGINS PARA WORDPRESS 2020 - CURSO SEO #7 de configuración de plugins en el minuto 11:43 habla sobre la etiqueta meta robots

Sobre todo lo anterior, es recomendable dejarlo así sí indexar las categorías y etiquetas y que solo se indexen las url de páginas y post para optimizar el presupuesto de rastreo?

Que para el caso al ingresar por la url de categorías la verdad considero que no sería tan relevante para un usuario que le saliera este tipo de resultados al realizar una consulta, siendo así como podría asociar el estado en el informe de auditoria y acciones a tomar

Alejandro Gonzalez

teacher•

Si las categorías no son importantes para indexarlas entonces todo bien. Pero si tienes oportunidad de posicionarlas deberías ponerlas publicas.

Uso de Seoliser para Auditoría de Páginas Web

SEO: más que robots y palabras clave

Auditoría de SEO Técnico: Identificación y Solución de Problemas

SEO Técnico: Mejora el Tráfico Orgánico de tu Sitio Web

SEO Técnico: Optimización para Motores de Búsqueda

Auditoría Técnica de SEO: Rastreo, Indexación y Ranking en Google

Rastreo y accesibilidad

Checklist de Auditoría SEO Técnico para eCommerce

Auditoría de archivos robots.txt para SEO y visibilidad en Google