Sitemap.xml ¿Cómo usarlo?

Índice de contenidos

Hola Publilovers 🥰  en el artículo de hoy vamos a contarte un poco más sobre el mundo del SEO, en este caso sobre un archivo muy importante para mostrar a Google todas tus páginas de un sitio web. Sigue leyendo y no te pierdas nada 👇

¿Qué es un sitemap?

El sitemap o también llamado «mapa del sitio», es un archivo que contiene todas las páginas de una web. Vamos a contarte porqué es tan importante generar uno, cómo debes hacerlo correctamente y diferentes formas de hacerlo.

Este archivo está en formato XML y contiene una lista de todas las subpáginas de una página web en forma de enlace. Este archivo se puede subir a Search console de Google o otras herramientas para webmasters.

Un sitemap debe cumplir una serie de requisitos del protocolo, tal como la codificación en UTF – 8 y el lenguaje marcado XML.

Ventajas del sitemap XML

Los directorios de enlaces estructurados aumentan las posibilidades de indexar las páginas de un sitemap. Un índice con todos los contenidos accesibles para las arañas, y sobre todo si es contenido dinámico con cambios constantes.

Los sitemap, aparte de recoger las urls de las subpáginas, también recogen archivos multimedia como vídeos o imágenes. Hay además, etiquetas adicionales que indican a los robots qué tipo de contenido es (<image>, <video>). Incluso puedes utilizar atributos que describan el contenido con más detalle o que especifiquen su duración para que los motores de búsqueda puedan registrarlo.

Estructura de sitemap

Al igual que con cualquier documento en lenguaje de marcas extensible, el formato de un mapa del sitio funciona con etiquetas XML. Puedes encontrar 3 etiquetas obligatorias:

<urlset>, </urlset>

Cada archivo de un sitemap XML debe comenzar con una etiqueta de apertura <urlset> y terminar con una etiqueta de cierre </urlset>. La etiqueta tiene la función de resumir el archivo y hace referencia al protocolo estándar actual.

<url>, </url>

Las etiquetas <url> de apertura y de cierre son superiores a las entradas de URL individuales y, por lo tanto, indican el comienzo y el final de una subpágina de la lista.

<loc>, </loc>

La etiqueta <loc> identifica a cada una de las páginas del proyecto web o sus URL. El URL debe comenzar siempre con el protocolo (por ejemplo, «http») y terminar con una barra oblicua de cierre (si lo requiere el servidor web). También se define una longitud máxima de 2.048 caracteres.

A parte de estos atributos XML, hay etiquetas adicionales como <priority>, <lastmod> y <changefreq> para especificar las entradas de URL individuales. El grado de compatibilidad de esas etiquetas depende del motor de búsqueda. El rastreador de Google utiliza marcas <lastmod> para la indexación, mientas que ignora los otros dos atributos.

Etiquetas opcionales

<lastmod>, </lastmod>

Mediante la etiqueta <lastmod> se puede especificar la fecha (formato W3C) del último cambio de una página. La etiqueta es independiente de la cabecera «if modified since» que el servidor web puede devolver como parte de una respuesta HTTP 304.

<changefreq>, </changefreq>

La etiqueta <changefreq> proporciona a los robots de los buscadores información general sobre la frecuencia con la que se espera que se actualice una página (cada hora, cada día, cada mes, etc.).

<priority>, </priority>

Con esta etiqueta, la prioridad de un URL dentro de la página web puede expresarse en una escala de 0,0 a 1,0. De este modo, los rastreadores pueden conocer las páginas cuya indexación es especialmente importante.

Un archivo de sitemap puede contener un máximo de 50.000 URL y no puede superar los 50MB. Si es así, cada uno de los documentos del mapa del sitio debe figurar en un archivo de índice adicional cuya estructura no difiere de la de los archivos del mapa del sitio

Formas de generar un sitemap

Depende de cada proyecto y cada CMS, pero hay diferentes herramientas para la creación y actualización automática de nuestro sitemap.xml.

Primer debes saber que contenido quieres que Google indexe, es decir que va a mostrar Google en los resultados de búsqueda.

XML en WordPress

La mejor opción es utilizar el sitemap.xml que genera el plugin Yoast SEO. Esta herramienta nos generará las urls de los diferentes tipos de contenido que queremos que indexe.

Para ello, ve al apartado «General» del plugin y en «Características» ve a la parte de «Mapas del sitio XML». Verás un apartado que dice «Ver mapa del sitio XML» y verás el sitemap.

Por otro lado, vamos a Search console y en el apartado «sitemaps» colocaríamos esas urls y mandaríamos esos sitemaps a Google para que los localicen y los utilicen como archivo de apoyo a la indexación de los contenidos.

Prestashop

Hay un módulo de Prestashop que te solucionará todos los problemas relacionados con sitemap.xml y sus actualizaciones automáticas es el Google sitemap.

Para webs hechas a medida, lo mejor es programar tu propio sitemap automático. Puedes usar herramientas online como https://www-xml-sitemaps.com/

Generar archivos sitemap para proyectos

El sitemap.xml es un archivo que se sube al FTP junto con el resto de contenidos de nuestra web y sirve para listar todas las urls indexables de nuestro site, con el objetivo de que los buscadores lo puedan encontrar.

Su uso permite a las arañas que puedan encontrar de manera rápida y sencilla todas las páginas que queremos indexar.

¿Cómo configurar un sitemap.xml en mi web?

Se pueden usar diferentes herramientas para la creación del sitemap. Además, debes saber que los mapas de sitio se rigen mediante protocolos marcados por sitemaps.org. Se debe configurar de esta forma:

La primera línea de código marca la codificación del archivo y es obligatoria, mientras que la etiqueta urlset marca el listado, debe tener una apertura y un cierre obligatorio. Dentro del urlset, encontraremos tantas etiquetas <url> como páginas queramos mostrar.

Por otro lado, dentro de cada etiqueta <url> encontramos cuatro etiquetas de información tales como:

  • <lastmod> indica la fecha de la última modificación textual o programación. No es obligatoria.
  • <loc> Sirve para introducir una url única. Es obligatoria.
  • <changefreg> Indica la frecuencia en la que se realizan modificaciones textuales o código. No es obligatoria.
  • <priority> Indica de 0 a 1 la importancia que el webmaster atribuye a esa url en concreto respecto a la web. NO es obligatoria.

Conclusión

Te recomendamos que crees tanto un Sitemap XML como un sitemap HTML. Los sitemaps HTML soportan los motores de búsqueda en el rastreo y contribuyen a la usabilidad del sitio web. El Sitemap XML, ayuda a encontrar páginas nuevas y especialmente alojadas.

Otros artículos de interés:

Descubre más sobre las certificaciones de Google ADS

Compartir en redes sociales

Facebook
Twitter
LinkedIn

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *