|
|
Moderador del foro: ZorG |
Foro uCoz Ayuda a los webmasters Promoción del sitio Mapa del sitio. Preguntas + Respuestas |
Mapa del sitio. Preguntas + Respuestas |
Aquí les ofrezco un poquitín sobre Sitemap (Mapa del sitio). Espero de que sea útil para los usuarios.
P: ¿Cómo deben representarse las URL en el Sitemap? Al igual que con los archivos XML, los valores de datos (incluidas las URL) deben utilizar codificación con caracteres de escape de entidad para los siguientes caracteres: símbolo de unión (&), comillas simples ('), comillas ("), menor que (<) y mayor que (>). También debe asegurarse de que todas las URL siguen el estándar RFC-3986 para URI, el estándar RFC-3987 para IRI y el estándar XML. Si utiliza una secuencia de comandos para crear sus URL, puede utilizar caracteres de escape en las URL como parte de esa secuencia de comandos. De todos modos tendrá que utilizar caracteres de escape de entidad. Por ejemplo, la siguiente entidad de secuencia de comandos Python emplea caracteres de escape para $ python La URL que se obtiene del ejemplo anterior es: http://www.example.com/view?widget=3&count >2 P: ¿Tiene importancia el método de codificación que utilizo para crear mis archivos Sitemap? Sí. Sus archivos Sitemap deben usar codificación UTF-8. P: ¿Cómo se especifica la hora? Emplee la codificación W3C de fecha y hora para las marcas horarias “lastmod” y todas las demás fechas y horas de este protocolo. Por ejemplo, 2004-09-22T14:12:14+00:00. Esta codificación le permite omitir el fragmento de tiempo del formato ISO8601; por ejemplo, 2004-09-22 también es válido. Sin embargo, si su sitio cambia con frecuencia, le recomendamos que incluya el fragmento de tiempo para que los rastreadores dispongan de información completa acerca de su sitio. P: ¿Cómo puedo calcular la fecha lastmod (de la última modificación)? Para archivos estáticos, esta es la fecha real de actualización del archivo. Puede usar el comando de fecha UNIX para obtener esta fecha: $ date --iso-8601=seconds -u -r /home/foo/www/bar.php Para muchas URL dinámicas, puede realizar fácilmente el cálculo de la fecha “lastmod” (de la última modificación) en función de cuándo se modificaron los datos subyacentes o mediante una aproximación basada en actualizaciones periódicas (si corresponde). Incluso si utiliza una fecha o marca horaria aproximada, puede ayudar a los rastreadores a que eviten las URL que no han cambiado. Esto reducirá las exigencias de ancho de banda y los requisitos de CPU de sus servidores web. P: ¿Dónde puedo colocar mi Sitemap? Le recomendamos encarecidamente que coloque su Sitemap en el directorio raíz de su servidor HTML, es decir, en _http://ejemplo.es/sitemap.xml. En determinadas situaciones, es posible que desee generar distintos Sitemaps para las distintas rutas de su sitio, por ejemplo, en caso de que los permisos de seguridad de su organización clasifiquen el acceso de escritura a distintos directorios. Suponemos que si dispone del permiso para subir _http://ejemplo.es/path/sitemap.xml, también tiene el permiso para comunicar metadatos en _http://ejemplo.es/path/. Todas las URL enumeradas en el Sitemap deben residir en el mismo host que el Sitemap. Por ejemplo, si el Sitemap se encuentra en _http://www.ejemplo.es/sitemap.xml, no puede incluir URL de _http://subdominio.ejemplo.es. Si el Sitemap se encuentra en _http://www.ejemplo.es/micarpeta/sitemap.xml, no puede incluir URL de _http://www.ejemplo.es. P: ¿Qué tamaño puede tener mi Sitemap? Los Sitemaps no pueden superar los 10 MB (10.485.760 bytes) y pueden contener un máximo de 50.000 URL. Estos límites contribuyen a garantizar que su servidor web no se queda bloqueado al servir un gran número de archivos. Esto significa que si su sitio contiene más URL de las mencionadas o si su Sitemap supera la cantidad de megabytes indicada, debe crear varios archivos de Sitemap y utilizar un archivo del índice de Sitemap. Aunque su sitio sea pequeño, debe usar un archivo del índice de Sitemap si tiene previsto incluir más de 50.000 URL o si el tamaño del archivo supera los 10 MB. Un archivo del índice de Sitemap puede contener un máximo de 1.000 Sitemaps y no debe superar los 10 MB (10.485.760 bytes). También puede utilizar gzip para comprimir sus Sitemaps. P: Mi sitio tiene millones de URL, ¿hay algún modo de enviar únicamente las que se han modificado recientemente? Puede incluir las URL que se modifican con frecuencia en unos pocos Sitemaps y, a continuación, utilizar la etiqueta lastmod en su archivo de índice de Sitemap para identificar estos archivos. De este modo, los motores de búsqueda pueden llevar a cabo rastreos incrementales únicamente de los Sitemaps modificados. P: ¿Qué debo hacer tras crear el Sitemap? Una vez que haya creado el archivo de Sitemap, haga saber a los motores de búsqueda que existen enviándoselos directamente, realizando un ping de los mismos o agregándolos a la ubicación de Sitemap en el archivo robots.txt . P: ¿Es necesario especificar las direcciones URL completas del Sitemap? Sí. Para ello es necesario incluir el protocolo, por ejemplo http, en su URL. También tendrá que incluir una barra diagonal al final de la URL si su servidor web así lo requiere. Por ejemplo, _http://www.ejemplo.es/ es una URL válida para un Sitemap, mientras que www.ejemplo.es no lo es. P: Mi sitio contiene versiones de URL tanto "http" como "https". ¿Debo especificar ambas? No. Por favor, incluya únicamente una versión de cada URL en sus Sitemaps. Si incluye varias versiones de URL es posible que el rastreo de su sitio no se complete. P: Las URL de mi sitio incluyen ID de sesión, ¿tengo que eliminarlos? Sí. Si incluye ID de sesión en las URL es posible que el rastreo de su sitio sea incompleto y redundante. P: ¿Influye la posición que tiene la URL de un Sitemap en cómo se utiliza? No, la posición de una URL en el Sitemap no suele tener ningún efecto en la forma en que se utiliza ni en cómo la tienen en cuenta los motores de búsqueda. P: Algunas de las páginas de mi sitio utilizan marcos. ¿Debo incluir las URL del conjunto de marcos o las URL de los contenidos de los marcos? Por favor, incluya ambas URL. P: ¿Puedo comprimir mis Sitemaps en formato zip o deben estar en formato gzip? Por favor, use gzip para comprimir sus Sitemaps. No olvide que estos no deben superar los 10 MB (10.485.760 bytes), ya sean comprimidos o sin comprimir. P: ¿La sugerencia "priority" del Sitemap en XML afectará a la clasificación de mis páginas en los resultados de búsqueda? La sugerencia "priority" de su Sitemap sólo indica la importancia de una URL concreta respecto a las demás URL de su sitio y no afecta a la posición en la que aparecerán sus páginas en los resultados de búsqueda. P: ¿Hay algún esquema XML según el cual pueda validar mi Sitemap en XML? Sí. Dispone de un esquema XML para archivos de Sitemap en _http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd y de un esquema para archivos de índice de Sitemap en _http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. También puede obtener más información acerca de la validación de su Sitemap. P: ¿Qué debo hacer si tengo otra pregunta acerca de la utilización del protocolo o el envío de un Sitemap? Consulte la documentación disponible de cada motor de búsqueda para obtener más información sobre el envío y utilización de Sitemaps.
(Fuente: http://www.sitemaps.org/es/faq.php#top )
Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
|
Ahora uCoz posee su propio medio para crear archivos Sitemap. Aquí te contaré cómo puedes y debes utilizar esta opción.
INSTRUCCIÓN ACERCA DE CÓMO UTILIZAR LA FUNCIÓN DE SITEMAP Paso #1. Para empezar has de entrar en el Panel de Control y activar el módulo Búsqueda por el sitio. Cuando vas a activar el módulo, te proponen crear Sitemap – elige los módulos necesarios y los creas. Si tienes el módulo “Foro” activado, estará puesto en un archivo aparte. Después de creado Sitemap en el gestor de archivos en la raíz del sitio podrás ver 2 archivos nuevos: sitemap.xml y si hay foro, sitemap-forum.xml. Para actualizar Sitemap hay que hacer clic en Actualizar archivo Sitemap en el módulo Búsqueda por el sitio: Paso #2. Ahora los archivos obtenidos tenemos que agregarlos en los motores de búsqueda. Por ejemplo, en Google. Google. Entramos en Herramientas para webmasters, elegimos también un sitio o añadimos nuevo si no lo hay. Pasamos por el punto del menú Archivos Sitemap y de la misma manera agregamos nuestro Sitemap, para lo escribimos su nombre en la línea.
Dentro de un tiempo los archivos añadidos se examinarán y se indexarán, y después de la siguiente actualización los enlaces de Sitemap (generalmente, no todos de una vez) se expondrán en los motores de búsqueda. Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
|
Bien pensado este medio de crear sus propio sitemap, y facil de usar.
|
Mostrar marcas de Google Maps definidas en un archivo XML
Cómo guardar las marcas de un mapa de Google en un archivo XML y acceder a ese XML para mostrar las marcas en el mapa. En este artículo vamos a crear un archivo XML con los datos de diversas marcas que queremos colocar en un mapa de Google. Desde Javascript accederemos al archivo XML, leeremos sus contenidos y colocaremos las marcas definidas en el mapa. Si queremos tener varias marcas a la vista en un mapa de Google puede ser interesante guardarlas todas en un archivo para facilitar su almacenamiento y su procesamiento por el Javascript de Google Maps. Para ello, el XML es un formato excelente, ya que nos ofrece un mecanismo sencillo y personalizable para definir las marcas y los datos asociados a ellas. Además, el API de Google Maps tiene varias clases para trabajar con XML, por lo que no tendremos que preocuparnos en las complejidades de procesar e interpretar el código XML donde hemos guardado las marcas. Archivo XML de las marcas Es un archivo que contiene código XML, donde las etiquetas que definen las marcas, así como los atributos de éstas, tienen nombres que cada uno puede elegir de la manera que más le convenga, así como añadir más o menos informaciones o datos para cada marca. Podemos ver el resumen del código del archivo XML aquí:
Quote <marcas> <marca lat="41.38196080315538" lng="2.176666259765625" codigohtml="Marca situada sobre Barcelona. <br>Famosa en el mundo entero." /> <marca lat="42.58544425738491" lng="-5.5755615234375" codigohtml="Esta marca aparece sobre la ciudad de Leon" /> </marcas> El nombre del archivo también es indiferente. En mi caso lo he nombrado como marcas-xml.xml y para realizar este ejemplo lo he colocado en el mismo directorio donde está el mapa de Google que lo lee. Lectura del archivo XML para procesar cada una de las marcas Primero tengo que hacer una llamada para descargar el archivo XML con los datos de las marcas:
Quote //descargar el xml con las marcas y procesar su contenidos GDownloadUrl("marcas-xml.xml", function(documento) { //En esta función puedo examinar el XML y hacer cosas dependiendo su contenido. }); Con GdownloadUrl traigo el contenido de un archivo. El nombre del archivo a descargar se lo pasamos como primer parámetro y como segundo parámetro tenemos que especificar una función con el código que queremos ejecutar cuando se termine de descargar el archivo. En esa función, a su vez, tenemos a nuestra disposición un parámetro que es el documento recién descargado. Todo lo que queramos hacer con el XML debe ser indicado forzosamente dentro de la función, porque está preparada para ejecutarse sólo cuando el XML ha sido recibido por completo. Ahora, con el documento, que sabemos es un XML, puedo utilizar el método GXml.parse() para analizarlo y devolver un objeto que contiene la estructura de nodos del XML.
Quote var xmlDoc = GXml.parse(documento); A continuación, puedo extraer todas las etiquetas de las marcas con una llamada a un método del objeto xmlDoc.
Quote var marcas = xmlDoc.documentElement.getElementsByTagName("marca"); Después de ese paso, la variable marcas contendrá un array con todas las etiquetas de las marcas. Luego podemos hacer un bucle para recorrer todas las marcas y colocarlas en el mapa.
Quote for (var i = 0; i < marcas.length; i++) { var lat = parseFloat(marcas[i].getAttribute("lat")); var lng = parseFloat(marcas[i].getAttribute("lng")); var punto = new GLatLng(lat,lng); var html = marcas[i].getAttribute("codigohtml"); crearMarca(punto, html); } Dentro del bucle podemos acceder a marcas[i].getAttribute() para extraer los valores de los atributos de las marcas definidos en el código XML.
Quote function crearMarca(punto, html){ var miMarca = new GMarker(punto); GEvent.addListener(miMarca, "click", function (){ miMarca.openInfoWindowHtml(html); }); map.addOverlay(miMarca); } Con lo que hemos visto hasta ahora ya ser ha podido procesar las marcas y colocarlas en el mapa. Código completo de crear marcas en mapas de Google desde archivos XML
Quote function load() { if (GBrowserIsCompatible()) { var map = new GMap2(document.getElementById("map")); map.addControl(new GLargeMapControl()); map.addControl(new GMapTypeControl()); map.setCenter(new GLatLng(40.41689826118782,-3.7034815549850464), 5); function crearMarca(punto, html){ //descargar el xml con las marcas y procesar su contenido crearMarca(punto, html); } Ahora quizás queramos ver el ejemplo construido en una página aparte. Algunas consideraciones sobre el XML Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
|
Protocolo Sitemap El protocolo Sitemap está formado por etiquetas XML. Todos los valores en un Sitemap deben de tener sustitución de entidades (NT. ‘entity-escaped‘ en inglés). El archivo en sí debe estar codificado bajo UTF-8.El Sitemap debe: • Comenzar con una apertura de la etiqueta <urlset> y acabar con una etiqueta de cierre </urlset>. El resto de etiquetas son opcionales. El soporte de estas etiquetas opcionales podría variar en cada motor de búsqueda. Dirígete a la documentación de cada motor de búsqueda para más detalles. Ejemplo de XML de Sitemap
Quote <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.ejemplo.com/ </loc> <lastmod>2005-01-01 </lastmod> <changefreq>monthly </changefreq> <priority>0.8 </priority> </url> </urlset> Definición de las etiquetas XML <url> (necesario) Etiqueta padre para cada entrada de URL. El resto de etiquetas son hijas de esta etiqueta.. <loc> (necesario) URL del documento. Esta URL debe comenzar con el protocolo (por ejemplo http) y terminar con una barra, si tu servidor web lo precisa. Debe contener menos de 2.048 caracteres. <lastmod> (opcional) La fecha de la última modificación de este documento. Esta fecha debe estar en el formato Datetime de W3C. Este formato te permite omitir la parte de la hora si quieres y usar YYYY-MM-DD.Fíjate que esta etiqueta es distinta de la cabecera If-Modified-Since (304) que un servidor puede devolver, y los motores de búsqueda pueden usar ambas fuentes distintamente. <changefreq> (opcional) La frecuencia con la que se espera que el documento sea modificado. Este valor ofrece información general a los motores de búsqueda y puede que no se correlacione exactamente en la frecuencia en la que analicen el documento. Los valores válidos son (NT: traducción entre paréntesis): <priority> (opcional) La prioridad de esta URL relativa al resto de URLs en tu sitio. Los valores válidos van desde 0.0 hasta 1.0. Este valor no afecta a como tus documentos son comparados a documentos en otros sitios. Sólo hace saber a los motores de búsqueda qué documentos estimas que son más importante para las arañas.La prioridad por defecto de un documento es 0.5.Por favor, date cuenta que la prioridad que asignes a un documento no influye en la posición de tus URLs en las páginas de resultados de un motor de búsqueda. Los motores de búsqueda pueden usar esta información cuando estén seleccionando entre URLs del mismo sitio, así que puedes utilizar esta etiqueta para incrementar la probabilidad de que tus documentos más importantes aparezcan en el índice de búsqueda.También fíjate que asignar una alta prioridad a todas las URLs en tu sitio no te va a ayudar. Debido a que esta prioridad es relativa, sólo es utilizada para seleccionar URLs en tu sitio. Sustitución de entidades (Carácter + Código de sustitución) Además, todas las URLs (incluyendo la URL de tu Sitemap) deben ir correctamente adecuadas como URL y codificadas para poder ser leídas por el srevidor donde están situadas. Sin embargo, si estás usando algún tipo de script, herramienta o registro para generar tus URLs (cualquier cosa que no sea escribirlas a mano), es normalmente bastante fácil. Por favor comprueba para estar seguro que tus URLs siguen el estándar RCF-3986 para URIs, el RFC-3987 para IRIs, y el estándar XML. A continuación, hay un ejemplo de una URL que utiliza un carácter no ASCII (NT: usa el umlaut, también llamado u con diéresis, cambiaré el ejemplo para usar la letra ‘ñ‘) además de un carácter que requiere ser sustituido (&):
Quote http://www.ejemplo.com/españa.html&q=nombre Lo siguiente es la misma URL, codificada en ISO-8859-1 (para alojar en un servidor que use esa codificación) y con la URL adaptada:
Quote http://www.ejemplo.com/espa%F1a.html&q=nombre Luego está la misma URL, codificada bajo UTF-8 (para alojar en un servidor que use esa codificación) y con la URL adaptada:
Quote http://www.ejemplo.com/espa%C3%B1a.html&q=nombre Y a continuación la misma URL, pero además con sustitución de entidades:
Quote http://www.ejemplo.com/espa%C3%B1a.html&q=nombre Ejemplo de Sitemap en XML
Quote <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sobjetoaps.org/schemas/sobjetoap/0.9"> <url> <loc>http://www.ejemplo.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> <url> <loc>http://www.ejemplo.com/catalogo?objeto=12&desc=madrid</loc> <changefreq>weekly</changefreq> </url> <url> <loc>http://www.ejemplo.com/catalogo?objeto=73&desc=bcn</loc> <lastmod>2004-12-23</lastmod> <changefreq>weekly</changefreq> </url> <url> <loc>http://www.ejemplo.com/catalogo?objeto=74&desc=londres</loc> <lastmod>2004-12-23T18:00:15+00:00</lastmod> <priority>0.3</priority> </url> <url> <loc>http://www.ejemplo.com/catalogo?objeto=83&desc=usa</loc> <lastmod>2004-11-23</lastmod> </url> </urlset> Utilizando archivos índice de Sitemaps (para agrupar diferentes archivos Sitemap) Si ofreces varios archivos Sitemap, deberias listar cada archivo Sitemap en un archivo índice Sitemap. Los índices Sitemap no pueden listar más de 1.000 Sitemaps y no deben ocupar más de 10MB (10.485.760 bytes). El formato XML de un índice Sitemap es muy parecido al formato XML de un archivo Sitemap. El índice sitemap debe ofrecer: • Comenzar con una etiqueta de apertura <sitemapindex> y cerrar con una etiqueta </sitemapindex>. La etiqueta opcional <lastmod> también está disponible para archivos de índice de Sitemaps. Nota: Un índice de Sitemaps sólo puede especificar Sitemaps que se encuentren en el mismo sitio que el propio índice. Por ejemplo, Ejemplo de índice Sitemap en XML
Quote <?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemapindex/0.9"> <sitemap> <loc>http://www.ejemplo.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.ejemplo.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex> Nota: Las direcciones URL de los Sitemap deben tener sustitución de entidades. Definición de etiquetas XML del índice de Sitemap Localización de los archivos Sitemap Si tienes permisos para modificar http://ejemplo.com/ruta/sitemap.xml, se da por supuesto que también tienes permisos para ofrecer información de URLs con el prefijo http://ejemplo.com/ruta/. Ejemplos de URLs consideradas válidas en http://ejemplo.com/catalogo/sitemap.xml incluirían: URLs que no se considerarían válidas en http://ejemplo.com/catalogo/sitemap.xml incluirían: Las URLs que no se consideren válidas serán desechadas sin más. Recomendamos fuertemente que sitúes tu Sitemap en el directorio raíz de tu servidor web. Por ejemplo, si tu servidor web está en ejemplo.com, entonces tu índice Sitemap estaría en http://ejemplo.com/sitemap.xml. En ciertos casos, puedes necesitar producir diferentes Sitemaps para diferentes rutas (por ejemplo si los permisos de seguridad en tu organización separan el acceso de escritura a diferentes carpetas). Si envías un Sitemap utilizando una ruta con un número de puerto, debes incluir ese número de puerto como parte de cada URL listada en el Sitemap. Por ejemplo, si tu Sitemap se encuentra en http://www.ejemplo.com:100/sitemap.xml, entonces cada URL listada en el Sitemap debe comenzar con http://www.ejemplo.com:100. Validando tu Sitemap
Quote Para Sitemaps: http://www.sitemaps.org/schemas/sitemap/09/sitemap.xsd Para índices de Sitemaps: Existen varias herramientas disponibles para ayudarte a validar la estructura de tu Sitemap basado en este esquema. Puedes encontrar un listado de herramientas relacionadas con XML en las siguientes direcciones:
Quote http://www.w3.org/XML/Schema#Tools http://www.xml.com/pub/a/2000/12/13/schematools.html Para validar tu Sitemap o índice de Sitemap contra un esquema, el archivo XML necesita cabeceras adicionales como se muestra a continuación.
Quote <?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9 http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd " xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> ... </url> </urlset> Índice de Sitemap: <?xml version='1.0' encoding='UTF-8'?> <sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9 http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd " xmlns="http://www.sitemaps.org/schemas/siteindex/0.9"> <sitemap> ... </sitemap> </sitemapindex> Extendiendo el protocolo Sitemap
Quote <?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9 http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd " xmlns="http://www.sitemaps.org/schemas/sitemap" xmlns="http://www.example.com/schemas/example_schema"> <!-- namespace extension --> <url> ... </url> </urlset> Notificando a las arañas de los motores de búsqueda Así los motores de búsqueda pueden acceder a tu sitemap y hacer que sus arañas dispongan de las URLs. Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
|
Diseño Web y Posicionamiento en Buscadores: utilizando Sitemaps El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. Frecuentemente, la posición del sitio en la lista de resultados determina el exito o el fracaso de nuestro trabajo, aún con diseños creativos y profesionales. La condición básica y fundamental del posicionamiento es la certeza de que todas las páginas del sitio se encuentran indexadas correctamente, y esto no es siempre fácil de lograr. Aquí es donde los Sitemaps pueden sernos de gran ayuda. ¿Qué es y para qué sirve un sitemap? Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna. Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse. Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps. Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio. La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación: Contenidos obligatorios del sitemap El archivo XML debe: Contenidos opcionales del sitemap Los nodos opcionales, aunque importantes, son: El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él. Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/ Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio. A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo. Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
|
| |||
| |||