• Página 1 de 1
  • 1
Moderador del foro: ZorG  
Mapa del sitio. Preguntas + Respuestas
GUARAGUAO
Mensajes: 2362
Reputación: 81
Mensaje Nº 1 | 2:38 PM
Aquí les ofrezco un poquitín sobre Sitemap (Mapa del sitio). Espero de que sea útil para los usuarios.

P: ¿Cómo deben representarse las URL en el Sitemap?

Al igual que con los archivos XML, los valores de datos (incluidas las URL) deben utilizar codificación con caracteres de escape de entidad para los siguientes caracteres: símbolo de unión (&), comillas simples ('), comillas ("), menor que (<) y mayor que (>). También debe asegurarse de que todas las URL siguen el estándar RFC-3986 para URI, el estándar RFC-3987 para IRI y el estándar XML. Si utiliza una secuencia de comandos para crear sus URL, puede utilizar caracteres de escape en las URL como parte de esa secuencia de comandos. De todos modos tendrá que utilizar caracteres de escape de entidad. Por ejemplo, la siguiente entidad de secuencia de comandos Python emplea caracteres de escape para
_http://www.ejemplo.es/view?widget=3&count >2.

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("_http://www.example.com/view?widget=3&count>2")

La URL que se obtiene del ejemplo anterior es:

http://www.example.com/view?widget=3&count >2

P: ¿Tiene importancia el método de codificación que utilizo para crear mis archivos Sitemap?

Sí. Sus archivos Sitemap deben usar codificación UTF-8.

P: ¿Cómo se especifica la hora?

Emplee la codificación W3C de fecha y hora para las marcas horarias “lastmod” y todas las demás fechas y horas de este protocolo. Por ejemplo, 2004-09-22T14:12:14+00:00.

Esta codificación le permite omitir el fragmento de tiempo del formato ISO8601; por ejemplo, 2004-09-22 también es válido. Sin embargo, si su sitio cambia con frecuencia, le recomendamos que incluya el fragmento de tiempo para que los rastreadores dispongan de información completa acerca de su sitio.

P: ¿Cómo puedo calcular la fecha lastmod (de la última modificación)?

Para archivos estáticos, esta es la fecha real de actualización del archivo. Puede usar el comando de fecha UNIX para obtener esta fecha:

$ date --iso-8601=seconds -u -r /home/foo/www/bar.php
>> 2004-10-26T08:56:39+00:00

Para muchas URL dinámicas, puede realizar fácilmente el cálculo de la fecha “lastmod” (de la última modificación) en función de cuándo se modificaron los datos subyacentes o mediante una aproximación basada en actualizaciones periódicas (si corresponde). Incluso si utiliza una fecha o marca horaria aproximada, puede ayudar a los rastreadores a que eviten las URL que no han cambiado. Esto reducirá las exigencias de ancho de banda y los requisitos de CPU de sus servidores web.

P: ¿Dónde puedo colocar mi Sitemap?

Le recomendamos encarecidamente que coloque su Sitemap en el directorio raíz de su servidor HTML, es decir, en _http://ejemplo.es/sitemap.xml.

En determinadas situaciones, es posible que desee generar distintos Sitemaps para las distintas rutas de su sitio, por ejemplo, en caso de que los permisos de seguridad de su organización clasifiquen el acceso de escritura a distintos directorios.

Suponemos que si dispone del permiso para subir _http://ejemplo.es/path/sitemap.xml, también tiene el permiso para comunicar metadatos en _http://ejemplo.es/path/.

Todas las URL enumeradas en el Sitemap deben residir en el mismo host que el Sitemap. Por ejemplo, si el Sitemap se encuentra en _http://www.ejemplo.es/sitemap.xml, no puede incluir URL de _http://subdominio.ejemplo.es. Si el Sitemap se encuentra en _http://www.ejemplo.es/micarpeta/sitemap.xml, no puede incluir URL de _http://www.ejemplo.es.

P: ¿Qué tamaño puede tener mi Sitemap?

Los Sitemaps no pueden superar los 10 MB (10.485.760 bytes) y pueden contener un máximo de 50.000 URL. Estos límites contribuyen a garantizar que su servidor web no se queda bloqueado al servir un gran número de archivos. Esto significa que si su sitio contiene más URL de las mencionadas o si su Sitemap supera la cantidad de megabytes indicada, debe crear varios archivos de Sitemap y utilizar un archivo del índice de Sitemap. Aunque su sitio sea pequeño, debe usar un archivo del índice de Sitemap si tiene previsto incluir más de 50.000 URL o si el tamaño del archivo supera los 10 MB. Un archivo del índice de Sitemap puede contener un máximo de 1.000 Sitemaps y no debe superar los 10 MB (10.485.760 bytes). También puede utilizar gzip para comprimir sus Sitemaps.

P: Mi sitio tiene millones de URL, ¿hay algún modo de enviar únicamente las que se han modificado recientemente?

Puede incluir las URL que se modifican con frecuencia en unos pocos Sitemaps y, a continuación, utilizar la etiqueta lastmod en su archivo de índice de Sitemap para identificar estos archivos. De este modo, los motores de búsqueda pueden llevar a cabo rastreos incrementales únicamente de los Sitemaps modificados.

P: ¿Qué debo hacer tras crear el Sitemap?

Una vez que haya creado el archivo de Sitemap, haga saber a los motores de búsqueda que existen enviándoselos directamente, realizando un ping de los mismos o agregándolos a la ubicación de Sitemap en el archivo robots.txt .

P: ¿Es necesario especificar las direcciones URL completas del Sitemap?

Sí. Para ello es necesario incluir el protocolo, por ejemplo http, en su URL. También tendrá que incluir una barra diagonal al final de la URL si su servidor web así lo requiere. Por ejemplo, _http://www.ejemplo.es/ es una URL válida para un Sitemap, mientras que www.ejemplo.es no lo es.

P: Mi sitio contiene versiones de URL tanto "http" como "https". ¿Debo especificar ambas?

No. Por favor, incluya únicamente una versión de cada URL en sus Sitemaps. Si incluye varias versiones de URL es posible que el rastreo de su sitio no se complete.

P: Las URL de mi sitio incluyen ID de sesión, ¿tengo que eliminarlos?

Sí. Si incluye ID de sesión en las URL es posible que el rastreo de su sitio sea incompleto y redundante.

P: ¿Influye la posición que tiene la URL de un Sitemap en cómo se utiliza?

No, la posición de una URL en el Sitemap no suele tener ningún efecto en la forma en que se utiliza ni en cómo la tienen en cuenta los motores de búsqueda.

P: Algunas de las páginas de mi sitio utilizan marcos. ¿Debo incluir las URL del conjunto de marcos o las URL de los contenidos de los marcos?

Por favor, incluya ambas URL.

P: ¿Puedo comprimir mis Sitemaps en formato zip o deben estar en formato gzip?

Por favor, use gzip para comprimir sus Sitemaps. No olvide que estos no deben superar los 10 MB (10.485.760 bytes), ya sean comprimidos o sin comprimir.

P: ¿La sugerencia "priority" del Sitemap en XML afectará a la clasificación de mis páginas en los resultados de búsqueda?

La sugerencia "priority" de su Sitemap sólo indica la importancia de una URL concreta respecto a las demás URL de su sitio y no afecta a la posición en la que aparecerán sus páginas en los resultados de búsqueda.

P: ¿Hay algún esquema XML según el cual pueda validar mi Sitemap en XML?

Sí. Dispone de un esquema XML para archivos de Sitemap en _http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd y de un esquema para archivos de índice de Sitemap en _http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. También puede obtener más información acerca de la validación de su Sitemap.

P: ¿Qué debo hacer si tengo otra pregunta acerca de la utilización del protocolo o el envío de un Sitemap?

Consulte la documentación disponible de cada motor de búsqueda para obtener más información sobre el envío y utilización de Sitemaps.


Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
GUARAGUAO
Mensajes: 2362
Reputación: 81
Mensaje Nº 2 | 5:19 PM
Ahora uCoz posee su propio medio para crear archivos Sitemap. Aquí te contaré cómo puedes y debes utilizar esta opción.


INSTRUCCIÓN ACERCA DE CÓMO UTILIZAR LA FUNCIÓN DE SITEMAP

Paso #1. Para empezar has de entrar en el Panel de Control y activar el módulo Búsqueda por el sitio. Cuando vas a activar el módulo, te proponen crear Sitemap – elige los módulos necesarios y los creas. Si tienes el módulo “Foro” activado, estará puesto en un archivo aparte.

Después de creado Sitemap en el gestor de archivos en la raíz del sitio podrás ver 2 archivos nuevos: sitemap.xml y si hay foro, sitemap-forum.xml.

Para actualizar Sitemap hay que hacer clic en Actualizar archivo Sitemap en el módulo Búsqueda por el sitio:

Actualizar Sitemap se puede no más de 1 vez en un día.

Paso #2. Ahora los archivos obtenidos tenemos que agregarlos en los motores de búsqueda. Por ejemplo, en Google.

Google. Entramos en Herramientas para webmasters, elegimos también un sitio o añadimos nuevo si no lo hay. Pasamos por el punto del menú Archivos Sitemap y de la misma manera agregamos nuestro Sitemap, para lo escribimos su nombre en la línea.


Dentro de un tiempo los archivos añadidos se examinarán y se indexarán, y después de la siguiente actualización los enlaces de Sitemap (generalmente, no todos de una vez) se expondrán en los motores de búsqueda.

Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
sorin
Mensajes: 442
Reputación: 6
Mensaje Nº 3 | 11:02 PM
Bien pensado este medio de crear sus propio sitemap, y facil de usar.
GUARAGUAO
Mensajes: 2362
Reputación: 81
Mensaje Nº 4 | 6:49 PM
Mostrar marcas de Google Maps definidas en un archivo XML

Cómo guardar las marcas de un mapa de Google en un archivo XML y acceder a ese XML para mostrar las marcas en el mapa.

En este artículo vamos a crear un archivo XML con los datos de diversas marcas que queremos colocar en un mapa de Google. Desde Javascript accederemos al archivo XML, leeremos sus contenidos y colocaremos las marcas definidas en el mapa.

Si queremos tener varias marcas a la vista en un mapa de Google puede ser interesante guardarlas todas en un archivo para facilitar su almacenamiento y su procesamiento por el Javascript de Google Maps. Para ello, el XML es un formato excelente, ya que nos ofrece un mecanismo sencillo y personalizable para definir las marcas y los datos asociados a ellas. Además, el API de Google Maps tiene varias clases para trabajar con XML, por lo que no tendremos que preocuparnos en las complejidades de procesar e interpretar el código XML donde hemos guardado las marcas.

Archivo XML de las marcas
Lo primero que podemos ver es el archivo XML que hemos utilizado para definir los atributos de las marcas.

Es un archivo que contiene código XML, donde las etiquetas que definen las marcas, así como los atributos de éstas, tienen nombres que cada uno puede elegir de la manera que más le convenga, así como añadir más o menos informaciones o datos para cada marca.

Podemos ver el resumen del código del archivo XML aquí:

Quote
<marcas>
<marca lat="41.38196080315538" lng="2.176666259765625" codigohtml="Marca situada sobre Barcelona. <br>Famosa en el mundo entero." />
<marca lat="42.58544425738491" lng="-5.5755615234375" codigohtml="Esta marca aparece sobre la ciudad de Leon" />
</marcas>

El nombre del archivo también es indiferente. En mi caso lo he nombrado como marcas-xml.xml y para realizar este ejemplo lo he colocado en el mismo directorio donde está el mapa de Google que lo lee.

Lectura del archivo XML para procesar cada una de las marcas
Con diversas funciones del API de Google Maps, podemos procesar e interpretar el XML de una manera bastante sencilla.

Primero tengo que hacer una llamada para descargar el archivo XML con los datos de las marcas:

Quote
//descargar el xml con las marcas y procesar su contenidos
GDownloadUrl("marcas-xml.xml", function(documento) {
//En esta función puedo examinar el XML y hacer cosas dependiendo su contenido.
});

Con GdownloadUrl traigo el contenido de un archivo. El nombre del archivo a descargar se lo pasamos como primer parámetro y como segundo parámetro tenemos que especificar una función con el código que queremos ejecutar cuando se termine de descargar el archivo. En esa función, a su vez, tenemos a nuestra disposición un parámetro que es el documento recién descargado. Todo lo que queramos hacer con el XML debe ser indicado forzosamente dentro de la función, porque está preparada para ejecutarse sólo cuando el XML ha sido recibido por completo.

Ahora, con el documento, que sabemos es un XML, puedo utilizar el método GXml.parse() para analizarlo y devolver un objeto que contiene la estructura de nodos del XML.

Quote
var xmlDoc = GXml.parse(documento);

A continuación, puedo extraer todas las etiquetas de las marcas con una llamada a un método del objeto xmlDoc.

Quote
var marcas = xmlDoc.documentElement.getElementsByTagName("marca");

Después de ese paso, la variable marcas contendrá un array con todas las etiquetas de las marcas. Luego podemos hacer un bucle para recorrer todas las marcas y colocarlas en el mapa.

Quote
for (var i = 0; i < marcas.length; i++) {
var lat = parseFloat(marcas[i].getAttribute("lat"));
var lng = parseFloat(marcas[i].getAttribute("lng"));
var punto = new GLatLng(lat,lng);
var html = marcas[i].getAttribute("codigohtml");
crearMarca(punto, html);
}

Dentro del bucle podemos acceder a marcas[i].getAttribute() para extraer los valores de los atributos de las marcas definidos en el código XML.
Un detalle es que en archivo XML todos los datos son tratados como String. Los valores de latitud y longitud para crear puntos con el constructor de la clase GLatLng() deben ser números en coma flotante, por eso es importante usar la función parseFloat(), para convertir cadenas en números con decimales.
La función crearMarca() será la encargada de generar la marca y mostrarla en el mapa que estamos construyendo.

Quote
function crearMarca(punto, html){
var miMarca = new GMarker(punto);
GEvent.addListener(miMarca, "click", function (){
miMarca.openInfoWindowHtml(html);
});
map.addOverlay(miMarca);
}

Con lo que hemos visto hasta ahora ya ser ha podido procesar las marcas y colocarlas en el mapa.

Código completo de crear marcas en mapas de Google desde archivos XML
Podemos ver el código completo de este ejemplo a continuación:

Quote
function load() {
if (GBrowserIsCompatible()) {
var map = new GMap2(document.getElementById("map"));
map.addControl(new GLargeMapControl());
map.addControl(new GMapTypeControl());
map.setCenter(new GLatLng(40.41689826118782,-3.7034815549850464), 5);

function crearMarca(punto, html){
var miMarca = new GMarker(punto);
GEvent.addListener(miMarca, "click", function (){
miMarca.openInfoWindowHtml(html);
});
map.addOverlay(miMarca);
}

//descargar el xml con las marcas y procesar su contenido
GDownloadUrl("marcas-xml.xml", function(documento) {
//En esta función puedo examinar el XML y hacer cosas dependiendo su contenido.
var xmlDoc = GXml.parse(documento);
//extraigo todas las marcas del XML. Obtengo un array
var marcas = xmlDoc.documentElement.getElementsByTagName("marca");
for (var i = 0; i < marcas.length; i++) {
var lat = parseFloat(marcas[i].getAttribute("lat"));
var lng = parseFloat(marcas[i].getAttribute("lng"));
var punto = new GLatLng(lat,lng);
var html = marcas[i].getAttribute("codigohtml");

crearMarca(punto, html);
}
});

}
}
window.onload=load

Ahora quizás queramos ver el ejemplo construido en una página aparte.

Algunas consideraciones sobre el XML
En este ejercicio tener cuidado al generar el XML, ya que su interpretación puede dar problemas en distintos navegadores si no se escribe el código correctamente.

  • Caracteres < y >: en el XML no podemos incluir en los valores de los atributos de las etiquetas los caracteres de cierre y apertura de etiquetas. Como hay un campo donde se guarda un código HTML a mostrar cuando se hace clic en la marca, los caracteres < y > los tenemos que poner con sus correspondencias < y >.
  • Acentos: Los acentos y otros caracteres como la ñ, dan problemas en a la hora de interpretar el código XML por Internet Explorer. Por su parte, Firefox los codifica y muestra incorrectamente, aunque al menos no lanza errores Javascript. Convertirlos a los caracteres especiales del HTML no soluciona el problema. De momento yo los he quitado para hacer las pruebas y más adelante veremos cómo lidiar con juegos de caracteres.
  • Caché del XML: A veces puede que actualices el XML y no se actualicen los datos de las etiquetas. Esto es porque el contenido del XML se cachea y puede ocurrir que aunque lo hayas cambiado se siga mostrando el contenido antiguo del archivo. Una solución en Internet Explorer es cerrar el navegador y volver a abrir.
    Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
  • GUARAGUAO
    Mensajes: 2362
    Reputación: 81
    Mensaje Nº 5 | 12:58 PM
    Protocolo Sitemap

    El protocolo Sitemap está formado por etiquetas XML. Todos los valores en un Sitemap deben de tener sustitución de entidades (NT. ‘entity-escaped‘ en inglés). El archivo en sí debe estar codificado bajo UTF-8.El Sitemap debe:

    • Comenzar con una apertura de la etiqueta <urlset> y acabar con una etiqueta de cierre </urlset>.
    • Especificar el atributo namespace [xmlns] (estándar del protocolo) dentro de la etiqueta <urlset>
    • Incluir una entrada de la etiqueta <url> para cada URL como etiqueta padre.
    • Incluir una etiqueta hijo <loc> para cada etiqueta padre <url>.

    El resto de etiquetas son opcionales. El soporte de estas etiquetas opcionales podría variar en cada motor de búsqueda. Dirígete a la documentación de cada motor de búsqueda para más detalles.

    Ejemplo de XML de Sitemap
    El siguiente ejemplo muestra un Sitemap que contiene sólo una URL y utiliza todas las etiquetas opcionales. Las etiquetas opcionales están en cursiva.

    Quote
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
    <loc>http://www.ejemplo.com/ </loc>
    <lastmod>2005-01-01 </lastmod>
    <changefreq>monthly </changefreq>
    <priority>0.8 </priority>

    </url>
    </urlset>

    Definición de las etiquetas XML
    Las etiquetas XML disponibles están descritas a continuación.
    (Atributo + Descripción)

    <url> (necesario) Etiqueta padre para cada entrada de URL. El resto de etiquetas son hijas de esta etiqueta..

    <loc> (necesario) URL del documento. Esta URL debe comenzar con el protocolo (por ejemplo http) y terminar con una barra, si tu servidor web lo precisa. Debe contener menos de 2.048 caracteres.

    <lastmod> (opcional) La fecha de la última modificación de este documento. Esta fecha debe estar en el formato Datetime de W3C. Este formato te permite omitir la parte de la hora si quieres y usar YYYY-MM-DD.Fíjate que esta etiqueta es distinta de la cabecera If-Modified-Since (304) que un servidor puede devolver, y los motores de búsqueda pueden usar ambas fuentes distintamente.

    <changefreq> (opcional) La frecuencia con la que se espera que el documento sea modificado. Este valor ofrece información general a los motores de búsqueda y puede que no se correlacione exactamente en la frecuencia en la que analicen el documento. Los valores válidos son (NT: traducción entre paréntesis):
    always (siempre)
    hourly (cada hora)
    daily (diariamente)
    weekly (semanalmente)
    monthly (mensualmente)
    yearly (anualmente)
    never (nunca)
    El valor “always” debe ser usado para describir documentos que cambien cada vez que son cargados. El valor “never” debe ser usado para describir URLs archivadas.
    Por favor, fíjate que el valor de esta etiqueta es considerado un consejo y no una orden directa. Incluso aunque las arañas de los motores de búsqueda consideren esta información para tomar decisiones, podrían analizar los documentos marcados como “hourly” menos frecuentemente que eso mismo, y pueden analizar documentos marcados como “yearly” con más frecuencia que esa. Las arañas pueden periódicamente analizar documentos marcados como “never” para que puedan analizar cambios no esperados para esos documentos.

    <priority> (opcional) La prioridad de esta URL relativa al resto de URLs en tu sitio. Los valores válidos van desde 0.0 hasta 1.0. Este valor no afecta a como tus documentos son comparados a documentos en otros sitios. Sólo hace saber a los motores de búsqueda qué documentos estimas que son más importante para las arañas.La prioridad por defecto de un documento es 0.5.Por favor, date cuenta que la prioridad que asignes a un documento no influye en la posición de tus URLs en las páginas de resultados de un motor de búsqueda. Los motores de búsqueda pueden usar esta información cuando estén seleccionando entre URLs del mismo sitio, así que puedes utilizar esta etiqueta para incrementar la probabilidad de que tus documentos más importantes aparezcan en el índice de búsqueda.También fíjate que asignar una alta prioridad a todas las URLs en tu sitio no te va a ayudar. Debido a que esta prioridad es relativa, sólo es utilizada para seleccionar URLs en tu sitio.

    Sustitución de entidades
    Tu archivo Sitemap debe estar codificado en UTF-8 (normalmente puedes hacerlo cuando guardas el archivo). Como con los archivos XML, cualquier dato (incluyendo URLs) debe usar sustitución de entidades para los caracteres listados en la siguiente tabla.

    (Carácter + Código de sustitución)
    Ampersand (& – &)
    Comilla simple (‘ – “)
    Comilla doble (“ – ‘)
    Mayor que (> – >)
    Menor que (< – <}

    Además, todas las URLs (incluyendo la URL de tu Sitemap) deben ir correctamente adecuadas como URL y codificadas para poder ser leídas por el srevidor donde están situadas. Sin embargo, si estás usando algún tipo de script, herramienta o registro para generar tus URLs (cualquier cosa que no sea escribirlas a mano), es normalmente bastante fácil. Por favor comprueba para estar seguro que tus URLs siguen el estándar RCF-3986 para URIs, el RFC-3987 para IRIs, y el estándar XML.

    A continuación, hay un ejemplo de una URL que utiliza un carácter no ASCII (NT: usa el umlaut, también llamado u con diéresis, cambiaré el ejemplo para usar la letra ‘ñ‘) además de un carácter que requiere ser sustituido (&):

    Quote
    http://www.ejemplo.com/españa.html&q=nombre

    Lo siguiente es la misma URL, codificada en ISO-8859-1 (para alojar en un servidor que use esa codificación) y con la URL adaptada:

    Quote
    http://www.ejemplo.com/espa%F1a.html&q=nombre

    Luego está la misma URL, codificada bajo UTF-8 (para alojar en un servidor que use esa codificación) y con la URL adaptada:

    Quote
    http://www.ejemplo.com/espa%C3%B1a.html&q=nombre

    Y a continuación la misma URL, pero además con sustitución de entidades:

    Quote
    http://www.ejemplo.com/espa%C3%B1a.html&q=nombre

    Ejemplo de Sitemap en XML
    El código siguiente muestra un Sitemap en formato XML. El Sitemap en el ejemplo contiene un pequeño número de URLs, cada cual usa diferentes parámetros opcionales (NT: he ‘castellanizado’ las URLs).

    Quote
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset
    xmlns="http://www.sobjetoaps.org/schemas/sobjetoap/0.9">
    <url>
    <loc>http://www.ejemplo.com/</loc>
    <lastmod>2005-01-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
    </url>
    <url>
    <loc>http://www.ejemplo.com/catalogo?objeto=12&desc=madrid</loc>
    <changefreq>weekly</changefreq>
    </url>
    <url>
    <loc>http://www.ejemplo.com/catalogo?objeto=73&desc=bcn</loc>
    <lastmod>2004-12-23</lastmod>
    <changefreq>weekly</changefreq>
    </url>
    <url>
    <loc>http://www.ejemplo.com/catalogo?objeto=74&desc=londres</loc>
    <lastmod>2004-12-23T18:00:15+00:00</lastmod>
    <priority>0.3</priority>
    </url>
    <url>
    <loc>http://www.ejemplo.com/catalogo?objeto=83&desc=usa</loc>
    <lastmod>2004-11-23</lastmod>
    </url>
    </urlset>

    Utilizando archivos índice de Sitemaps (para agrupar diferentes archivos Sitemap)
    Puedes ofrecer múltiples archivos Sitemap, pero cada archivo Sitemap que ofrezcas debe tener menos de 50.000 URLs y debe ser menor de 10MB (10.485.760 bytes). Si quieres, puedes comprimir tus archivos Sitemap usando gzip para permanecer por debajo de 10MB y rebajar tu consumo de ancho de banda. Si quieres listar más de 50.000 URLs, debes crear varios archivos Sitemap.

    Si ofreces varios archivos Sitemap, deberias listar cada archivo Sitemap en un archivo índice Sitemap. Los índices Sitemap no pueden listar más de 1.000 Sitemaps y no deben ocupar más de 10MB (10.485.760 bytes). El formato XML de un índice Sitemap es muy parecido al formato XML de un archivo Sitemap.

    El índice sitemap debe ofrecer:

    • Comenzar con una etiqueta de apertura <sitemapindex> y cerrar con una etiqueta </sitemapindex>.
    • Incluir una entrada <sitemap> para cada Sitemap como etiqueta padre.
    • Incluir una etiqueta hijo <loc> por cada etiqueta padre <sitemap>.

    La etiqueta opcional <lastmod> también está disponible para archivos de índice de Sitemaps.

    Nota: Un índice de Sitemaps sólo puede especificar Sitemaps que se encuentren en el mismo sitio que el propio índice. Por ejemplo,
    http://www.tusitio.com/sitemap_index.xml puede incluir Sitemaps de http://www.tusitio.com pero no de http://www.ejemplo.com o de http://tualojamiento.tusitio.com. Como los archivos Sitemap, un índice de Sitemaps debe estar codificado en UTF-8.

    Ejemplo de índice Sitemap en XML
    El siguiente ejemplo muestra un índice Sitemap que lista dos Sitemaps:

    Quote
    <?xml version="1.0" encoding="UTF-8"?>
    <sitemapindex
    xmlns="http://www.sitemaps.org/schemas/sitemapindex/0.9">
    <sitemap>
    <loc>http://www.ejemplo.com/sitemap1.xml.gz</loc>
    <lastmod>2004-10-01T18:23:17+00:00</lastmod>
    </sitemap>
    <sitemap>
    <loc>http://www.ejemplo.com/sitemap2.xml.gz</loc>
    <lastmod>2005-01-01</lastmod>
    </sitemap>
    </sitemapindex>

    Nota: Las direcciones URL de los Sitemap deben tener sustitución de entidades.

    Definición de etiquetas XML del índice de Sitemap
    (Atributo + Descripción)
    <sitemapindex> (necesario) Engloba la información sobre todos los Sitemaps incluídos en el archivo.
    <sitemap> (necesario) Engloba la información de cada Sitemap individual.
    <loc> (necesario) Identifica la localización del Sitemap.Esta localización puede ser un Sitemap, un archivo Atom, un archivo RSS o un archivo de texto simple.
    <lastmod> (opcional) Identifica la fecha en que el correspondiente Sitemap fue modificado. No se corresponde con la fecha en que alguna de las URL del Sitemap cambió. El valor de esta etiqueta debe estar en formato ‘Datetime‘ de W3C.Ofreciendo la fecha de la última modificación posibilitas a los motores de búsqueda a recuperar sólo una parte de los Sitemaps en el índice, es decir, una araña debería solo acceder a Sitemaps que fueron modificados a partir de una determinada fecha. Este mecanismo de solicitud incremental de Sitemaps permite el descubrimiento rápido de nuevas URLs en sitios muy grandes.

    Localización de los archivos Sitemap
    La localización de un archivo Sitemap determina el grupo de URLs que pueden ser incluídas en ese Sitemap. Un Sitemap localizado en http://ejemplo.com/catalogo/sitemap.xml puede incluir cualquier URL que comience por http://ejemplo.com/catalogo/ pero no puede incluir URLs que comiencen por http://ejemplo.com/imagenes/.

    Si tienes permisos para modificar http://ejemplo.com/ruta/sitemap.xml, se da por supuesto que también tienes permisos para ofrecer información de URLs con el prefijo http://ejemplo.com/ruta/. Ejemplos de URLs consideradas válidas en http://ejemplo.com/catalogo/sitemap.xml incluirían:
    http://ejemplo.com/catalogo/mostrar?objeto=23
    http://ejemplo.com/catalogo/show?objeto233&usuario=3453

    URLs que no se considerarían válidas en http://ejemplo.com/catalogo/sitemap.xml incluirían:
    http://ejemplo.com/imagenes/mostrar?objeto=23
    http://ejemplo.com/imagenes/show?objeto233&usuario=3453
    https://ejemplo.com/catalogo/pagina1.html
    Date cuenta que esto significa que todas las URLs listadas en el Sitemap deben incluir el mismo protocolo (http, en este ejemplo) y estar alojadas en el mismo lugar que el Sitemap. Como ejemplo, si el Sitemap se encuentra en http://www.ejemplo.com/sitemap.xml, no puede incluir URLs de http://subdominio.ejemplo.com.

    Las URLs que no se consideren válidas serán desechadas sin más. Recomendamos fuertemente que sitúes tu Sitemap en el directorio raíz de tu servidor web. Por ejemplo, si tu servidor web está en ejemplo.com, entonces tu índice Sitemap estaría en http://ejemplo.com/sitemap.xml. En ciertos casos, puedes necesitar producir diferentes Sitemaps para diferentes rutas (por ejemplo si los permisos de seguridad en tu organización separan el acceso de escritura a diferentes carpetas).

    Si envías un Sitemap utilizando una ruta con un número de puerto, debes incluir ese número de puerto como parte de cada URL listada en el Sitemap. Por ejemplo, si tu Sitemap se encuentra en http://www.ejemplo.com:100/sitemap.xml, entonces cada URL listada en el Sitemap debe comenzar con http://www.ejemplo.com:100.

    Validando tu Sitemap
    Los siguientes esquemas XML definen los elementos y atributos que pueden aparecer en tu archivo Sitemap. Puedes descargar este esquema de los siguientes enlaces:

    Existen varias herramientas disponibles para ayudarte a validar la estructura de tu Sitemap basado en este esquema. Puedes encontrar un listado de herramientas relacionadas con XML en las siguientes direcciones:

    Quote
    http://www.w3.org/XML/Schema#Tools
    http://www.xml.com/pub/a/2000/12/13/schematools.html

    Para validar tu Sitemap o índice de Sitemap contra un esquema, el archivo XML necesita cabeceras adicionales como se muestra a continuación.
    Sitemap:

    Quote
    <?xml version='1.0' encoding='UTF-8'?>
    <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9
    http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd "
    xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
    ...
    </url>
    </urlset>
    Índice de Sitemap:
    <?xml version='1.0' encoding='UTF-8'?>
    <sitemapindex
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9
    http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd "
    xmlns="http://www.sitemaps.org/schemas/siteindex/0.9">
    <sitemap>
    ...
    </sitemap>
    </sitemapindex>

    Extendiendo el protocolo Sitemap
    Puedes extender el protocolo Sitemap utilizando tu propio ‘namespace’. Simplemente especifícalo en la etiqueta raíz. Por ejemplo:

    Quote
    <?xml version='1.0' encoding='UTF-8'?>
    <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemaps/0.9
    http://www.sitemaps.org/schemas/sitemaps/sitemap.xsd "
    xmlns="http://www.sitemaps.org/schemas/sitemap"
    xmlns="http://www.example.com/schemas/example_schema">
    <!-- namespace extension -->
    <url>
    ...
    </url>
    </urlset>

    Notificando a las arañas de los motores de búsqueda
    Una vez que hayas creado el archivo Sitemap y situado el mismo en tu servidor, necesitas informar a los motores de búsqueda que soporten este protocolo de su localización enviándoselo por su interfaz de envíos o una solicitud HTTP.

    Así los motores de búsqueda pueden acceder a tu sitemap y hacer que sus arañas dispongan de las URLs.


    Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
    GUARAGUAO
    Mensajes: 2362
    Reputación: 81
    Mensaje Nº 6 | 12:37 PM
    Diseño Web y Posicionamiento en Buscadores: utilizando Sitemaps

    El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. Frecuentemente, la posición del sitio en la lista de resultados determina el exito o el fracaso de nuestro trabajo, aún con diseños creativos y profesionales. La condición básica y fundamental del posicionamiento es la certeza de que todas las páginas del sitio se encuentran indexadas correctamente, y esto no es siempre fácil de lograr. Aquí es donde los Sitemaps pueden sernos de gran ayuda.

    ¿Qué es y para qué sirve un sitemap?
    En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.

    Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.

    Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse.

    Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.

    Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio. La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación:

    Contenidos obligatorios del sitemap
    El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8. Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML. Por ejemplo, las comillas dobles (") deben ser reemplazadas por " y los signos menor (<) y mayor (>) por < y > respectivamente.

    El archivo XML debe:
    • Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>.
    • Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura <urlset> (ver en el ejemplo).
    • Incluir una entrada <url> por cada dirección URL (que corresponderá a cada una de las páginas del sitio) como nodo XML padre.
    • Incluir un nodo XML hijo <loc> para cada dirección URL (cada nodo XML padre <url>).
    Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):

    Quote
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
    <loc>http://www.misitio.com/</loc>
    </url>
    <url>
    <loc>http://www.misitio.com/contacto.htm</loc>
    </url>
    </urlset>

    Contenidos opcionales del sitemap
    Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente.

    Los nodos opcionales, aunque importantes, son:

  • <lastmod>Fecha</lastmod>
    Se refiere a la fecha de la última modificación de la página que figura en <loc>. Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2009 será 2009-07-08.

  • <changefrec>Frec</changefrec>
    Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente. Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).

  • <priority>Valor</priority>
    Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio. Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo. Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5
    Volviendo al ejemplo anterior y agregando los atributos opcionales:

    Quote
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
    <loc>http://www.misitio.com/</loc>
    <lastmod>2006-11-20</lastmod>
    <changefrec>monthly</changefrec>
    <priority>0.8</priority>
    </url>
    <url>
    <loc>http://www.misitio.com/contacto.htm</loc>
    <lastmod>2006-08-01</lastmod>
    <changefrec>yearly</changefrec>
    <priority>0.3</priority>
    </url>
    </urlset>

    El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.

    Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/

    Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.

    A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.


    Las vírgenes tienen muchas navidades pero ninguna Nochebuena.
    • Página 1 de 1
    • 1
    Búscar: