¿Cómo funciona GoogleBot sabe cuando se cambia una página?

Admin Noviembre 2, 2015 / 23:44:19 Internet 253 0

Google araña, también conocido como el Googlebot rastrea la Web en su propio horario, determinar qué páginas son modificados y requieren re-indexación por comparación con el índice existente. Aunque este proceso se produce muy rápidamente, es útil saber que la cues Googlebot lo utiliza para encontrar las páginas y temas actualizados que puede venir a través.

Googlebot Frecuencia

Google araña rastrea la Web muy rápidamente; muchos sitios se visitan todos los días. Esto no significa que la araña se arrastra todas las páginas hasta la fecha, sin embargo. El algoritmo de Google utiliza para determinar la velocidad de barrido incluye variables tales como Page Rank, el número de enlaces que apuntan a la página, la información del mapa del sitio y también la longitud de la URL. Una página específica se puede actualizar en el índice de Google en unas pocas horas, mientras que otro no se pueden actualizar durante varios días, en función de estas variables.

sitemaps

Una señal del robot de Google utiliza para determinar la frescura de su sitio es el archivo de mapa del sitio, un documento XML que contiene tanto las páginas importantes de su sitio y la frecuencia con la que es muy probable que la actualización. Usted puede crear un mapa del sitio utilizando un conjunto de herramientas en línea, incluidos los servicios web y WordPress plug-in gratuito, subirlo al nivel de la raíz de su sitio y enviarlo a Google a través de Google Webmaster Tools o en la siguiente URL:


http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.YourSite.com/sitemap.xml

If-Modified-Since

Otra pista se encuentra en la cabecera HTTP de la página web del servidor. Llamado el "If-Modified-Since" cuando el robot de Google llega a su página, pedir el servidor si la página se ha actualizado desde su última visita. Si es así, o cuando la página es totalmente nuevo, el servidor devuelve un "200 OK". Si la página no se ha cambiado, esta cabecera devuelve la respuesta "304 Not Modified", el ahorro de tiempo y ahorro de ancho de banda de Googlebot. Los problemas de configuración con el servidor web puede causar problemas con esta cabecera y evitar la araña para rastrear su página. Puede comprobar si If-Modified-Since encabezado con una herramienta en línea en Feedthebot.com.

Herramientas para webmasters

Google desarrolló las Herramientas para webmasters de sitio web para ayudar a los propietarios de sitios para supervisar las visitas de Googlebot, así como para ver los errores de indexación y otros problemas que pueden impedir a Google de las páginas de indexación actualizados. Herramientas para webmasters de Google también incluye herramientas para la presentación de sus mapas de sitio, que tiene páginas individuales para la indexación y la eliminación de las direcciones URL que usted no desea que aparezcan en el índice de Google. También hay una herramienta que le permitirá consultar su archivo robots.txt, que advierte las arañas lejos de páginas que desea indexar.

AJAX contenido

Aunque AJAX actualizar dinámicamente una página web sobre la marcha, el Googlebot ve sólo el código HTML de la página y se ejecuta el código JavaScript. Si desea que Google actualizaciones de índice hechas utilizando la funcionalidad de AJAX de la página, debe incluir alternativa HTML para la araña. Google proporciona un método por el cual puede ofrecer una versión alternativa del contenido AJAX para el Googlebot.

  Like 0   Dislike 0
Comentarios (0)
Sin comentarios

Añadir un comentario

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caracteres a la izquierda: 3000
captcha