Sugerencias para webmasters y proveedores de alojamiento

martes, 20 de marzo de 2012


Algunos webmasters de nuestros foros han publicado consultas sobre incidencias relacionadas con el alojamiento que afectan a sus sitios. Para ayudar a los proveedores de alojamiento y a los webmasters a reconocer, diagnosticar y solucionar tales incidencias, nos gustaría compartir con los usuarios algunas de las incidencias habituales que hemos encontrado y sugerencias para solucionarlas.

Bloqueo del rastreo de Googlebot : esta es una incidencia muy habitual que normalmente suele deberse a la configuración incorrecta de un cortafuegos o del sistema de protección DoS y, en algunas ocasiones, al sistema de administración de contenido que utiliza el sitio. Los sistemas de protección juegan un papel importante en el alojamiento y se suelen configurar para bloquear (en algunos casos, automáticamente) niveles inusualmente elevados de solicitudes del servidor. No obstante, como Google a menudo lleva a cabo más solicitudes que un usuario humano, estos sistemas de protección pueden impedir que Googlebot rastree tu sitio web. Para comprobar si se produce este tipo de incidencia, utiliza la función Explorar como Googlebot de las Herramientas para webmasters de Google. Comprueba también si existen otros de los errores de rastreo que se incluyen en las Herramientas para webmasters de Google.

Ofrecemos diversas herramientas para los webmasters y los proveedores de alojamiento que quieran tener un mayor control sobre el rastreo de Googlebot y para mejorar la eficacia del rastreo:
Problemas de disponibilidad : un tipo de incidencia que se produce en sitios web que no están disponibles cuando Googlebot (y los usuarios) intentan acceder a los mismos. Esto incluye incidencias de DNS; sobrecarga de los servidores, que provocan errores de tiempo de espera y la denegación de conexiones; y la configuración incorrecta de redes de distribución de contenido, entre otros tipos de errores. Cuando Googlebot detecta este tipo de incidencias, informamos de las mismas en las Herramientas para webmasters de Google como errores de URL inaccesible o errores de rastreo .

Certificados SSL no válidos : para que los certificados SSL de tu sitio web se consideren válidos, deben coincidir con el nombre del sitio. Entre las incidencias habituales se incluyen certificados SSL caducados y servidores configurados incorrectamente de forma que todos los sitios web del servidor utilizan el mismo certificado. La mayoría de navegadores web intentará advertir a los usuarios en estas situaciones, mientras que Google intenta avisar a los webmasters de la incidencia mediante el envío de un mensaje a través de las Herramientas para webmasters de Google. La solución para estas incidencias consiste en comprobar que se utilizan certificados SSL válidos para todos los dominios y los subdominios del sitio web con los que los usuarios interactuarán.

DNS comodín : los sitios web se pueden configurar para responder a todas las solicitudes de subdominio. Por ejemplo, el sitio web de la URL example.com se puede configurar para responder a las solicitudes de tal.example.com, talcual.example.com y otros subdominios.

Existen ciertos casos en los que se recomienda esta configuración. Por ejemplo, un sitio web de contenido generado por usuarios puede optar por proporcionar a cada cuenta su propio subdominio. Sin embargo, en algunos casos el webmaster puede que no quiera utilizar esta configuración, ya que puede provocar que el contenido se duplique innecesariamente en todos los nombres de host y también puede afectar al rastreo de Googlebot.

Para reducir el número de incidencias relacionadas con la configuración de un DNS comodín, configura tu sitio web para que no lo utilice o configura el servidor para que no responda exitosamente a nombres de host no existentes denegando la conexión o devolviendo un encabezado HTTP 404.

Configuración incorrecta del alojamiento virtual : esta incidencia consiste en que muchos hosts o nombres de dominio alojados en el mismo servidor devuelven siempre el contenido de un único sitio, es decir, a pesar de que el servidor aloja varios sitios, solo devuelve uno independientemente del contenido que se solicite. Para detectar esta incidencia, debes comprobar que el servidor responde correctamente al encabezado HTTP del host.

Contenido duplicado en todas las URL específicas de alojamiento : muchos hosts ofrecen URL para tu sitio web para realizar pruebas o actividades de desarrollo. Por ejemplo, si alojas el sitio web https://a.com/ en el proveedor de alojamiento example.com, el host puede ofrecerte acceso a tu sitio a través de una URL como las siguientes: https://a.example.com/ o https://example.com/~a/. Te recomendamos que configures las URL específicas de alojamiento para que no se pueda acceder a ellas públicamente (protección mediante contraseña). En caso de que estas URL sean accesibles, nuestros algoritmos elegirán normalmente la URL que los webmasters quieran. Si nuestros algoritmos seleccionan en vez las URL específicas de alojamiento , puedes hacer que estos elijan tus URL preferidas implementando correctamente técnicas de canonicalización .

Páginas de error leve : algunos proveedores de alojamiento muestran páginas de error que utilizan un código de estado HTTP 200 (que significa "correcto") en lugar de un código de estado de error HTTP. Por ejemplo, un mensaje de error de página no encontrada podría devolver un código HTTP 200 en lugar de un código HTTP 404, convirtiéndola en una página de error 404 leve , o un mensaje de sitio web temporalmente no disponible podría devolver un código de error 200 en lugar del código de estado HTTP 503 adecuado. Aunque intentamos detectar las páginas de error leve, si nuestros algoritmos no detectasen las páginas de error leve de un host web, estas podrían indexarse con el contenido de error. Esto puede provocar incidencias relacionadas con la clasificación o con la selección de URL entre dominios .

Puedes comprobar el código de estado que se devuelve de forma sencilla: comprueba los encabezados HTTP que devuelve el servidor utilizando una de las herramientas disponibles como, por ejemplo, la función Explorar como Googlebot . Si una página de error devuelve un código HTTP 200, cambia la configuración para devolver el código de estado de error HTTP correcto. Asimismo, permanece atento a los informes de errores 404 leves de las Herramientas para webmasters de Google que se incluyen en la página de errores de rastreo de la sección de diagnósticos.

Marcos y modificación de contenido : los proveedores de alojamiento pueden modificar inesperadamente el contenido de la página de los webmasters normalmente mediante la inclusión de secuencias de comando o de imágenes en la página. Los hosts web también pueden ofrecer tu contenido en otras páginas a través de marcos o iframes. Para comprobar si un host web está modificando tu contenido de forma inesperada, consulta el código fuente de la página que ofrece el host y compáralo con el código que subiste.

Ten en cuenta que ciertas modificaciones del código del servidor pueden ser de gran utilidad. Por ejemplo, un servidor que utilice el módulo para Apache mod_pagespeed u otras herramientas puede reducir tu código para optimizar la velocidad de las páginas.

Spam y software malintencionado : hemos comprobado que algunos hosts web y servicios de subdominios masivos son importantes fuentes de spam y software malintencionado. En Google, intentamos ser precisos al proteger a nuestros usuarios y la calidad de búsqueda. Sin embargo, si comprobamos que un importante grupo de sitios de un host web específico incluye spam o distribuye software malintencionado, nos veremos obligados a tomar medidas sobre el host web en su totalidad. Consulta los siguientes artículos para obtener más información sobre el control del software malintencionado:
Esperamos que estos artículos ayuden a proveedores de alojamiento y a webmasters a detectar y solucionar estas incidencias. Además de estos artículos, también debes tener en cuenta los aspectos cualitativos del alojamiento, como la calidad del servicio y la utilidad de la asistencia. Como siempre, si tienes preguntas o necesitas ayuda adicional, publica tu consulta en el foro de ayuda para webmasters .

Por Pierre Far , analista de tendencias de webmasters