Utilización de feeds de RSS/Atom para descubrir URL nuevas
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
jueves, 12 de noviembre de 2009
Google usa muchas fuentes diferentes para encontrar páginas web nuevas, como enlaces que encontramos en la web o
URL que nos envían
. Queremos descubrir esas nuevas páginas lo más rápidamente posible, para que nuestros usuarios puedan encontrar contenido nuevo en los resultados de búsqueda poco tiempo después de que éste se haya generado. Recientemente estrenamos una función que utiliza feeds de RSS/Atom para descubrir nuevas páginas web.
Los feeds de RSS/Atom han sido muy populares estos últimos años como mecanismo de publicación de contenido. Permiten a los lectores a comprobar si hay nuevo contenido publicado. La utilización de feeds para descubrimiento de contenido nuevo nos permite obtener estas nuevas páginas e indexarlas de una forma más rápida que con los métodos de rastreo tradicionales. Podemos usar muchas fuentes para acceder a las actualizaciones de feeds como Reader, servicios de notificación o rastreos de feeds. Además, en el futuro también podríamos explorar mecanismos como
PubSubHubbub
con el fin de identificar elementos actualizados.
Para poder utilizar los feeds de RSS/Atom para descubrir nuevo contenido, es importante que se rastreen los archivos (no debe estar desactivada la función de rastreo en el archivo
robots.txt
). Para saber si Googlebot puede rastrear tus feeds y encontrar tus páginas de la manera más rápida posible, prueba las URL de tu feed con la
herramienta de prueba de robots.txt en las Herramientas para webmasters de Google
.
Publicado por Raymond Lo, Guhan Viswanathan, and Dave Weissman, Crawl and Indexing Team (traducido por Cristina, equipo de Calidad de búsqueda).
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Me falta la información que necesito","missingTheInformationINeed","thumb-down"],["Es demasiado complicado o hay demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Está obsoleto","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema de muestras o código","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2009-11-01 (UTC)."],[[["Google is now utilizing RSS and Atom feeds to discover and index new webpages more quickly."],["This approach enables Google to add new content to search results faster than traditional crawling methods."],["Website owners should ensure their robots.txt file allows Googlebot to crawl their RSS/Atom feeds for optimal indexing."],["Google may use various sources to access feed updates, including Reader, notification services, or direct crawls."]]],["Google uses various sources, including submitted URLs, to find new webpages. A new feature utilizes RSS and Atom feeds to expedite the discovery and indexing of fresh content. Feeds are accessed through methods like direct crawls or notification services. Ensuring that feed crawling isn't blocked by `robots.txt` is crucial for fast indexing. Webmasters can test feed URLs via the `robots.txt` tester tool to confirm accessibility. PubSubHubbub is a future technology they may also explore to identify updated items.\n"]]