حاشیه نویسی: تعریف سایت ها برای جستجو

این صفحه نحوه تعریف پوشش موتور جستجوی خود را با استفاده از یک فایل حاشیه نویسی XML توضیح می دهد.

  1. بررسی اجمالی
  2. با استفاده از فرمت XML جستجوی قابل برنامه ریزی
  3. بهبود پوشش جستجو
  4. محدودیت های حاشیه نویسی

بررسی اجمالی

اگر در حال ساخت یک موتور جستجوی بزرگ هستید، مدیریت مجموعه بزرگی از سایت ها می تواند خسته کننده باشد. در عوض، می‌توانید سایت‌های زیادی را با فهرست کردن آنها در یک فایل حاشیه‌نویسی و آپلود آن اضافه و مدیریت کنید. علاوه بر این، فایل های حاشیه نویسی به شما کنترل بسیار بیشتری بر رتبه بندی نتایج جستجو می دهد.

یک فایل حاشیه نویسی به سادگی فهرستی از حاشیه نویسی است. هر حاشیه نویسی دارای دو جزء است: سایت و برچسب های مرتبط با آن. این برچسب به موتور جستجوی قابل برنامه ریزی می گوید که چگونه یک سایت را مدیریت کند. یعنی اینکه آیا یک سایت باید گنجانده شود، حذف شود، ارتقا یابد یا تنزل رتبه یابد. در فایل زمینه ، برچسب ها را تعریف می کنید. در فایل حاشیه نویسی، سایت ها را با برچسب های مناسب تگ می کنید.

هنگامی که ویرایش فایل حاشیه نویسی خود را شروع می کنید، با تعداد کمی از حاشیه نویسی شروع کنید. آزمایش و عیب یابی موتور جستجوی خود با تعداد انگشت شماری از حاشیه نویسی آسان تر است. وقتی به نتایجی رسیدید که انتظار دارید، به تدریج حاشیه نویسی های بیشتری اضافه کنید.

می توانید فایل حاشیه نویسی را در کنترل پنل آپلود کنید . برای جزئیات بیشتر در مورد محدودیت های فایل، به بخش حاشیه نویسی ها مراجعه کنید.

بازگشت به بالا

با استفاده از فرمت XML جستجوی قابل برنامه ریزی

اگر می‌خواهید از تمام ویژگی‌های موجود در فایل پیکربندی موتور جستجوی قابل برنامه‌ریزی استفاده کنید، XML راهی برای رفتن است.

حاشیه نویسی XML

در زیر نمونه ای از حاشیه نویسی های XML آورده شده است. این فایل حاشیه‌نویسی به موتور جستجوی برنامه‌پذیر می‌گوید همه چیز را در www.webmd.com/hw/* درج کند، اما همه چیز را در زیر www.webmd.com/hw/cancer/* حذف کند.

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

فایل حاشیه نویسی دارای چهار عنصر در سلسله مراتب زیر است:

  • Annotations (عنصر ریشه)
    • Annotation
      • Label
      • Comment (اختیاری)

بازگشت به بالا

ایجاد حاشیه نویسی خارجی

برای فهرست کردن سایت هایی که می خواهید موتور جستجوی شما پوشش دهد، موارد زیر را انجام دهید:

  1. فایل را با عنصر ریشه <Annotations></Annotations> شروع کنید.
  2. با افزودن تگ های <Annotation></Annotation> یک حاشیه نویسی ایجاد کنید و سپس ویژگی about را با الگوی URL سایت تعریف کنید.
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. با استفاده از تگ <Label name=" "/> ، سایت را با موتور جستجو مرتبط کنید و نحوه برخورد موتور جستجو با آن سایت را مشخص کنید. می توانید برچسب های موتور جستجوی خود را از فایل Context موتور جستجو دریافت کنید. دو برچسب پیدا خواهید کرد: یکی برای افزودن سایت ها به موتور جستجوی قابل برنامه ریزی و دیگری برای حذف سایت ها از آن. اگر نام برچسب موتور جستجو را در فایل زمینه تغییر نداده‌اید، برچسب درج سایت‌ها به شکل _include_ و برچسب حذف سایت‌ها به شکل _exclude_ است. برای جلوگیری از خطا، این برچسب ها را به جای تایپ دستی کپی و جایگذاری کنید.
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    یک سایت می تواند چندین برچسب مرتبط با آن داشته باشد،

    اگر نام برچسب را در فایل زمینه تغییر داده اید، به یاد داشته باشید که مقادیر Label name را در فایل حاشیه نویسی خود به روز کنید.

  4. برای افزودن سایت های بیشتر، عنصر Annotation دیگری ایجاد و تعریف کنید.
  5. فایل XML را ذخیره کنید.

بازگشت به بالا

بهبود پوشش جستجو

موتور جستجوی قابل برنامه ریزی در بالای فهرست گوگل ساخته شده است. این بدان معناست که صفحات وب که در فهرست گوگل هستند در دسترس موتور جستجوی شما هستند. برعکس، صفحات وبی که توسط گوگل خزیده نشده اند در نتایج جستجوی شما نمایش داده نمی شوند. اگر می‌خواهید موتور جستجوی قابل برنامه‌ریزی شما شامل سایت‌هایی باشد که در حال حاضر در فهرست Google نیستند، نقشه سایت را به کنسول جستجوی Google ارسال کنید.

نقشه سایت شامل لیستی از صفحات در سایت شما و همچنین اطلاعاتی در مورد تعداد دفعات به روز رسانی صفحات وب و اهمیت آنها نسبت به یکدیگر است. ارسال نقشه سایت به Google کمک می کند تا صفحات وب شما را کشف کند و برنامه خزیدن را بهبود بخشد. برای کسب اطلاعات بیشتر در مورد نقشه سایت، به مرکز راهنمای وب مستر و استفاده از پروتکل نقشه سایت مراجعه کنید. اگر به ساختن نقشه‌های سایت شیک‌تر علاقه دارید، به http://www.sitemaps.org/protocol.php مراجعه کنید.

ارسال نقشه سایت به ویژه در صورتی مفید است که سایت شما دارای موارد زیر باشد:

  • محتوای پویا
  • صفحات وب که به راحتی توسط Googlebot (خزنده وب گوگل) کشف نمی شوند، مانند صفحاتی با ویژگی های غنی AJAX یا Flash
  • تعداد کمی از وب سایت ها به آن لینک می دهند.

    Googlebot با دنبال کردن پیوندها از یک صفحه به صفحه دیگر، وب را می خزد، بنابراین اگر سایت شما به خوبی پیوند داده نشده باشد، کشف آن برای خزنده دشوار است. اگر وب سایت شما جدید است، احتمالاً وب سایت های زیادی به سایت شما اشاره نمی کنند.

  • آرشیو بزرگی از صفحات محتوا که شبکه قوی پیوند متقابل ندارد

گوگل فقط می تواند صفحاتی را که می تواند به آن دسترسی داشته باشد فهرست بندی کند. بنابراین، اگر از فایل robots.txt یا متا تگ های روبات در صفحات وب خود استفاده می کنید، مطمئن شوید که این صفحات خزنده ها را مسدود نمی کنند.

پوشش بهبود یافته آنی نیست، زیرا مدتی طول می کشد تا صفحات خزیده شوند و فهرست شوند. اما هنگامی که صفحات وب شما در فهرست قرار می گیرند، می توانند هم در جستجوی گوگل و هم در موتور جستجوی قابل برنامه ریزی شما ظاهر شوند.

بازگشت به بالا

محدودیت های حاشیه نویسی

جدول زیر محدودیت‌هایی را برای فایل‌های حاشیه‌نویسی که در موتور جستجوی قابل برنامه‌ریزی آپلود می‌شوند فهرست می‌کند:

توجه: محدودیت ها را به دقت دنبال کنید. اگر از آنها فراتر بروید، ممکن است موتور جستجوی شما نتایجی را نشان ندهد.

جنبه حد
اندازه فایل (فایل های متن یا حاشیه نویسی) 30 کیلوبایت
حداکثر تعداد حاشیه نویسی در هر موتور جستجو 5000

نکته: اگر متوجه شدید که موتور جستجوی شما از محدودیت بزرگ 5000 سایت بیشتر است، URL های فردی را در الگوهای URL ادغام کنید.

بازگشت به بالا