หมายเหตุ: การกำหนดเว็บไซต์ที่จะค้นหา

หน้านี้จะอธิบายวิธีกำหนดความครอบคลุมของเครื่องมือค้นหาของคุณโดยใช้ไฟล์ข้อมูลเสริมแบบ XML

  1. Overview
  2. การใช้รูปแบบ XML Programmable Search
  3. การปรับปรุงการครอบคลุมของการค้นหา
  4. ข้อจำกัดของคำอธิบายประกอบ

ภาพรวม

การจัดการเว็บไซต์จำนวนมากอาจเป็นเรื่องน่าเบื่อหากคุณสร้างเครื่องมือค้นหาขนาดใหญ่ แต่คุณสามารถเพิ่มและจัดการเว็บไซต์จำนวนมากได้โดยใส่เว็บไซต์เหล่านั้นลงในไฟล์คำอธิบายประกอบและอัปโหลด นอกจากนี้ ไฟล์คำอธิบายประกอบยังช่วยให้คุณสามารถควบคุมการจัดอันดับผลการค้นหาได้ดีขึ้น

ไฟล์คำอธิบายประกอบเป็นเพียงรายการคำอธิบายประกอบ คำอธิบายประกอบแต่ละรายการมีองค์ประกอบ 2 ส่วน ได้แก่ เว็บไซต์และป้ายกำกับที่เกี่ยวข้อง ป้ายกำกับจะบอก Programmable Search Engine เกี่ยวกับวิธีจัดการเว็บไซต์ กล่าวคือ ควรรวมเว็บไซต์ ยกเว้น โปรโมต หรือลดระดับ ในไฟล์บริบท คุณจะต้องกำหนดป้ายกำกับ ขณะที่ในไฟล์คำอธิบายประกอบ คุณจะต้องติดแท็กเว็บไซต์ด้วยป้ายกำกับที่เหมาะสม

เมื่อคุณเริ่มแก้ไขไฟล์คำอธิบายประกอบ ให้เริ่มต้นด้วยคำอธิบายประกอบจำนวนน้อย คุณจะทดสอบและแก้ปัญหาเครื่องมือค้นหาได้ง่ายขึ้นด้วยคำอธิบายประกอบที่มีอยู่มากมาย เมื่อคุณได้รับผลลัพธ์ที่คาดหวัง ให้เพิ่มคำอธิบายประกอบมากขึ้นทีละน้อย

คุณสามารถอัปโหลดไฟล์คำอธิบายประกอบไปยังแผงควบคุมได้ โปรดดูรายละเอียดเกี่ยวกับขีดจำกัดของไฟล์ในส่วนขีดจำกัดของคำอธิบายประกอบ

กลับไปด้านบน

การใช้รูปแบบ XML ของ Programmable Search

หากคุณต้องการใช้ประโยชน์จากฟีเจอร์ทั้งหมดที่มีในไฟล์การกำหนดค่า Programmable Search Engine เราขอแนะนำให้ใช้ XML

คำอธิบายประกอบ XML

ต่อไปนี้เป็นตัวอย่างของคำอธิบายประกอบ XML ไฟล์หมายเหตุนี้จะบอกให้ Programmable Search Engine รวมทุกอย่างไว้ภายใต้ www.webmd.com/hw/* แต่ยกเว้นทุกอย่างที่อยู่ภายใต้ www.webmd.com/hw/cancer/*

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

ไฟล์คำอธิบายประกอบมีองค์ประกอบ 4 ส่วนในลำดับชั้นต่อไปนี้

  • Annotations (องค์ประกอบรูท)
    • Annotation
      • Label
      • Comment (ไม่บังคับ)

กลับไปด้านบน

การสร้างคำอธิบายประกอบภายนอก

หากต้องการระบุเว็บไซต์ที่คุณต้องการให้เครื่องมือค้นหาครอบคลุม ให้ปฏิบัติดังต่อไปนี้:

  1. เริ่มต้นไฟล์ด้วยองค์ประกอบรูท <Annotations></Annotations>
  2. สร้างคำอธิบายประกอบโดยการเพิ่มแท็ก <Annotation></Annotation> แล้วกำหนดแอตทริบิวต์ about ด้วยรูปแบบ URL ของเว็บไซต์
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. เชื่อมโยงเว็บไซต์กับเครื่องมือค้นหาโดยใช้แท็ก <Label name=" "/> และระบุวิธีที่เครื่องมือค้นหาควรปฏิบัติต่อเว็บไซต์ดังกล่าว คุณสามารถรับป้ายกำกับสำหรับเครื่องมือค้นหาของคุณได้จากไฟล์ Context ของเครื่องมือค้นหา คุณจะเห็นป้ายกำกับ 2 ป้าย ได้แก่ ป้ายกำกับสำหรับเพิ่มเว็บไซต์ลงใน Programmable Search Engine และป้ายกำกับสำหรับยกเว้นเว็บไซต์จาก Programmable Search Engine หากคุณไม่ได้เปลี่ยนชื่อป้ายกำกับของเครื่องมือค้นหาในไฟล์บริบท ป้ายกำกับสำหรับการรวมเว็บไซต์จะอยู่ในรูปแบบ _include_ และป้ายกำกับสำหรับการยกเว้นเว็บไซต์จะอยู่ในรูปแบบ _exclude_ เพื่อป้องกันไม่ให้เกิดข้อผิดพลาด ให้คัดลอกและวางป้ายกำกับเหล่านี้แทนการพิมพ์ด้วยมือ
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    โดยเว็บไซต์หนึ่งอาจมีป้ายกำกับหลายป้ายเชื่อมโยงอยู่ได้

    หากเปลี่ยนชื่อป้ายกำกับในไฟล์บริบท อย่าลืมอัปเดตค่า Label name ในไฟล์คำอธิบายประกอบของคุณ

  4. หากต้องการเพิ่มเว็บไซต์ ให้สร้างและกำหนดองค์ประกอบ Annotation อื่น
  5. บันทึกไฟล์ XML

กลับไปด้านบน

การปรับปรุงการครอบคลุมของการค้นหา

Programmable Search Engine สร้างขึ้นจากดัชนีของ Google ซึ่งหมายความว่าหน้าเว็บที่อยู่ในดัชนีของ Google จะสามารถเข้าถึงเครื่องมือค้นหาของคุณได้ ในทางกลับกัน หน้าเว็บที่ Google ไม่ได้รวบรวมข้อมูลไว้จะไม่แสดงในผลการค้นหาของคุณ หากคุณต้องการให้ Programmable Search Engine รวมเว็บไซต์ที่ไม่อยู่ในดัชนีของ Google อยู่ในปัจจุบัน ให้ส่ง Sitemap ไปยัง Google Search Console

Sitemap มีรายการหน้าในเว็บไซต์ของคุณ ตลอดจนข้อมูลเกี่ยวกับความถี่ในการอัปเดตหน้าเว็บและความสำคัญของหน้าเว็บที่เกี่ยวข้องกัน การส่ง Sitemap ช่วยให้ Google ค้นพบหน้าเว็บของคุณและปรับปรุงกำหนดการรวบรวมข้อมูลได้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Sitemap โปรดดูที่ศูนย์ช่วยเหลือของผู้ดูแลเว็บ และการใช้โปรโตคอล Sitemap หากคุณสนใจที่จะสร้าง Sitemap ที่สวยกว่าเคย โปรดดู http://www.sitemaps.org/protocol.php

การส่ง Sitemap มีประโยชน์อย่างยิ่งหากเว็บไซต์ของคุณมีสิ่งต่อไปนี้:

  • เนื้อหาแบบไดนามิก
  • หน้าเว็บที่ Googlebot (โปรแกรมรวบรวมข้อมูลเว็บของ Google) ค้นพบได้ยาก เช่น หน้าเว็บที่มีคุณลักษณะ AJAX หรือ Flash จำนวนมาก
  • มีไม่กี่เว็บไซต์ที่ลิงก์มา

    Googlebot จะรวบรวมข้อมูลเว็บโดยติดตามลิงก์จากหน้าหนึ่งไปอีกหน้าหนึ่ง ดังนั้นหากเว็บไซต์ของคุณไม่มีการลิงก์ที่ดี โปรแกรมรวบรวมข้อมูลจะค้นพบได้ยาก หากเว็บไซต์ยังใหม่ ก็น่าจะมีเว็บไซต์ไม่มากนักที่ชี้ไปยังเว็บไซต์ของคุณ

  • ที่เก็บถาวรของหน้าเนื้อหาขนาดใหญ่ซึ่งไม่มีเครือข่ายที่แข็งแกร่งในการแลกเปลี่ยนลิงก์

Google สามารถจัดทำดัชนีเฉพาะหน้าที่เข้าถึงได้ ดังนั้น หากคุณใช้ไฟล์ robots.txt หรือเมตาแท็ก robots ในหน้าเว็บ ให้ตรวจสอบว่าหน้าเว็บเหล่านั้นไม่ได้บล็อกโปรแกรมรวบรวมข้อมูล

การครอบคลุมที่ดีขึ้นจะไม่เกิดขึ้นทันที เนื่องจากหน้าเว็บต้องใช้เวลาในการ Crawl และจัดทำดัชนี แต่เมื่อหน้าเว็บของคุณอยู่ในดัชนีแล้ว หน้าเว็บเหล่านั้นก็จะปรากฏในทั้ง Google Search และ Programmable Search Engine ของคุณ

กลับไปด้านบน

ขีดจำกัดของคำอธิบายประกอบ

ตารางต่อไปนี้แสดงขีดจำกัดสำหรับไฟล์คำอธิบายประกอบที่อัปโหลดไปยัง Programmable Search Engine

หมายเหตุ: ปฏิบัติตามขีดจำกัดอย่างเคร่งครัด หากเกินขีดจำกัด เครื่องมือค้นหาของคุณอาจไม่แสดงผลลัพธ์

อัตราส่วน ขีดจำกัด
ขนาดไฟล์ (ไฟล์บริบทหรือคำอธิบายประกอบ) 30KB
จำนวนสูงสุดของข้อมูลเสริมต่อเครื่องมือค้นหา 5,000

เคล็ดลับ: หากพบว่าเครื่องมือค้นหาของคุณมีเว็บไซต์ใหญ่เกินขีดจํากัดที่ 5,000 เว็บไซต์ ให้พิจารณารวม URL แต่ละรายการเป็นรูปแบบ URL

กลับไปด้านบน