วิธีการทำงานของ Google Search

Google ทำงานอย่างไร ลองอ่านข้อมูลโดยย่อและข้อมูลโดยละเอียดต่อไปนี้

Google ได้รับข้อมูลจากหลายแหล่งที่มา ได้แก่

  • หน้าเว็บ
  • เนื้อหาที่ผู้ใช้ส่ง เช่น ข้อมูลใน Google My Business และ Maps ที่ผู้ใช้ส่ง
  • การสแกนหนังสือ
  • ฐานข้อมูลสาธารณะในอินเทอร์เน็ต
  • และแหล่งที่มาอื่นๆ

อย่างไรก็ตาม หน้านี้จะเน้นแหล่งที่มาจากหน้าเว็บ

ข้อมูลโดยย่อ

Google ทำตาม 3 ขั้นตอนพื้นฐานในการสร้างผลการค้นหาจากหน้าเว็บ

การรวบรวมข้อมูล

ขั้นตอนแรกคือค้นหาหน้าเว็บที่มีอยู่ในอินเทอร์เน็ต เนื่องจากไม่มีรีจิสทรีส่วนกลางสำหรับหน้าเว็บทั้งหมด Google จึงต้องค้นหาหน้าเว็บใหม่ๆ อย่างสม่ำเสมอและเพิ่มลงในรายการหน้าเว็บที่รู้จัก Google รู้จักหน้าเว็บบางหน้าอยู่แล้วเพราะเคยไปที่หน้านั้นแล้ว และจะค้นพบหน้าเว็บบางส่วนเมื่อ Google ตามลิงก์จากหน้าเว็บที่รู้จักไปยังหน้าเว็บใหม่ ส่วนหน้าอื่นๆ จะค้นพบเมื่อเจ้าของเว็บไซต์ส่งรายการหน้าเว็บ (แผนผังเว็บไซต์) ให้ Google รวบรวมข้อมูล หากคุณใช้โฮสต์เว็บที่มีการจัดการ เช่น Wix หรือ Blogger โฮสต์เว็บเหล่านี้อาจแจ้งให้ Google รวบรวมข้อมูลหน้าเว็บที่คุณอัปเดตหรือสร้างใหม่

เมื่อ Google ค้นพบ URL ของหน้าเว็บ ก็จะไปที่ URL นั้นหรือรวบรวมข้อมูลหน้าเว็บนั้นเพื่อดูสิ่งที่อยู่ในหน้า Google จะแสดงหน้าเว็บและวิเคราะห์ทั้งข้อความและเนื้อหาที่ไม่ใช่ข้อความ รวมถึงเลย์เอาต์ของลักษณะโดยรวม เพื่อกำหนดตำแหน่งที่จะให้ปรากฏในผลการค้นหา ยิ่ง Google เข้าใจเว็บไซต์ได้ดี ก็จะนำไปจับคู่กับผู้ที่กำลังมองหาเนื้อหาในเว็บไซต์นั้นได้ดีขึ้น

วิธีปรับปรุงการรวบรวมข้อมูลเว็บไซต์

  • ตรวจสอบว่า Google เข้าถึงหน้าต่างๆ ในเว็บไซต์ได้และหน้าเหล่านั้นดูไม่มีปัญหา Google จะเข้าถึงเว็บในฐานะผู้ใช้ที่ไม่ระบุตัวบุคคล (ผู้ใช้ที่ไม่มีรหัสผ่านหรือข้อมูล) และควรจะดูรูปภาพทั้งหมดรวมถึงองค์ประกอบอื่นๆ ของหน้าเว็บได้เพื่อให้เข้าใจได้อย่างถูกต้อง คุณทำการตรวจสอบอย่างรวดเร็วได้โดยพิมพ์ URL ของหน้าเว็บในการทดสอบความเหมาะกับอุปกรณ์เคลื่อนที่
  • หากคุณสร้างหรืออัปเดตหน้าเว็บเดียว ก็ส่ง URL นั้นไปที่ Google ได้เลย หากต้องการแจ้งให้ Google ทราบเกี่ยวกับหน้าเว็บใหม่หรือหน้าเว็บที่อัปเดตหลายหน้าพร้อมกัน ให้ใช้แผนผังเว็บไซต์
  • หากคุณขอให้ Google รวบรวมข้อมูลเพียง 1 หน้า ให้ทำหน้านั้นเป็นหน้าแรก เท่าที่ Google ทราบ หน้าแรกจะสำคัญที่สุดในเว็บไซต์ของคุณ หากต้องการผลักดันกระบวนการรวบรวมข้อมูลเว็บไซต์ให้เสร็จสมบูรณ์ โปรดตรวจสอบว่าหน้าแรก (และทุกหน้า) มีระบบนำทางที่ดีซึ่งลิงก์กับทุกส่วนและทุกหน้าที่สำคัญในเว็บไซต์ เพื่อช่วยให้ผู้ใช้ (และ Google) ไปยังส่วนต่างๆ ในเว็บไซต์ได้ สำหรับเว็บไซต์ขนาดเล็ก (มีไม่ถึง 1,000 หน้า) สิ่งที่คุณต้องทำคือแจ้งให้ Google ทราบเกี่ยวกับหน้าแรกเท่านั้นหาก Google เข้าถึงหน้าอื่นๆ ทั้งหมดได้โดยไปตามเส้นทางของลิงก์ที่เริ่มจากหน้าแรกนั้น
  • ลิงก์หน้าเว็บกับหน้าอื่นที่ Google รู้จักแล้ว แต่โปรดระวังว่า Google จะไม่ติดตามลิงก์ในโฆษณา ลิงก์ที่คุณจ่ายเงินซึ่งอยู่ในเว็บไซต์อื่น ลิงก์ในความคิดเห็น หรือลิงก์อื่นๆ ที่ไม่เป็นไปตามหลักเกณฑ์สำหรับผู้ดูแลเว็บ Google

การจัดทำดัชนี

หลังจากพบหน้าเว็บแล้ว Google จะพยายามทำความเข้าใจเนื้อหาในหน้า กระบวนการนี้เรียกว่าการจัดทำดัชนี Google จะวิเคราะห์เนื้อหาของหน้าเว็บ จำแนกประเภทรูปภาพและไฟล์วิดีโอที่ฝังอยู่ในหน้า และพยายามทำความเข้าใจหน้านั้นๆ ข้อมูลนี้จะเก็บไว้ในดัชนีของ Google ซึ่งเป็นฐานข้อมูลขนาดใหญ่ที่เก็บไว้ในคอมพิวเตอร์จำนวนมาก

วิธีปรับปรุงการจัดทำดัชนีหน้าเว็บ

  • สร้างชื่อหน้าสั้นๆ ที่สื่อความหมาย
  • ใช้ส่วนหัวของหน้าที่สื่อเนื้อหาของหน้า
  • ใช้ข้อความเพื่อสื่อเนื้อหาแทนการใช้รูปภาพ Google เข้าใจรูปภาพและวิดีโอบางรายการได้แต่ไม่ดีเท่ากับข้อความ อย่างน้อยที่สุด ให้ใส่ข้อความแสดงแทนและแอตทริบิวต์อื่นๆ เป็นข้อมูลเสริมในวิดีโอและรูปภาพตามความเหมาะสม

การแสดงผล (และการจัดอันดับ)

เมื่อผู้ใช้พิมพ์คำค้นหา Google จะพยายามค้นหาคำตอบที่เกี่ยวข้องมากที่สุดจากดัชนีตามปัจจัยหลายอย่าง Google พยายามระบุคำตอบที่มีคุณภาพที่สุดและปัจจัยในการพิจารณาอื่นๆ ที่จะทำให้ผู้ใช้ได้รับประสบการณ์ที่ดีที่สุดและคำตอบที่เหมาะสมที่สุดโดยพิจารณาจากสิ่งต่างๆ เช่น สถานที่ ภาษา และอุปกรณ์ของผู้ใช้ (เดสก์ท็อปหรือโทรศัพท์) ตัวอย่างเช่น การค้นหา "ร้านซ่อมจักรยาน" จะแสดงคำตอบที่แตกต่างกันแก่ผู้ใช้ในปารีสและผู้ใช้ในฮ่องกง Google ไม่รับค่าตอบแทนเพื่อจัดอันดับหน้าเว็บให้สูงขึ้น และการจัดลำดับทำโดยใช้โปรแกรม

วิธีปรับปรุงการแสดงผลและการจัดอันดับ

ข้อมูลโดยละเอียด

หากต้องการข้อมูลเพิ่มเติม ให้อ่านเนื้อหาต่อไปนี้

ข้อมูลโดยละเอียด

การรวบรวมข้อมูล

การรวบรวมข้อมูลเป็นขั้นตอนที่ Googlebot จะไปที่หน้าใหม่และหน้าที่อัปเดตเพื่อเพิ่มลงในดัชนีของ Google

เราใช้ชุดคอมพิวเตอร์ขนาดใหญ่ในการดึงข้อมูล (หรือ "รวบรวมข้อมูล") หน้าเว็บหลายพันล้านหน้า โปรแกรมที่ทำการดึงข้อมูลเรียกว่า Googlebot (หรือที่รู้จักกันในชื่อ โรบ็อต บ็อต หรือสไปเดอร์) Googlebot ใช้ขั้นตอนแบบอัลกอริทึมเพื่อระบุเว็บไซต์ที่จะรวบรวมข้อมูล ความถี่ และจำนวนหน้าเว็บที่จะดึงข้อมูลจากเว็บไซต์แต่ละแห่ง

ขั้นตอนการรวบรวมข้อมูลของ Google เริ่มด้วยรายการ URL ของหน้าเว็บ ซึ่งสร้างขึ้นจากขั้นตอนการรวบรวมข้อมูลครั้งก่อนและเสริมเข้ากับข้อมูลแผนผังเว็บไซต์ที่เจ้าของเว็บไซต์ให้ไว้ เมื่อไปที่หน้าเว็บ Googlebot จะค้นหาลิงก์ในหน้านั้นและเพิ่มลงในรายการหน้าเว็บที่จะรวบรวมข้อมูล จะมีการบันทึกเว็บไซต์ใหม่ๆ การเปลี่ยนแปลงในเว็บไซต์ที่มีอยู่ และลิงก์ที่ใช้งานไม่ได้ เพื่อใช้ในการอัปเดตดัชนีของ Google

ในระหว่างการรวบรวมข้อมูล Google จะแสดงหน้าเว็บโดยใช้ Chrome เวอร์ชันล่าสุด และจะเรียกใช้สคริปต์ของหน้าเว็บที่พบ ซึ่งถือเป็นส่วนหนึ่งของขั้นตอนการแสดงผล หากเว็บไซต์ใช้เนื้อหาที่สร้างขึ้นแบบไดนามิก โปรดทำตามหลักการพื้นฐานของ JavaScript SEO

Google รู้ได้อย่างไรว่าจะไม่รวบรวมข้อมูลหน้าใด

  • หน้าที่ถูกบล็อกใน robots.txt จะไม่ได้รับการรวบรวมข้อมูล แต่ก็อาจได้รับการจัดทำดัชนีหากลิงก์อยู่กับหน้าอื่น (Google คาดคะเนเนื้อหาของหน้าเว็บได้จากลิงก์ที่ชี้ไปยังหน้านั้น และจัดทำดัชนีหน้าเว็บโดยไม่แยกวิเคราะห์เนื้อหา)
  • Google รวบรวมข้อมูลได้เฉพาะหน้าเว็บที่ผู้ใช้ที่ไม่ระบุตัวตนเข้าถึงได้ เพราะการเข้าสู่ระบบหรือการป้องกันด้วยการให้สิทธิ์แบบอื่นๆ จะทำให้ระบบรวบรวมข้อมูลหน้าเว็บไม่ได้
  • ระบบจะรวบรวมข้อมูลของหน้าเว็บที่เคยรวบรวมข้อมูลแล้วและถือว่าซ้ำกับหน้าอื่นๆ น้อยครั้งกว่า

ปรับปรุงการรวบรวมข้อมูล

ใช้เทคนิคเหล่านี้เพื่อช่วยให้ Google ค้นพบหน้าเว็บที่ถูกต้องในเว็บไซต์

การจัดทำดัชนี

Googlebot ประมวลผลหน้าเว็บแต่ละหน้าที่รวบรวมข้อมูลเพื่อให้เข้าใจเนื้อหาของหน้าเว็บ ซึ่งรวมถึงการประมวลผลเนื้อหาที่เป็นข้อความ แท็กและแอตทริบิวต์ของเนื้อหาหลัก เช่น แท็ก <title> และแอตทริบิวต์ Alt ตลอดจนรูปภาพ วิดีโอ และอื่นๆ Googlebot ประมวลผลเนื้อหาได้หลายประเภท แต่ไม่ใช่ทุกประเภท ตัวอย่างเช่น เราประมวลผลเนื้อหาของไฟล์สื่อสมบูรณ์บางไฟล์ไม่ได้

Google จะพิจารณาว่าหน้าเว็บนั้นซ้ำหรือเป็น Canonical ของหน้าอื่นในระหว่างการรวบรวมข้อมูลและการจัดทำดัชนี และจะรวบรวมข้อมูลหน้าที่ถือว่าซ้ำน้อยครั้งกว่า ระบบจะจัดกลุ่มหน้าเว็บที่คล้ายกันเป็นเอกสาร ซึ่งเป็นกลุ่มของหน้าเว็บอย่างน้อย 1 หน้าที่มีหน้า Canonical (ตัวแทนที่ดีที่สุดของกลุ่ม) และหน้าซ้ำที่พบ (ซึ่งอาจเป็น URL ทางเลือกเพื่อเข้าถึงหน้าเดียวกัน หรือเป็นเวอร์ชันทางเลือกสำหรับอุปกรณ์เคลื่อนที่หรือเดสก์ท็อปของหน้าเดียวกัน)

โปรดทราบว่า Google ไม่จัดทำดัชนีหน้าที่มีคำสั่ง noindex (ส่วนหัวหรือแท็ก) แต่จะต้องเห็นคำสั่งได้ หากไฟล์ robots.txt, หน้าเข้าสู่ระบบ หรืออุปกรณ์อื่นบล็อกหน้าเว็บอยู่ หน้านั้นยังอาจได้รับการจัดทำดัชนีแม้ว่า Google จะไม่ได้ไปที่หน้านั้นก็ตาม

ปรับปรุงการจัดทำดัชนี

มีเทคนิคหลายอย่างที่ช่วยปรับปรุงความสามารถของ Google ในการทำความเข้าใจเนื้อหาในหน้าเว็บ ดังนี้

"เอกสาร" คืออะไร

ในการทำงานภายในระบบนั้น Google จะใช้ชุดเอกสาร (ขนาดใหญ่) เป็นตัวแทนของเว็บ เอกสารแต่ละฉบับจะเป็นตัวแทนของหน้าเว็บอย่างน้อย 1 หน้า หน้าเว็บเหล่านี้มีความเหมือนกันหรือคล้ายกันมาก แต่โดยพื้นฐานแล้วมีเนื้อหาเหมือนกันและเข้าถึงได้โดย URL ที่แตกต่างกัน ทั้งนี้ URL ที่แตกต่างกันในเอกสารอาจนำไปยังหน้าเดียวกัน (เช่น example.com/dresses/summer/1234 และ example.com?product=1234 อาจแสดงหน้าเดียวกัน) หรือหน้าเว็บเดียวกันที่มีความแตกต่างเล็กน้อยสำหรับผู้ใช้ในอุปกรณ์แต่ละประเภท (เช่น example.com/mypage สำหรับผู้ใช้เดสก์ท็อป และ m.example.com/mypage สำหรับผู้ใช้อุปกรณ์เคลื่อนที่)

Google จะเลือก URL รายการหนึ่งในเอกสารและกำหนดให้เป็น Canonical URL ของเอกสาร Canonical URL ของเอกสารคือ URL ที่ Google รวบรวมข้อมูลและจัดทำดัชนีบ่อยที่สุด ส่วน URL อื่นๆ จะถือเป็นรายการซ้ำหรือทางเลือกและอาจได้รับการรวบรวมข้อมูลในบางครั้ง หรือแสดงตามคำขอของผู้ใช้ เช่น หาก Canonical URL ของเอกสารคือ URL อุปกรณ์เคลื่อนที่ Google อาจยังคงแสดง URL เดสก์ท็อป (ทางเลือก) แก่ผู้ใช้ที่ค้นหาในเดสก์ท็อป

ข้อมูลรายงานส่วนใหญ่ใน Search Console ได้มาจาก Canonical URL ของเอกสาร เครื่องมือบางอย่าง (เช่น เครื่องมือตรวจสอบ URL) รองรับการทดสอบ URL ทางเลือก แต่การตรวจสอบ Canonical URL ควรให้ข้อมูลเกี่ยวกับ URL ทางเลือกด้วย

คุณบอกให้ Google ทราบถึง URL ที่ต้องการให้เป็นหน้า Canonical ได้ แต่ Google อาจเลือกหน้า Canonical อื่นเมื่อพิจารณาเหตุผลต่างๆ แล้ว

สรุปคำศัพท์และวิธีการใช้งานใน Search Console มีดังนี้

  • เอกสาร: คอลเล็กชันของหน้าที่คล้ายกัน มี Canonical URL และอาจมี URL ทางเลือกในกรณีที่เว็บไซต์มีหน้าซ้ำ URL ในเอกสารอาจมาจากองค์กรเดียวกันหรือคนละองค์กร (โดเมนราก เช่น "google" ใน www.google.com) Google จะเลือก URL ที่ดีที่สุดเพื่อแสดงในผลการค้นหาตามแพลตฟอร์ม (อุปกรณ์เคลื่อนที่/เดสก์ท็อป) ภาษาของผู้ใช้ หรือตำแหน่ง และตัวแปรอื่นๆ Google ค้นพบหน้าเว็บที่เกี่ยวข้องในเว็บไซต์โดยการรวบรวมข้อมูลแบบทั่วไป หรือด้วยฟีเจอร์ที่ใช้งานในเว็บไซต์ เช่น การเปลี่ยนเส้นทางหรือแท็ก <link rel=alternate/canonical> ระบบจะทำเครื่องหมายหน้าเว็บที่เกี่ยวข้องในองค์กรอื่นๆ เป็นทางเลือกได้ต่อเมื่อเว็บไซต์ของคุณเขียนโค้ดอย่างชัดเจน (ผ่านการเปลี่ยนเส้นทางหรือแท็กลิงก์)
  • URL: URL ที่ใช้เพื่อเข้าถึงเนื้อหาที่ระบุในเว็บไซต์ เว็บไซต์อาจจับคู่ URL ที่ต่างกันกับหน้าเดียวกัน
  • หน้าเว็บ: หน้าเว็บหนึ่งๆ ที่เข้าถึงได้ผ่าน URL อย่างน้อย 1 รายการ หน้าเว็บอาจมีเวอร์ชันที่แตกต่างกัน ทั้งนี้ขึ้นอยู่กับแพลตฟอร์มของผู้ใช้ (มือถือ เดสก์ท็อป แท็บเล็ต และอื่นๆ)
  • เวอร์ชัน: รูปแบบหนึ่งของหน้าเว็บ ซึ่งโดยทั่วไปจัดอยู่ในหมวดหมู่ "อุปกรณ์เคลื่อนที่" "เดสก์ท็อป" และ "AMP" (แต่ AMP เองก็มีเวอร์ชันอุปกรณ์เคลื่อนที่และเดสก์ท็อปได้ด้วย) แต่ละเวอร์ชันอาจมี URL ที่แตกต่างกัน (example.com กับ m.example.com) หรือ URL เดียวกัน (หากเว็บไซต์ใช้การแสดงผลแบบไดนามิกหรือการออกแบบเว็บที่ตอบสนองตามอุปกรณ์ URL เดียวกันจะแสดงหน้าเว็บเดียวกันเป็นเวอร์ชันต่างๆ ได้) ทั้งนี้ขึ้นอยู่กับการกำหนดค่าของเว็บไซต์ ภาษาต่างๆ ไม่ถือเป็นเวอร์ชันที่แตกต่างกัน แต่เป็นเอกสารที่แตกต่างกัน
  • หน้า Canonical หรือ Canonical URL: URL ที่ Google ถือว่าเป็นตัวแทนที่ดีที่สุดของเอกสาร Google จะรวบรวมข้อมูล URL นี้เสมอ และบางครั้งก็อาจรวบรวมข้อมูล URL ที่ซ้ำกันในเอกสารด้วย
  • หน้าเว็บหรือ URL ทางเลือก/ที่ซ้ำกัน: URL เอกสารที่ Google อาจรวบรวมข้อมูลเป็นครั้งคราว Google ยังแสดง URL เหล่านี้ในกรณีที่เหมาะสมกับผู้ใช้และคำขอด้วย (เช่น URL ทางเลือกสำหรับผู้ใช้เดสก์ท็อปจะแสดงสำหรับคำขอในเดสก์ท็อปแทนที่จะเป็น Canonical URL อุปกรณ์เคลื่อนที่)
  • เว็บไซต์: มักใช้เป็นคำพ้องความหมายของเว็บ (ชุดหน้าเว็บที่มีแนวคิดเกี่ยวข้องกัน) แต่บางครั้งใช้เป็นคำพ้องความหมายของพร็อพเพอร์ตี้ใน Search Console แม้ว่าคำจำกัดความของ "พร็อพเพอร์ตี้" จะหมายถึงส่วนหนึ่งในเว็บไซต์เท่านั้นก็ตาม เว็บไซต์หนึ่งๆ อาจครอบคลุมโดเมนย่อยหลายรายการ (และแม้กระทั่งโดเมนหลายโดเมน หากมีหน้า AMP ที่ลิงก์อย่างถูกต้อง)

ระบบจัดเก็บหน้าเว็บที่มีเนื้อหาเดียวกันในภาษาต่างๆ ไว้ในเอกสารคนละฉบับซึ่งอ้างอิงถึงกันโดยใช้แท็ก hreflang คุณจึงควรใช้แท็ก hreflang สำหรับเนื้อหาที่แปล

การแสดงผลการค้นหา

เมื่อผู้ใช้ป้อนคำค้นหา เครื่องคอมพิวเตอร์ของเราจะค้นหาดัชนีเพื่อหาหน้าเว็บที่ตรงกัน และส่งคืนผลลัพธ์ที่เราคิดว่าเกี่ยวข้องกับผู้ใช้มากที่สุด ความเกี่ยวข้องจะพิจารณาจากปัจจัยหลายร้อยรายการ และเราพยายามปรับปรุงอัลกอริทึมอยู่เสมอ Google คำนึงถึงประสบการณ์ของผู้ใช้ในการเลือกและจัดอันดับผลการค้นหา ดังนั้นอย่าลืมตรวจสอบว่าหน้าเว็บโหลดเร็วและเหมาะกับอุปกรณ์เคลื่อนที่

การปรับปรุงการแสดงผล

  • หากผลการค้นหามุ่งไปที่ผู้ใช้ในสถานที่หรือภาษาที่เจาะจง คุณบอกความต้องการให้ Google ทราบได้
  • ตรวจสอบว่าหน้าเว็บโหลดเร็วและเหมาะกับอุปกรณ์เคลื่อนที่
  • ปฏิบัติตามหลักเกณฑ์สำหรับผู้ดูแลเว็บเพื่อหลีกเลี่ยงข้อผิดพลาดทั่วไปและทำให้อันดับของเว็บไซต์ดีขึ้น
  • ลองใช้ฟีเจอร์ผลการค้นหาในเว็บไซต์ เช่น การ์ดสูตรอาหารหรือการ์ดบทความ
  • ใช้ AMP เพื่อให้หน้าเว็บในอุปกรณ์เคลื่อนที่โหลดได้เร็วขึ้น หน้า AMP บางหน้ามีสิทธิ์ใช้ฟีเจอร์การค้นหาเพิ่มเติมอย่างเช่น ภาพเรียงสลับเรื่องเด่น
  • อัลกอริทึมของ Google ได้รับการปรับปรุงอย่างต่อเนื่อง คุณควรสร้างเนื้อหาที่ดีและสดใหม่ซึ่งผู้ใช้ต้องการและเป็นไปตามหลักเกณฑ์ของเรา แทนการพยายามคาดเดาอัลกอริทึมและการออกแบบหน้าเว็บตามอัลกอริทึมดังกล่าว

ข้อมูลโดยละเอียดยิ่งขึ้น

คุณดูข้อมูลเกี่ยวกับการทำงานของ Google Search ที่ละเอียดยิ่งขึ้นได้ที่นี่ (มีรูปภาพและวิดีโอด้วย)