Googlebot กับขนาดไฟล์ 15 MB

วันอังคารที่ 28 มิถุนายน 2022

ในช่วง 2-3 วันที่ผ่านมา เราได้รับคำถามมากมายเรื่องการอัปเดตครั้งล่าสุดในเอกสารประกอบเกี่ยวกับ Googlebot กล่าวคือ เราได้บันทึกลงในเอกสารว่า Googlebot จะ "ดู" แค่ 15 เมกะไบต์ (MB) แรกของไฟล์เท่านั้นเมื่อดึงข้อมูลของไฟล์บางประเภท เกณฑ์นี้ไม่ใช่ค่าใหม่ เราใช้กันมาเป็นเวลาหลายปีแล้ว เราเพิ่งเพิ่มข้อมูลลงในเอกสารประกอบเนื่องจากอาจเป็นประโยชน์ต่อบางคนเมื่อทำการแก้ไขข้อบกพร่อง และแทบไม่มีการเปลี่ยนแปลงเลย

ขีดจํากัดนี้มีผลเฉพาะกับไบต์ (เนื้อหา) ที่ได้รับสำหรับคำขอเริ่มแรกที่ Googlebot สร้างขึ้นเท่านั้น ไม่ใช่ทรัพยากรที่จะใช้อ้างอิงภายในหน้า

เช่น เมื่อเปิด https://example.com/puppies.html เบราว์เซอร์จะดาวน์โหลดไบต์ของไฟล์ HTML ในเบื้องต้น และอาจส่งคำขอเพิ่มเติมสําหรับ JavaScript ภายนอก, รูปภาพ หรือสิ่งอื่นใดก็แล้วแต่ที่อ้างอิงกับไบต์ดังกล่าวโดยมี URL ใน HTML Googlebot ก็ทําแบบเดียวกัน

ขีดจํากัด 15 MB นี้จะส่งผลต่อฉันอย่างไร
พูดได้ว่าไม่ต้องดําเนินการใดๆ เลย บนอินเทอร์เน็ตมีหน้าเว็บจํานวนน้อยมากที่มีขนาดใหญ่กว่านั้น คุณผู้อ่านที่รักก็ไม่น่าจะมีพร็อพเพอร์ตี้ที่มีขนาดใหญ่กว่านั้น เนื่องจากค่ามัธยฐานของไฟล์ HTML มีขนาดเล็กกว่าประมาณ 500 เท่า กล่าวคือแค่ 30กิโลไบต์ (kB) เท่านั้นเอง อย่างไรก็ตาม หากคุณเป็นเจ้าของหน้า HTML ที่มีขนาดเกิน 15 MB บางทีคุณอาจลองย้ายสคริปต์ในหน้าและ CSS บางส่วนไปยังไฟล์ภายนอกดูก็ได้ ซึ่งเราเองก็อยากให้คุณทำอย่างนั้น

จะเกิดอะไรขึ้นกับเนื้อหาที่อยู่เกินจาก 15 MB
Googlebot จะไม่ดูเนื้อหาหลังจาก 15 MB แรก และส่งต่อเนื้อหาแค่ 15 MB แรกไปจัดทําดัชนี

การจำกัดเนื้อหา 15 MB ใช้กับเนื้อหาประเภทใดบ้าง
ขีดจํากัด 15 MB จะใช้กับการดึงข้อมูลโดย Googlebot (Googlebot สําหรับสมาร์ทโฟน และ Googlebot สําหรับเดสก์ท็อป) เมื่อดึงข้อมูลจากประเภทไฟล์ที่ Google Search รองรับ

หมายความว่า Googlebot จะไม่เห็นรูปภาพหรือวิดีโอของฉันใช่ไหม
ไม่ใช่ Googlebot ดึงข้อมูลวิดีโอและรูปภาพที่อ้างอิงใน HTML ที่มี URL (เช่น <img src="https://example.com/images/puppy.jpg" alt="cute puppy looking very disappointed" />) แยกต่างหากจากการดึงข้อมูลต่อเนื่อง

URI ของข้อมูลจะนับรวมในขนาดไฟล์ HTML ด้วยไหม
ใช่ การใช้ data URIs จะนับรวมในขนาดไฟล์ HTML ด้วยเนื่องจากอยู่ในไฟล์ HTML

ฉันจะรู้ขนาดของหน้าเว็บได้อย่างไร
มีหลายวิธีที่จะดูขนาดของหน้าเว็บ แต่วิธีที่ง่ายที่สุดอาจเป็นการใช้เบราว์เซอร์ของคุณและเครื่องมือสําหรับนักพัฒนาซอฟต์แวร์ของเบราว์เซอร์ วิธีการคือให้โหลดหน้าเว็บตามปกติ จากนั้นเปิดเครื่องมือสําหรับนักพัฒนาซอฟต์แวร์และสลับไปที่แท็บ "เครือข่าย" โหลดหน้านี้ซ้ำ และคุณจะเห็นคำขอทั้งหมดที่เบราว์เซอร์ต้องสร้างขึ้นมาเพื่อให้แสดงผลหน้าเว็บ คําขอที่อยู่บนสุดคือสิ่งที่คุณต้องการดู ซึ่งจะมีขนาดไบต์ของหน้าเว็บแสดงในคอลัมน์ "ขนาด"

เช่น ในเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ Chrome คำขอดังกล่าวอาจมีลักษณะตามตัวอย่างด้านล่างนี้ ซึ่งคุณจะเห็น "150 kB" ในคอลัมน์ขนาด

แท็บ &quot;เครือข่าย&quot; ในเครื่องมือสําหรับนักพัฒนาซอฟต์แวร์ Chrome

หากต้องการใช้วิธีที่ท้าทายขึ้นอีกนิด คุณอาจใช้ cURL จากบรรทัดคําสั่ง ดังนี้

curl \
-A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \
-so /dev/null https://example.com/puppies.html -w '%{size_download}'

หากมีข้อสงสัยเพิ่มเติม โปรดติดต่อเราทาง Twitter และในฟอรัม Search Central และหากต้องการข้อมูลเพิ่มเติมเกี่ยวกับเอกสารประกอบของเรา โปรดแสดงความคิดเห็นที่หน้าเว็บที่คุณต้องการทราบข้อมูล