ก่อนที่คุณจะเริ่ม

เอกสารนี้อธิบายข้อกำหนดเบื้องต้น แนวทางปฏิบัติแนะนำ และข้อผิดพลาดที่พบบ่อย เมื่อทำงานกับชุดข้อมูล

ข้อกำหนดเบื้องต้น

เมื่อสร้างชุดข้อมูล ให้ทำดังนี้

  • ชื่อที่แสดงต้องไม่ซ้ำกันภายในโปรเจ็กต์ Google Cloud
  • ชื่อที่แสดงต้องมีความยาวน้อยกว่า 64 ไบต์ (เนื่องจากอักขระเหล่านี้แสดงใน UTF-8 ในบางภาษา อักขระแต่ละตัวอาจแสดงด้วยหลายไบต์)
  • คำอธิบายต้องมีความยาวน้อยกว่า 1,000 ไบต์

เมื่ออัปโหลดข้อมูล ให้ทำดังนี้

  • ประเภทไฟล์ที่รองรับ ได้แก่ CSV, GeoJSON และ KML
  • ขนาดไฟล์สูงสุดที่รองรับคือ 500 MB
  • ชื่อคอลัมน์แอตทริบิวต์ต้องไม่ขึ้นต้นด้วยสตริง "?_"
  • ระบบไม่รองรับรูปทรงเรขาคณิตสามมิติ ซึ่งรวมถึงคำต่อท้าย "Z" ในรูปแบบ WKT และพิกัดระดับความสูงในรูปแบบ GeoJSON

แนวทางปฏิบัติแนะนำในการจัดเตรียมข้อมูล

หากข้อมูลต้นฉบับมีความซับซ้อนหรือมีขนาดใหญ่ เช่น จุดหนาแน่น สตริงเส้นยาว หรือรูปหลายเหลี่ยม (โดยปกติแล้วไฟล์ต้นฉบับที่มีขนาดใหญ่กว่า 50 MB จะอยู่ในหมวดหมู่นี้) ให้ลองลดความซับซ้อนของข้อมูล ก่อนอัปโหลดเพื่อให้ได้ประสิทธิภาพสูงสุดในแผนที่ภาพ

แนวทางปฏิบัติแนะนำบางส่วนในการเตรียมข้อมูลมีดังนี้

  1. ลดพร็อพเพอร์ตี้ของฟีเจอร์ เก็บเฉพาะพร็อพเพอร์ตี้ของฟีเจอร์ที่จำเป็นต่อการจัดรูปแบบ แผนที่ เช่น "id" และ "category" คุณสามารถรวมพร็อพเพอร์ตี้เพิ่มเติมเข้ากับฟีเจอร์ในแอปพลิเคชันไคลเอ็นต์ ได้โดยใช้รูปแบบที่ขับเคลื่อนด้วยข้อมูลในคีย์ตัวระบุที่ไม่ซ้ำกัน เช่น ดูดูข้อมูลแบบเรียลไทม์ด้วยการจัดรูปแบบตามข้อมูล
  2. ใช้ประเภทข้อมูลอย่างง่ายสำหรับออบเจ็กต์พร็อพเพอร์ตี้หากเป็นไปได้ เช่น จำนวนเต็ม เพื่อลดขนาดไทล์และปรับปรุงประสิทธิภาพของแผนที่
  3. ลดความซับซ้อนของรูปทรงเรขาคณิตก่อนอัปโหลดไฟล์ คุณทำได้ในเครื่องมือเชิงพื้นที่ที่ต้องการ เช่น ยูทิลิตี Mapshaper.org แบบโอเพนซอร์ส หรือใน BigQuery โดยใช้ ST_Simplify กับรูปเรขาคณิตของรูปหลายเหลี่ยมที่ซับซ้อน
  4. จัดกลุ่มจุดที่หนาแน่นมากก่อนอัปโหลดไฟล์ คุณทำได้ใน เครื่องมือเชิงพื้นที่ที่ต้องการ เช่น ฟังก์ชันคลัสเตอร์ turf.js แบบโอเพนซอร์ส หรือใน BigQuery โดยใช้ ST_CLUSTERDBSCAN ในรูปทรงเรขาคณิตของจุดที่หนาแน่น

ดูคำแนะนำเพิ่มเติมเกี่ยวกับแนวทางปฏิบัติแนะนำสำหรับชุดข้อมูลได้ในหัวข้อแสดงภาพข้อมูลด้วยชุดข้อมูลและ BigQuery

ข้อกำหนดของ GeoJSON

Maps Datasets API รองรับข้อกำหนด GeoJSON ปัจจุบัน นอกจากนี้ Maps Datasets API ยังรองรับไฟล์ GeoJSON ที่มีออบเจ็กต์ประเภทใดก็ได้ต่อไปนี้

  • ออบเจ็กต์เรขาคณิต ออบเจ็กต์เรขาคณิตคือรูปร่างเชิงพื้นที่ ซึ่งอธิบายเป็นยูเนียน ของจุด เส้น และรูปหลายเหลี่ยมที่มีรูที่ไม่บังคับ
  • ออบเจ็กต์ฟีเจอร์ ออบเจ็กต์ฟีเจอร์ประกอบด้วยเรขาคณิตและคู่ชื่อ/ค่าเพิ่มเติม ซึ่งมีความหมายเฉพาะแอปพลิเคชัน
  • คอลเล็กชันฟีเจอร์ FeatureCollection คือชุดของออบเจ็กต์ฟีเจอร์

Maps Datasets API ไม่รองรับไฟล์ GeoJSON ที่มีข้อมูลในระบบอ้างอิงพิกัด (CRS) อื่นที่ไม่ใช่ WGS84

ดูข้อมูลเพิ่มเติมเกี่ยวกับ GeoJSON ได้ที่ เป็นไปตาม RFC 7946

ข้อกำหนด KML

Maps Dataset API มีข้อกำหนดต่อไปนี้

  • URL ทั้งหมดต้องเป็น URL ในเครื่อง (หรือ URL ที่เกี่ยวข้อง) กับไฟล์นั้นๆ
  • รองรับเรขาคณิตแบบจุด เส้น และรูปหลายเหลี่ยม
  • ระบบจะถือว่าแอตทริบิวต์ข้อมูลทั้งหมดเป็นสตริง
ระบบไม่รองรับฟีเจอร์ KML ต่อไปนี้
  • ไอคอนหรือ <styleUrl> ที่กำหนดไว้นอกไฟล์
  • ลิงก์เครือข่าย เช่น <NetworkLink>
  • การวางซ้อนพื้น เช่น <GroundOverlay>
  • รูปทรงเรขาคณิต 3 มิติหรือแท็กที่เกี่ยวข้องกับระดับความสูง เช่น <altitudeMode>
  • ข้อกำหนดของกล้อง เช่น <LookAt>
  • รูปแบบที่กำหนดไว้ภายในไฟล์ KML

ข้อกำหนดของ CSV

สำหรับไฟล์ CSV ชื่อคอลัมน์ที่รองรับจะแสดงอยู่ด้านล่างตามลำดับความสำคัญ

เช่น ไฟล์มีคอลัมน์ชื่อ x, y และ wkt เนื่องจาก x และ y มีลำดับความสำคัญสูงกว่าตามลำดับชื่อคอลัมน์ที่รองรับในรายการด้านบน ระบบจึงใช้ค่าในคอลัมน์ x และ y และไม่สนใจคอลัมน์ wkt

นอกจากนี้

  • ชื่อคอลัมน์แต่ละชื่อต้องเป็นของคอลัมน์เดียว กล่าวคือ คุณไม่สามารถมีคอลัมน์ชื่อ xy ที่มีทั้งข้อมูลพิกัด x และ y พิกัด x และ y ต้องอยู่ในคอลัมน์แยกกัน
  • ชื่อคอลัมน์ไม่คำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่
  • ลำดับของชื่อคอลัมน์ไม่มีความสำคัญ เช่น หากไฟล์ CSV มีคอลัมน์ lat และ long คอลัมน์เหล่านี้จะอยู่ในลำดับใดก็ได้

จัดการข้อผิดพลาดในการอัปโหลดข้อมูล

เมื่ออัปโหลดข้อมูลไปยังชุดข้อมูล คุณอาจพบข้อผิดพลาดที่พบบ่อยอย่างใดอย่างหนึ่งที่อธิบายไว้ในส่วนนี้

ข้อผิดพลาด GeoJSON

ข้อผิดพลาดที่พบบ่อยใน GeoJSON ได้แก่

  • ไม่มีฟิลด์ type หรือ type ไม่ใช่สตริง ไฟล์ข้อมูล GeoJSON ที่อัปโหลดต้องมีฟิลด์สตริงชื่อ type เป็นส่วนหนึ่งของคำจำกัดความของออบเจ็กต์ Feature และออบเจ็กต์ Geometry แต่ละรายการ

ข้อผิดพลาดของ KML

ข้อผิดพลาดที่พบบ่อยใน KML ได้แก่

  • ไฟล์ข้อมูลต้องไม่มีฟีเจอร์ KML ที่ไม่รองรับตามที่ระบุไว้ข้างต้น ไม่เช่นนั้นการนำเข้าข้อมูลอาจล้มเหลว

ข้อผิดพลาด CSV

ข้อผิดพลาดเกี่ยวกับ CSV ที่พบบ่อยมีดังนี้

  • บางแถวไม่มีค่าสำหรับคอลัมน์เรขาคณิต ทุกแถวในไฟล์ CSV ต้องมีค่าที่ไม่ว่างสำหรับคอลัมน์เรขาคณิต คอลัมน์เรขาคณิตประกอบด้วยข้อมูลต่อไปนี้
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • คอลัมน์เดียวที่มีข้อมูลที่อยู่ทั้งหมด เช่น 1600 Amphitheatre Parkway Mountain View, CA 94043
  • หาก x และ y เป็นคอลัมน์เรขาคณิต ให้ตรวจสอบว่าหน่วยเป็น ลองจิจูดและละติจูด ชุดข้อมูลสาธารณะบางชุดใช้ระบบพิกัดที่แตกต่างกันภายใต้ส่วนหัว x และ y หากใช้หน่วยที่ไม่ถูกต้อง ระบบอาจนำเข้าชุดข้อมูลได้สำเร็จ แต่ข้อมูลที่แสดงอาจแสดงจุดชุดข้อมูลในตำแหน่งที่ไม่คาดคิด