เอกสารนี้อธิบายข้อกำหนดเบื้องต้น แนวทางปฏิบัติแนะนำ และข้อผิดพลาดที่พบบ่อย เมื่อทำงานกับชุดข้อมูล
ข้อกำหนดเบื้องต้น
เมื่อสร้างชุดข้อมูล ให้ทำดังนี้
- ชื่อที่แสดงต้องไม่ซ้ำกันภายในโปรเจ็กต์ Google Cloud
- ชื่อที่แสดงต้องมีความยาวน้อยกว่า 64 ไบต์ (เนื่องจากอักขระเหล่านี้แสดงใน UTF-8 ในบางภาษา อักขระแต่ละตัวอาจแสดงด้วยหลายไบต์)
- คำอธิบายต้องมีความยาวน้อยกว่า 1,000 ไบต์
เมื่ออัปโหลดข้อมูล ให้ทำดังนี้
- ประเภทไฟล์ที่รองรับ ได้แก่ CSV, GeoJSON และ KML
- ขนาดไฟล์สูงสุดที่รองรับคือ 500 MB
- ชื่อคอลัมน์แอตทริบิวต์ต้องไม่ขึ้นต้นด้วยสตริง "?_"
- ระบบไม่รองรับรูปทรงเรขาคณิตสามมิติ ซึ่งรวมถึงคำต่อท้าย "Z" ในรูปแบบ WKT และพิกัดระดับความสูงในรูปแบบ GeoJSON
แนวทางปฏิบัติแนะนำในการจัดเตรียมข้อมูล
หากข้อมูลต้นฉบับมีความซับซ้อนหรือมีขนาดใหญ่ เช่น จุดหนาแน่น สตริงเส้นยาว หรือรูปหลายเหลี่ยม (โดยปกติแล้วไฟล์ต้นฉบับที่มีขนาดใหญ่กว่า 50 MB จะอยู่ในหมวดหมู่นี้) ให้ลองลดความซับซ้อนของข้อมูล ก่อนอัปโหลดเพื่อให้ได้ประสิทธิภาพสูงสุดในแผนที่ภาพ
แนวทางปฏิบัติแนะนำบางส่วนในการเตรียมข้อมูลมีดังนี้
- ลดพร็อพเพอร์ตี้ของฟีเจอร์ เก็บเฉพาะพร็อพเพอร์ตี้ของฟีเจอร์ที่จำเป็นต่อการจัดรูปแบบ แผนที่ เช่น "id" และ "category" คุณสามารถรวมพร็อพเพอร์ตี้เพิ่มเติมเข้ากับฟีเจอร์ในแอปพลิเคชันไคลเอ็นต์ ได้โดยใช้รูปแบบที่ขับเคลื่อนด้วยข้อมูลในคีย์ตัวระบุที่ไม่ซ้ำกัน เช่น ดูดูข้อมูลแบบเรียลไทม์ด้วยการจัดรูปแบบตามข้อมูล
- ใช้ประเภทข้อมูลอย่างง่ายสำหรับออบเจ็กต์พร็อพเพอร์ตี้หากเป็นไปได้ เช่น จำนวนเต็ม เพื่อลดขนาดไทล์และปรับปรุงประสิทธิภาพของแผนที่
- ลดความซับซ้อนของรูปทรงเรขาคณิตก่อนอัปโหลดไฟล์ คุณทำได้ในเครื่องมือเชิงพื้นที่ที่ต้องการ เช่น ยูทิลิตี Mapshaper.org แบบโอเพนซอร์ส หรือใน BigQuery โดยใช้ ST_Simplify กับรูปเรขาคณิตของรูปหลายเหลี่ยมที่ซับซ้อน
- จัดกลุ่มจุดที่หนาแน่นมากก่อนอัปโหลดไฟล์ คุณทำได้ใน เครื่องมือเชิงพื้นที่ที่ต้องการ เช่น ฟังก์ชันคลัสเตอร์ turf.js แบบโอเพนซอร์ส หรือใน BigQuery โดยใช้ ST_CLUSTERDBSCAN ในรูปทรงเรขาคณิตของจุดที่หนาแน่น
ดูคำแนะนำเพิ่มเติมเกี่ยวกับแนวทางปฏิบัติแนะนำสำหรับชุดข้อมูลได้ในหัวข้อแสดงภาพข้อมูลด้วยชุดข้อมูลและ BigQuery
ข้อกำหนดของ GeoJSON
Maps Datasets API รองรับข้อกำหนด GeoJSON ปัจจุบัน นอกจากนี้ Maps Datasets API ยังรองรับไฟล์ GeoJSON ที่มีออบเจ็กต์ประเภทใดก็ได้ต่อไปนี้
- ออบเจ็กต์เรขาคณิต ออบเจ็กต์เรขาคณิตคือรูปร่างเชิงพื้นที่ ซึ่งอธิบายเป็นยูเนียน ของจุด เส้น และรูปหลายเหลี่ยมที่มีรูที่ไม่บังคับ
- ออบเจ็กต์ฟีเจอร์ ออบเจ็กต์ฟีเจอร์ประกอบด้วยเรขาคณิตและคู่ชื่อ/ค่าเพิ่มเติม ซึ่งมีความหมายเฉพาะแอปพลิเคชัน
- คอลเล็กชันฟีเจอร์ FeatureCollection คือชุดของออบเจ็กต์ฟีเจอร์
Maps Datasets API ไม่รองรับไฟล์ GeoJSON ที่มีข้อมูลในระบบอ้างอิงพิกัด (CRS) อื่นที่ไม่ใช่ WGS84
ดูข้อมูลเพิ่มเติมเกี่ยวกับ GeoJSON ได้ที่ เป็นไปตาม RFC 7946
ข้อกำหนด KML
Maps Dataset API มีข้อกำหนดต่อไปนี้
- URL ทั้งหมดต้องเป็น URL ในเครื่อง (หรือ URL ที่เกี่ยวข้อง) กับไฟล์นั้นๆ
- รองรับเรขาคณิตแบบจุด เส้น และรูปหลายเหลี่ยม
- ระบบจะถือว่าแอตทริบิวต์ข้อมูลทั้งหมดเป็นสตริง
- ไอคอนหรือ
<styleUrl>
ที่กำหนดไว้นอกไฟล์ - ลิงก์เครือข่าย เช่น
<NetworkLink>
- การวางซ้อนพื้น เช่น
<GroundOverlay>
- รูปทรงเรขาคณิต 3 มิติหรือแท็กที่เกี่ยวข้องกับระดับความสูง เช่น
<altitudeMode>
- ข้อกำหนดของกล้อง เช่น
<LookAt>
- รูปแบบที่กำหนดไว้ภายในไฟล์ KML
ข้อกำหนดของ CSV
สำหรับไฟล์ CSV ชื่อคอลัมน์ที่รองรับจะแสดงอยู่ด้านล่างตามลำดับความสำคัญ
latitude
,longitude
lat
,long
x
,y
wkt
(ข้อความที่รู้จักกันดี)address
,city
,state
,zip
address
- คอลัมน์เดียวที่มีข้อมูลที่อยู่ทั้งหมด เช่น
1600 Amphitheatre Parkway Mountain View, CA 94043
เช่น ไฟล์มีคอลัมน์ชื่อ x
, y
และ wkt
เนื่องจาก x
และ y
มีลำดับความสำคัญสูงกว่าตามลำดับชื่อคอลัมน์ที่รองรับในรายการด้านบน ระบบจึงใช้ค่าในคอลัมน์ x
และ y
และไม่สนใจคอลัมน์ wkt
นอกจากนี้
- ชื่อคอลัมน์แต่ละชื่อต้องเป็นของคอลัมน์เดียว กล่าวคือ คุณไม่สามารถมีคอลัมน์ชื่อ
xy
ที่มีทั้งข้อมูลพิกัด x และ y พิกัด x และ y ต้องอยู่ในคอลัมน์แยกกัน - ชื่อคอลัมน์ไม่คำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่
- ลำดับของชื่อคอลัมน์ไม่มีความสำคัญ เช่น หากไฟล์ CSV มีคอลัมน์
lat
และlong
คอลัมน์เหล่านี้จะอยู่ในลำดับใดก็ได้
จัดการข้อผิดพลาดในการอัปโหลดข้อมูล
เมื่ออัปโหลดข้อมูลไปยังชุดข้อมูล คุณอาจพบข้อผิดพลาดที่พบบ่อยอย่างใดอย่างหนึ่งที่อธิบายไว้ในส่วนนี้
ข้อผิดพลาด GeoJSON
ข้อผิดพลาดที่พบบ่อยใน GeoJSON ได้แก่
- ไม่มีฟิลด์
type
หรือtype
ไม่ใช่สตริง ไฟล์ข้อมูล GeoJSON ที่อัปโหลดต้องมีฟิลด์สตริงชื่อtype
เป็นส่วนหนึ่งของคำจำกัดความของออบเจ็กต์ Feature และออบเจ็กต์ Geometry แต่ละรายการ
ข้อผิดพลาดของ KML
ข้อผิดพลาดที่พบบ่อยใน KML ได้แก่
- ไฟล์ข้อมูลต้องไม่มีฟีเจอร์ KML ที่ไม่รองรับตามที่ระบุไว้ข้างต้น ไม่เช่นนั้นการนำเข้าข้อมูลอาจล้มเหลว
ข้อผิดพลาด CSV
ข้อผิดพลาดเกี่ยวกับ CSV ที่พบบ่อยมีดังนี้
- บางแถวไม่มีค่าสำหรับคอลัมน์เรขาคณิต ทุกแถวในไฟล์ CSV ต้องมีค่าที่ไม่ว่างสำหรับคอลัมน์เรขาคณิต คอลัมน์เรขาคณิตประกอบด้วยข้อมูลต่อไปนี้
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
,zip
address
- คอลัมน์เดียวที่มีข้อมูลที่อยู่ทั้งหมด เช่น
1600 Amphitheatre Parkway Mountain View, CA 94043
- หาก
x
และy
เป็นคอลัมน์เรขาคณิต ให้ตรวจสอบว่าหน่วยเป็น ลองจิจูดและละติจูด ชุดข้อมูลสาธารณะบางชุดใช้ระบบพิกัดที่แตกต่างกันภายใต้ส่วนหัวx
และy
หากใช้หน่วยที่ไม่ถูกต้อง ระบบอาจนำเข้าชุดข้อมูลได้สำเร็จ แต่ข้อมูลที่แสดงอาจแสดงจุดชุดข้อมูลในตำแหน่งที่ไม่คาดคิด