เมื่อสร้างปลั๊กอินจากชุมชนสำหรับใช้ลิงก์ข้อมูล แต่ละฟิลด์ที่คุณกําหนดในสคีมา ต้องมีประเภทข้อมูล ประเภทข้อมูลจะกำหนดประเภทดั้งเดิมของฟิลด์ เช่น BOOLEAN, STRING, NUMBER เป็นต้น
นอกจากประเภทข้อมูลแล้ว Data Studio ยังใช้ประเภทเชิงความหมายด้วย
ประเภทเชิงความหมายช่วยอธิบายประเภทของข้อมูลที่ข้อมูลแสดง ตัวอย่างเช่น ฟิลด์ที่มีNUMBERประเภทข้อมูลอาจแสดงถึงจำนวนเงินหรือเปอร์เซ็นต์ในเชิงความหมาย และฟิลด์ที่มีSTRINGประเภทข้อมูลอาจแสดงถึงเมืองในเชิงความหมาย หากต้องการดูว่ามีประเภทความหมายใดบ้าง โปรดดู
เอกสารประกอบเกี่ยวกับประเภทความหมาย
สคีมาของปลั๊กอินจากชุมชนสำหรับใช้ลิงก์ข้อมูลและฟิลด์ Data Studio
เมื่อกำหนดสคีมาสำหรับปลั๊กอินจากชุมชนสำหรับใช้ลิงก์ข้อมูล จะมีพร็อพเพอร์ตี้ต่างๆ สำหรับแต่ละฟิลด์ที่จะกำหนดวิธีแสดงและใช้ฟิลด์ใน Data Studio เช่น
- conceptType มีคำจำกัดความในสคีมาตัวเชื่อมต่อโดยใช้พร็อพเพอร์ตี้
conceptTypeพร็อพเพอร์ตี้นี้จะกำหนดว่าฟิลด์จะถือเป็นมิติข้อมูลหรือเมตริก ดูคำอธิบายความแตกต่างระหว่างเมตริกกับมิติข้อมูลได้ที่ มิติข้อมูลและเมตริก - ประเภทเชิงความหมายสามารถ กำหนดไว้ในสคีมาของเครื่องมือเชื่อมต่อ หรือ Data Studio สามารถตรวจหาโดยอัตโนมัติ ตามพร็อพเพอร์ตี้ประเภทข้อมูลที่กำหนดไว้ใน เครื่องมือเชื่อมต่อและค่าข้อมูลที่เครื่องมือเชื่อมต่อส่งคืน ดูรายละเอียดเกี่ยวกับวิธีการทำงานได้ที่ การตรวจหาประเภทเชิงความหมายอัตโนมัติ
- ประเภทการรวมจะกำหนดว่าค่าเมตริก (ระบบจะไม่สนใจมิติข้อมูล) จะรวมอีกครั้งได้หรือไม่ การตั้งค่าพร็อพเพอร์ตี้
semantics.isReaggregatableเป็นtrueจะใช้การรวบรวมSUMเป็นค่าเริ่มต้น ไม่เช่นนั้นจะตั้งค่าเป็นAutoนอกจากนี้ คุณยังตั้งค่าประเภทการรวมเริ่มต้นสำหรับฟิลด์ที่รวมข้อมูลอีกครั้งได้ด้วยตนเองโดยใช้พร็อพเพอร์ตี้defaultAggregationType
เมื่อกำหนดค่าและเชื่อมต่อโดยใช้เครื่องมือเชื่อมต่อใน Data Studio ฟิลด์
เอดิเตอร์จะแสดงสคีมาที่สมบูรณ์สำหรับเครื่องมือเชื่อมต่อตามวิธีที่คุณกำหนด
พร็อพเพอร์ตี้ข้างต้น หากคุณระบุประเภทเชิงความหมายไว้ ประเภทเหล่านั้นจะแสดงตามที่คุณกำหนด หากคุณใช้การตรวจหาประเภทเชิงความหมายอัตโนมัติ ฟิลด์จะแสดงตามที่ตรวจพบ

การตั้งค่าข้อมูลเชิงความหมาย
การตั้งค่าข้อมูลเชิงความหมายทำได้ 2 วิธี คุณจะตั้งค่าความหมายของฟิลด์ ด้วยตนเองหรือจะให้ Data Studio ตรวจหาโดยอัตโนมัติก็ได้
ตัวอย่างเช่น หากคุณมีตัวเลขที่แสดงถึงดอลลาร์สหรัฐในเชิงความหมาย Data Studio จะตรวจหาประเภทความหมายนี้โดยอัตโนมัติไม่ได้ นอกจากนี้ การตรวจหาความหมายอัตโนมัติยังกำหนดให้ Data Studio ทำการเรียกข้อมูล สำหรับแต่ละฟิลด์ของสคีมา หากคุณระบุสคีมาด้วยตนเองแทน ระบบจะไม่เรียกข้อมูล ในกรณีที่คุณทราบ ประเภทเชิงความหมาย (เช่น สกุลเงิน เปอร์เซ็นต์ วันที่ ฯลฯ) ของข้อมูล เราขอแนะนําให้ตั้งค่านี้อย่างชัดเจนในสคีมาเพื่อความถูกต้องและประสิทธิภาพ
การตั้งค่าประเภทเชิงความหมายด้วยตนเอง (แนะนำ)
หากทราบประเภทเชิงความหมาย คุณจะกำหนด semantics สำหรับฟิลด์สคีมาแต่ละรายการด้วยตนเองได้
ดูรายละเอียดทั้งหมดเกี่ยวกับพร็อพเพอร์ตี้ที่คุณใช้ได้ในหน้าข้อมูลอ้างอิงของฟิลด์ หากเลือกกำหนดประเภทเชิงความหมายด้วยตนเอง เราขอแนะนำให้กำหนด semanticType และ semanticGroup สำหรับทุกฟิลด์ การระบุพร็อพเพอร์ตี้เหล่านี้ด้วยตนเองจะทำให้กระบวนการตรวจหาประเภทความหมายอัตโนมัติไม่ทำงาน หากคุณตั้งค่าบางช่องด้วยตนเอง แต่ไม่ได้ตั้งค่าทั้งหมด ช่องที่ไม่ได้ระบุจะใช้ค่าเริ่มต้นเป็น Text, Number หรือ Boolean โดยขึ้นอยู่กับ dataType
ที่ระบุสำหรับช่อง
ต่อไปนี้เป็นตัวอย่างของสคีมาแบบง่ายที่ตั้งค่าประเภทเชิงความหมายด้วยตนเอง Income ตั้งค่าเป็นสกุลเงิน และ Filing Year ตั้งค่าเป็นวันที่
การแก้ปัญหาประเภทเชิงความหมายที่กำหนดเอง
หากคุณตั้งค่าประเภทเชิงความหมายสำหรับข้อมูลพื้นฐานอย่างไม่ถูกต้อง ประเภทเหล่านั้นจะทำงานไม่ถูกต้อง การทดสอบอาจทำได้ยาก แต่คุณสามารถทำสิ่งต่อไปนี้เพื่อช่วยค้นหาปัญหาได้
- แสดงผล 2 หรือ 3 แถวจากข้อมูลแทนที่จะแสดงทั้งหมด แล้วตรวจสอบด้วยตนเอง
- สร้างตารางใน Looker Studio ที่ใช้เฉพาะฟิลด์ที่คุณต้องการตรวจสอบ
- โปรดใส่ใจช่อง
GeoและDateเป็นพิเศษเนื่องจากมีรูปแบบที่เข้มงวดที่สุด
การตรวจหาประเภทเชิงความหมายอัตโนมัติ
หากคุณไม่ได้กำหนดประเภทเชิงความหมายใดๆ ในสคีมา Data Studio จะพยายามตรวจหาโดยอัตโนมัติตามพร็อพเพอร์ตี้ประเภทข้อมูลและรูปแบบ ของค่าข้อมูลที่ตัวเชื่อมต่อส่งคืน
ขั้นตอนของกระบวนการตรวจหาอัตโนมัติมีดังนี้
- ขอสคีมาโดยการเรียกใช้ฟังก์ชัน
getSchemaของ ปลั๊กอินจากชุมชนสำหรับใช้ลิงก์ข้อมูล - วนซ้ำผ่านกลุ่มฟิลด์ที่กำหนดไว้ในสคีมาตัวเชื่อมต่อและส่งคำขอ
getDataฟิลด์ ระบบจะดำเนินการคำขอgetDataโดยตั้งค่าพารามิเตอร์sampleExtractionเป็นtrueเพื่อระบุว่าคำขอข้อมูลมีวัตถุประสงค์เพื่อการตรวจหาเชิงความหมาย - ระบุประเภทเชิงความหมายของฟิลด์โดยอิงตามประเภทข้อมูลของฟิลด์และรูปแบบของค่าที่แสดงผลจากคำขอ
getData
ตัวเลือกสำหรับการจัดการการตรวจหาประเภทเชิงความหมายอัตโนมัติ
เมื่อ Data Studio เรียกใช้ฟังก์ชัน getData ของปลั๊กอินจากชุมชนสำหรับใช้ลิงก์ข้อมูลเพื่อวัตถุประสงค์ในการตรวจจับเชิงความหมาย คำขอขาเข้าจะมีพร็อพเพอร์ตี้ sampleExtraction ซึ่งจะตั้งค่าเป็น true Data Studio จะใช้ข้อมูลที่เครื่องมือเชื่อมต่อของคุณส่งคืนเพื่อระบุประเภทเชิงความหมายของฟิลด์เท่านั้น เนื่องจากระบบจะไม่ใช้ค่าดังกล่าวเพื่อวัตถุประสงค์อื่น จึงไม่จำเป็นต้องใช้ข้อมูลจริงจากแหล่งภายนอก
คุณปรับปรุงการตรวจหาประเภทเชิงความหมายในโค้ดได้หลายวิธี ดังนี้
แนะนํา: ส่งค่าที่กําหนดไว้ล่วงหน้า
ส่งคืนค่าที่กําหนดไว้ล่วงหน้าสําหรับแต่ละช่องที่แสดงถึงประเภทเชิงความหมายของช่องได้ดีที่สุด และเป็นค่าที่ Data Studio รู้จักว่าตรวจพบได้อย่างถูกต้อง เช่น หากประเภทเชิงความหมายของฟิลด์คือประเทศ ให้ส่งคืนค่า เช่นITสำหรับอิตาลี ข้อดีอีกอย่างของแนวทางนี้คือจะเร็วกว่ามากเนื่องจากคุณไม่จำเป็นต้องส่งคำขอ HTTP ไปยังบริการของบุคคลที่สามเพื่อขอข้อมูลแสดงผลเฉพาะจำนวนระเบียน n
หากบริการของบุคคลที่สามที่คุณดึงข้อมูลมานั้นรองรับขีดจำกัดแถว เมื่อขอข้อมูล ให้แสดงผลชุดข้อมูลย่อยของแถวไปยัง Data Studio แทน ชุดข้อมูลทั้งหมด ซึ่งจะจำกัดปริมาณข้อมูลที่คุณต้องส่งไปยัง Data Studio สำหรับคำขอการตรวจจับเชิงความหมายแต่ละรายการขอคอลัมน์ทั้งหมดและแคชการตอบกลับ
หากเป็นไปได้ ให้ขอคอลัมน์ทั้งหมดสำหรับบริการของบุคคลที่สามที่คุณดึงข้อมูลจาก นั้น ในคำขอตรวจหาความหมายแรกที่ได้รับจาก Data Studio ให้ดึงข้อมูลคอลัมน์ทั้งหมดและแคชผลลัพธ์ สำหรับคำขอตรวจหาความหมายที่ตามมา ให้ดึงค่าคอลัมน์จากแคช แทนที่จะส่งคำขอ HTTP เพิ่มเติมไปยังบริการของบุคคลที่สามไม่ต้องทำอะไร
คุณเลือกที่จะไม่ใช้ที่พักเฉพาะสำหรับคำขอที่ตั้งค่าsampleExtractionเป็นtrueได้ ซึ่งจะทำให้กระบวนการตรวจจับเชิงความหมาย ช้าลงเนื่องจาก Data Studio จะต้องดึงข้อมูลทั้งหมดสำหรับ กระบวนการตรวจจับเชิงความหมาย นอกจากนี้ การดำเนินการนี้จะส่งผลต่ออัตราการส่งคำขอไปยังแหล่งข้อมูลภายนอก เนื่องจากระบบจะดำเนินการคำขอตรวจหาความหมายหลายรายการแบบขนาน
รูปแบบที่ระบบรู้จักสำหรับการตรวจหาประเภทเชิงความหมายอัตโนมัติ
วันที่และเวลา
YYYY/MM/DD-HH:MM:SSYYYY-MM-DD [HH:MM:SS[.uuuuuu]]YYYY/MM/DD [HH:MM:SS[.uuuuuu]]YYYYMMDD [HH:MM:SS[.uuuuuu]]Sat, 24 May 2008 20:09:47 GMT2008-05-24T20:09:47Z- เวลา: epoch สำหรับวินาที ไมโคร มิลลิ และนาโน
ภูมิศาสตร์
- ชื่อหรือรหัสทวีป
- ชื่อหรือรหัสอนุทวีป
- ชื่อหรือรหัสภูมิภาค
- ชื่อหรือรหัสประเทศ ดู ISO_3166-1 ด้วย
- ชื่อเมือง
- ค่าละติจูดและลองจิจูดที่คั่นด้วยคอมมา
- ชื่อและรหัสพื้นที่การตลาดที่กำหนด (DMA)