ML Kit Text Recognition v2 API สามารถจดจําข้อความในชุดอักขระภาษาจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน API นี้ยังใช้สําหรับการป้อนข้อความอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตรได้ด้วย
ความสามารถหลัก
- จดจําข้อความในสคริปต์และภาษาต่างๆ รองรับการจดจําเสียงในสคริปต์ภาษาจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน
- วิเคราะห์โครงสร้างข้อความ รองรับการตรวจจับสัญลักษณ์ องค์ประกอบ บรรทัด และย่อหน้า
- ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
- การจดจําแบบเรียลไทม์ จดจําข้อความได้แบบเรียลไทม์ในอุปกรณ์หลายประเภท
โครงสร้างข้อความ
เครื่องมือจดจําข้อความจะแบ่งข้อความออกเป็นบล็อก บรรทัด องค์ประกอบ และสัญลักษณ์ พูดคร่าวๆ:
บล็อก คือชุดบรรทัดข้อความต่อเนื่องกัน เช่น ย่อหน้าหรือคอลัมน์
เส้นคือชุดคําที่อยู่ติดกันในแกนเดียวกัน และ
องค์ประกอบ คือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("คํา") ติดกันในแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคําในภาษาอื่นๆ
สัญลักษณ์เป็นอักขระที่เป็นตัวอักษรและตัวเลขคละกันตัวเดียวบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระในภาษาอื่นๆ
รูปภาพด้านล่างไฮไลต์ตัวอย่างของแต่ละเหตุการณ์ตามลําดับจากมากไปน้อย บล็อกที่ไฮไลต์แรกสีฟ้า (Cyan) คือบล็อกข้อความ บล็อกที่ไฮไลต์ชุดที่ 2 เป็นสีน้ําเงินคือบรรทัดข้อความ และสุดท้าย ชุดบล็อกที่ 3 ที่มีไฮไลต์สีฟ้าเป็นธีมมืด
สําหรับการบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงกรอบล้อมรอบ จุดมุม ข้อมูลการหมุนเวียน คะแนนความเชื่อมั่น ภาษาที่ยอมรับ และข้อความที่รู้จัก
ตัวอย่างผลการแข่ง

รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
ข้อความที่รู้จัก | |
---|---|
ข้อความ | Wege der Parlamentarischen Demokratie |
บล็อก | (1 บล็อก) |
บล็อก 0 | |
---|---|
ข้อความ | Wege der Parlamentarischen Demokratie |
กรอบ | (296, 665 - 796, 882) |
คะแนนจากมุม | (296, 719), (778, 665), (796, 828), (314, 882) |
รหัสภาษาที่รู้จัก | de |
บรรทัด | (3 บรรทัด) |
บรรทัด 0 | |
---|---|
ข้อความ | Wege Der |
กรอบ | (434, 678 - 670, 749) |
คะแนนจากมุม | (434, 705), (665, 678), (670, 722), (439, 749) |
รหัสภาษาที่รู้จัก | de |
คะแนนความมั่นใจ | 0.8766741 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (องค์ประกอบ 2 รายการ) |
องค์ประกอบ 0 | |
---|---|
ข้อความ | Wege |
กรอบ | (434, 689 - 575, 749) |
คะแนนจากมุม | (434, 705), (570, 689), (575, 733), (439, 749) |
รหัสภาษาที่รู้จัก | de |
คะแนนความมั่นใจ | 0.8964844 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (4 องค์ประกอบ) |
สัญลักษณ์ 0 | |
---|---|
ข้อความ | W |
กรอบ | (434, 698 - 500, 749) |
คะแนนจากมุม | (434, 706), (495, 698), (500, 741), (439, 749) |
คะแนนความมั่นใจ | 0.87109375 |
องศาการหมุน | -6.611646 |