ML Kit Text Recognition API สามารถจดจําข้อความในชุดอักขระละติน นอกจากนี้ยังสามารถใช้สําหรับงานป้อนข้อมูลอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตร
ความสามารถหลัก
- จดจําข้อความในภาษาละติน รองรับการจดจําข้อความโดยใช้สคริปต์ภาษาละติน
- วิเคราะห์โครงสร้างข้อความ รองรับการตรวจจับคํา/องค์ประกอบ บรรทัด และย่อหน้า
- ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
- รอยเท้าของแอปพลิเคชันขนาดเล็ก ใน Android มี API ให้ใช้งานเป็นไลบรารีแบบไม่ได้รวมกลุ่มผ่านบริการ Google Play
- การจดจําแบบเรียลไทม์ สามารถจดจําข้อความแบบเรียลไทม์ได้ในอุปกรณ์ที่หลากหลาย
โครงสร้างข้อความ
การรู้จําข้อความจะแบ่งข้อความออกเป็นบล็อก เส้น องค์ประกอบ และสัญลักษณ์ พูดคร่าวๆ:
บล็อกคือชุดบรรทัดข้อความต่อเนื่อง เช่น ย่อหน้าหรือคอลัมน์
เส้นคือชุดคําอย่างต่อเนื่องบนแกนเดียวกัน และ
องค์ประกอบ คือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("word") ที่ต่อเนื่องกันบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคําอื่นๆ
สัญลักษณ์เป็นอักขระที่เป็นตัวอักษรและตัวเลขคละกัน 1 ตัวในแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระหนึ่งในภาษาอื่นๆ
รูปภาพด้านล่างไฮไลต์ตัวอย่างของแต่ละรูปแบบตามลําดับจากมากไปน้อย บล็อกแรกที่เน้นสีน้ําเงินเขียวคือบล็อกข้อความ บล็อกที่ไฮไลต์ชุดที่ 2 เป็นสีน้ําเงินคือบรรทัดข้อความ สุดท้าย ชุดก้อนที่ 3 ที่ไฮไลต์เป็นสีฟ้าเข้มคือ Words
สําหรับบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงกรอบล้อมรอบ มุมมุม ข้อมูลการหมุน คะแนนความเชื่อมั่น ภาษาที่ระบุได้ และข้อความที่รู้จัก
ตัวอย่างผลการแข่ง

รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
ข้อความที่ระบุได้ | |
---|---|
ข้อความ | เวจ der parlamentarischen Demokratie |
บล็อก | (บล็อก 1 รายการ) |
บล็อก 0 | |
---|---|
ข้อความ | Wege der parlamentarischen Demokratie |
กรอบ | (296, 665 - 796, 882) |
คะแนนมุม | (296, 719), (778, 665), (796, 828), (314, 882) |
รหัสภาษาที่ยอมรับ | de |
บรรทัด | (3 บรรทัด) |
บรรทัด 0 | |
---|---|
ข้อความ | เวจ เดอร์ |
กรอบ | (434, 678 - 670, 749) |
คะแนนมุม | (434, 705), (665, 678), (670, 722), (439, 749) |
รหัสภาษาที่ยอมรับ | de |
คะแนนความมั่นใจ | 0.8766741 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (องค์ประกอบ 2 รายการ) |
องค์ประกอบ 0 | |
---|---|
ข้อความ | เวจ |
กรอบ | (434, 689 - 575, 749) |
คะแนนมุม | (434, 705), (570, 689), (575, 733), (439, 749) |
รหัสภาษาที่ยอมรับ | de |
คะแนนความมั่นใจ | 0.8964844 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (4 องค์ประกอบ) |
สัญลักษณ์ 0 | |
---|---|
ข้อความ | W |
กรอบ | (434, 698 - 500, 749) |
คะแนนมุม | (434, 706), (495, 698), (500, 741), (439, 749) |
คะแนนความมั่นใจ | 0.87109375 |
องศาการหมุน | -6.611646 |