การจดจําข้อความ v2

ML Kit Text Recognition v2 API สามารถจดจําข้อความในชุดอักขระภาษาจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน API นี้ยังใช้สําหรับการป้อนข้อความอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตรได้ด้วย

iOS Android

ความสามารถหลัก

  • จดจําข้อความในสคริปต์และภาษาต่างๆ รองรับการจดจําเสียงในสคริปต์ภาษาจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน
  • วิเคราะห์โครงสร้างข้อความ รองรับการตรวจจับสัญลักษณ์ องค์ประกอบ บรรทัด และย่อหน้า
  • ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
  • การจดจําแบบเรียลไทม์ จดจําข้อความได้แบบเรียลไทม์ในอุปกรณ์หลายประเภท

โครงสร้างข้อความ

เครื่องมือจดจําข้อความจะแบ่งข้อความออกเป็นบล็อก บรรทัด องค์ประกอบ และสัญลักษณ์ พูดคร่าวๆ:

  • บล็อก คือชุดบรรทัดข้อความต่อเนื่องกัน เช่น ย่อหน้าหรือคอลัมน์

  • เส้นคือชุดคําที่อยู่ติดกันในแกนเดียวกัน และ

  • องค์ประกอบ คือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("คํา") ติดกันในแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคําในภาษาอื่นๆ

  • สัญลักษณ์เป็นอักขระที่เป็นตัวอักษรและตัวเลขคละกันตัวเดียวบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระในภาษาอื่นๆ

รูปภาพด้านล่างไฮไลต์ตัวอย่างของแต่ละเหตุการณ์ตามลําดับจากมากไปน้อย บล็อกที่ไฮไลต์แรกสีฟ้า (Cyan) คือบล็อกข้อความ บล็อกที่ไฮไลต์ชุดที่ 2 เป็นสีน้ําเงินคือบรรทัดข้อความ และสุดท้าย ชุดบล็อกที่ 3 ที่มีไฮไลต์สีฟ้าเป็นธีมมืด

สําหรับการบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงกรอบล้อมรอบ จุดมุม ข้อมูลการหมุนเวียน คะแนนความเชื่อมั่น ภาษาที่ยอมรับ และข้อความที่รู้จัก

ตัวอย่างผลการแข่ง


รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
ข้อความที่รู้จัก
ข้อความ Wege
der Parlamentarischen
Demokratie
บล็อก (1 บล็อก)
บล็อก 0
ข้อความ Wege der Parlamentarischen Demokratie
กรอบ (296, 665 - 796, 882)
คะแนนจากมุม (296, 719), (778, 665), (796, 828), (314, 882)
รหัสภาษาที่รู้จัก de
บรรทัด (3 บรรทัด)
บรรทัด 0
ข้อความ Wege Der
กรอบ (434, 678 - 670, 749)
คะแนนจากมุม (434, 705), (665, 678), (670, 722), (439, 749)
รหัสภาษาที่รู้จัก de
คะแนนความมั่นใจ 0.8766741
องศาการหมุน -6.6116457
องค์ประกอบ (องค์ประกอบ 2 รายการ)
องค์ประกอบ 0
ข้อความ Wege
กรอบ (434, 689 - 575, 749)
คะแนนจากมุม (434, 705), (570, 689), (575, 733), (439, 749)
รหัสภาษาที่รู้จัก de
คะแนนความมั่นใจ 0.8964844
องศาการหมุน -6.6116457
องค์ประกอบ (4 องค์ประกอบ)
สัญลักษณ์ 0
ข้อความ W
กรอบ (434, 698 - 500, 749)
คะแนนจากมุม (434, 706), (495, 698), (500, 741), (439, 749)
คะแนนความมั่นใจ 0.87109375
องศาการหมุน -6.611646