การจดจําข้อความ

จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

ML Kit Text Recognition API สามารถจดจําข้อความในชุดอักขระละติน นอกจากนี้ยังสามารถใช้สําหรับงานป้อนข้อมูลอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตร

iOS Android

ความสามารถหลัก

  • จดจําข้อความในภาษาละติน รองรับการจดจําข้อความโดยใช้สคริปต์ภาษาละติน
  • วิเคราะห์โครงสร้างข้อความ รองรับการตรวจจับคํา/องค์ประกอบ บรรทัด และย่อหน้า
  • ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
  • รอยเท้าของแอปพลิเคชันขนาดเล็ก ใน Android มี API ให้ใช้งานเป็นไลบรารีแบบไม่ได้รวมกลุ่มผ่านบริการ Google Play
  • การจดจําแบบเรียลไทม์ สามารถจดจําข้อความแบบเรียลไทม์ได้ในอุปกรณ์ที่หลากหลาย

โครงสร้างข้อความ

การรู้จําข้อความจะแบ่งข้อความออกเป็นบล็อก เส้น องค์ประกอบ และสัญลักษณ์ พูดคร่าวๆ:

  • บล็อกคือชุดบรรทัดข้อความต่อเนื่อง เช่น ย่อหน้าหรือคอลัมน์

  • เส้นคือชุดคําอย่างต่อเนื่องบนแกนเดียวกัน และ

  • องค์ประกอบ คือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("word") ที่ต่อเนื่องกันบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคําอื่นๆ

  • สัญลักษณ์เป็นอักขระที่เป็นตัวอักษรและตัวเลขคละกัน 1 ตัวในแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระหนึ่งในภาษาอื่นๆ

รูปภาพด้านล่างไฮไลต์ตัวอย่างของแต่ละรูปแบบตามลําดับจากมากไปน้อย บล็อกแรกที่เน้นสีน้ําเงินเขียวคือบล็อกข้อความ บล็อกที่ไฮไลต์ชุดที่ 2 เป็นสีน้ําเงินคือบรรทัดข้อความ สุดท้าย ชุดก้อนที่ 3 ที่ไฮไลต์เป็นสีฟ้าเข้มคือ Words

สําหรับบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงกรอบล้อมรอบ มุมมุม ข้อมูลการหมุน คะแนนความเชื่อมั่น ภาษาที่ระบุได้ และข้อความที่รู้จัก

ตัวอย่างผลการแข่ง


รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
ข้อความที่ระบุได้
ข้อความ เวจ
der parlamentarischen
Demokratie
บล็อก (บล็อก 1 รายการ)
บล็อก 0
ข้อความ Wege der parlamentarischen Demokratie
กรอบ (296, 665 - 796, 882)
คะแนนมุม (296, 719), (778, 665), (796, 828), (314, 882)
รหัสภาษาที่ยอมรับ de
บรรทัด (3 บรรทัด)
บรรทัด 0
ข้อความ เวจ เดอร์
กรอบ (434, 678 - 670, 749)
คะแนนมุม (434, 705), (665, 678), (670, 722), (439, 749)
รหัสภาษาที่ยอมรับ de
คะแนนความมั่นใจ 0.8766741
องศาการหมุน -6.6116457
องค์ประกอบ (องค์ประกอบ 2 รายการ)
องค์ประกอบ 0
ข้อความ เวจ
กรอบ (434, 689 - 575, 749)
คะแนนมุม (434, 705), (570, 689), (575, 733), (439, 749)
รหัสภาษาที่ยอมรับ de
คะแนนความมั่นใจ 0.8964844
องศาการหมุน -6.6116457
องค์ประกอบ (4 องค์ประกอบ)
สัญลักษณ์ 0
ข้อความ W
กรอบ (434, 698 - 500, 749)
คะแนนมุม (434, 706), (495, 698), (500, 741), (439, 749)
คะแนนความมั่นใจ 0.87109375
องศาการหมุน -6.611646