Pengenalan teks v2

ML Kit Text Recognition v2 API dapat mengenali teks dalam himpunan karakter China, Devanagari, Jepang, Korea, dan Latin. API juga dapat digunakan untuk mengotomatiskan tugas entri data seperti memproses kartu kredit, tanda terima, dan kartu nama.

iOS Android

Kemampuan utama

  • Mengenali teks dalam berbagai skrip dan bahasa Mendukung pengenalan teks dalam skrip bahasa China, Devanagari, Jepang, Korea, dan Latin
  • Menganalisis struktur teks Mendukung deteksi simbol, elemen, baris, dan paragraf
  • Identifikasi bahasa teks Mengidentifikasi bahasa teks yang dikenali
  • Pengenalan real-time Dapat mengenali teks secara real-time di berbagai perangkat

Struktur teks

Pengenal Teks mengelompokkan teks ke dalam blok, garis, elemen, dan simbol. Secara kasar:

  • Block adalah kumpulan baris teks yang berdekatan, seperti paragraf atau kolom,

  • Baris adalah kumpulan kata yang berdekatan pada sumbu yang sama, dan

  • Elemen adalah rangkaian karakter alfanumerik yang berdekatan ("kata") pada sumbu yang sama di sebagian besar bahasa Latin, atau kata dalam bahasa lain

  • Simbol adalah karakter alfanumerik tunggal pada sumbu yang sama di sebagian besar bahasa Latin, atau karakter dalam bahasa lain

Gambar di bawah ini menyoroti contoh setiap item dalam urutan menurun. Blok pertama yang ditandai, adalah sian, adalah Blok teks. Kumpulan kedua blok yang ditandai, dalam warna biru, adalah Baris teks. Akhirnya, kumpulan ketiga blok yang ditandai, dalam warna biru tua, adalah Words.

Untuk semua blok, garis, elemen, dan simbol yang terdeteksi, API akan menampilkan kotak pembatas, titik sudut, informasi rotasi, skor keyakinan, bahasa yang dikenali, dan teks yang dikenali.

Hasil contoh


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Teks yang Dikenali
Teks Wege
der parlamentarischen
Demokratie
Blok (1 blok)
Blok 0
Teks Wege der parlamentarischen Demokratie
Bingkai (296, 665 - 796, 882)
Titik Sudut (296, 719), (778, 665), (796, 828), (314, 882)
Kode Bahasa yang Dikenali de
Jalur (3 baris)
Baris 0
Teks Wege der
Bingkai (021, 678 - 670, 749)
Titik Sudut (434, 705), (665, 678), (670, 722), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8766741
Derajat Rotasi -6,6116457
Elemen (2 elemen)
Elemen 0
Teks Wege
Bingkai (021) 689 - 575, 749
Titik Sudut (434, 705), (570, 689), (575, 733), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8964844
Derajat Rotasi -6,6116457
Elemen (4 elemen)
Simbol 0
Teks W
Bingkai (021, 698 - 500, 749)
Titik Sudut (434, 706), (495, 698), (500, 741), (439, 749)
Skor Keyakinan 0,87109375
Derajat Rotasi -6,611646