Rozpoznawanie tekstu

Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Interfejs ML Kit Text Recognition API może rozpoznać tekst w dowolnym zestawie znaków opartym na łacińskim. Może też służyć do automatyzacji zadań związanych z wprowadzaniem danych, np. przetwarzania kart kredytowych, rachunków i wizytówek.

iOS Android

Najważniejsze funkcje

  • Rozpoznawanie tekstu w językach opartych na alfabecie łacińskim Obsługa rozpoznawania tekstu za pomocą alfabetu łacińskiego
  • Analiza struktury tekstu obsługuje wykrywanie słów, elementów, wierszy i akapitów.
  • Identyfikacja języka tekstu Określa język rozpoznanego tekstu.
  • Mała ilość aplikacji Na Androidzie interfejs API jest oferowany jako pakiet w pakiecie za pomocą Usług Google Play.
  • Rozpoznawanie w czasie rzeczywistym umożliwia rozpoznawanie tekstu w czasie rzeczywistym na wielu różnych urządzeniach.

Struktura tekstu

Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. W skrócie:

  • Blokowanie to ciągły zestaw wierszy tekstowych, takich jak akapit lub kolumna.

  • Linia to ciągła lista słów na tej samej osi.

  • Element to ciągły zestaw znaków alfanumerycznych ("word") na tej samej osi w większości języków łacińskich lub słowo w innych językach.

  • Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach

Na ilustracji poniżej widać przykłady w porządku malejącym. Pierwszy zaznaczony blok (kolor błękitny) to blok tekstu. Drugi podświetlony na niebiesko bloki to linie tekstu. Trzecim wyróżnionym blokiem danych są ciemnozielone słowa.

W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożników, informacje o rotacji, wskaźnik ufności, rozpoznawane języki i rozpoznawany tekst.

Przykładowe wyniki


Zdjęcie: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Rozpoznawany tekst
Tekst Wege
der Parlamentarischen
Demokratie
Bloki (1 blok)
Zablokuj 0
Tekst Wege der Parlamentarischen Demokratie
Ramka (296, 665–796, 882)
Punkty narożnikowe (296, 719), (778, 665), (796, 828), (314, 882)
Uznawany kod języka de
Linie (3 wiersze)
Wiersz 0
Tekst Weder-der
Ramka (434, 678–670, 749)
Punkty narożnikowe (434, 705), (665, 678), (670, 722), (439, 749)
Uznawany kod języka de
Wskaźnik ufności 0,8766741
Stopień obrotu –6 611 6457
Elementy (2 elementy)
Element 0
Tekst Wege
Ramka (434, 689–575, 749)
Punkty narożnikowe (434, 705), (570, 689), (575, 733), (439, 749)
Uznawany kod języka de
Wskaźnik ufności 0,8964844
Stopień obrotu –6 611 6457
Elementy (4 elementy)
Symbol 0
Tekst W
Ramka (434, 698–500, 749)
Punkty narożnikowe (434, 706), (495, 698), (500, 741), (439, 749)
Wskaźnik ufności 0,87109375
Stopień obrotu –6 611 646