Interfejs ML Kit Text Recognition v2 może rozpoznawać tekst w dowolnym zestawie znaków chińskiego, dewanagari, japońskiego, koreańskiego i łacińskiego. Interfejsu API można też użyć do automatyzacji zadań związanych z wprowadzaniem danych, takich jak przetwarzanie kart kredytowych, rachunków i kart firmowych.
Kluczowe funkcje
- Rozpoznawanie tekstu w różnych skryptach i językach Obsługa rozpoznawania tekstu w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim
- Analizuje strukturę tekstu Obsługa wykrywania symboli, elementów, linii i akapitów
- Określ język tekstu Określa język rozpoznanego tekstu
- Rozpoznawanie w czasie rzeczywistym: rozpoznaje tekst w czasie rzeczywistym na wielu różnych urządzeniach.
Struktura tekstu
Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. Ogólnie rzecz biorąc:
Blokowanie to zestaw sąsiadujących ze sobą wierszy tekstu, takich jak akapit czy kolumna.
Linia to ciągła lista słów na tej samej osi,
Element to ciągły zestaw znaków alfanumerycznych („słowo”) na tej samej osi w większości języków łacińskich lub słowo w innych językach
Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach.
Przykłady poniżej każdego z nich są przedstawione w porządku malejącym. Pierwszy zaznaczony błękitny blok to blok tekstu. Drugi zestaw podświetlonych na niebiesko bloków to wiersze tekstu. Trzecim wyróżnionym blokiem tekstu jest ciemnoniebieski.
W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożnika, informacje o rotacji, wskaźnik ufności, rozpoznane języki oraz rozpoznany tekst.
Przykładowe wyniki

Zdjęcie: Dietmar Rabich, Wikimedia Commons, „Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123”, CC BY-SA 4.0
Rozpoznany tekst | |
---|---|
Tekst | Nietuzinkowy wytwórnia papierosów Demokratie |
Bloki | (1 blok) |
Zablokuj 0 | |
---|---|
Tekst | Wege der Parlamentarischen Demokratie |
Ramka | (296, 665–796, 882) |
Punkty narożnika | (296, 719), (778, 665), (796, 828), (314, 882) |
Kod rozpoznanego języka | de |
Linie | (3 wiersze) |
Wiersz 0 | |
---|---|
Tekst | Wege der |
Ramka | (434, 678–670, 749) |
Punkty narożnika | (434, 705), (665, 678), (670, 722), (439, 749) |
Kod rozpoznanego języka | de |
Wskaźnik ufności | 0,8766741 |
Stopień rotacji | –6,6116457 |
Elementy | (2 elementy) |
Element 0 | |
---|---|
Tekst | Wege |
Ramka | (434, 689 - 575, 749) |
Punkty narożnika | (434, 705), (570, 689), (575, 733), (439, 749) |
Kod rozpoznanego języka | de |
Wskaźnik ufności | 0,8964844 |
Stopień rotacji | –6,6116457 |
Elementy | (4 elementy) |
Symbol 0 | |
---|---|
Tekst | Ś |
Ramka | (434, 698 - 500, 749) |
Punkty narożnika | (434, 706), (495, 698), (500, 741), (439, 749) |
Wskaźnik ufności | 0,87109375 |
Stopień rotacji | –6,611646 |