Interfejs ML Kit Text Recognition API może rozpoznać tekst w dowolnym zestawie znaków opartym na łacińskim. Może też służyć do automatyzacji zadań związanych z wprowadzaniem danych, np. przetwarzania kart kredytowych, rachunków i wizytówek.
Najważniejsze funkcje
- Rozpoznawanie tekstu w językach opartych na alfabecie łacińskim Obsługa rozpoznawania tekstu za pomocą alfabetu łacińskiego
- Analiza struktury tekstu obsługuje wykrywanie słów, elementów, wierszy i akapitów.
- Identyfikacja języka tekstu Określa język rozpoznanego tekstu.
- Mała ilość aplikacji Na Androidzie interfejs API jest oferowany jako pakiet w pakiecie za pomocą Usług Google Play.
- Rozpoznawanie w czasie rzeczywistym umożliwia rozpoznawanie tekstu w czasie rzeczywistym na wielu różnych urządzeniach.
Struktura tekstu
Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. W skrócie:
Blokowanie to ciągły zestaw wierszy tekstowych, takich jak akapit lub kolumna.
Linia to ciągła lista słów na tej samej osi.
Element to ciągły zestaw znaków alfanumerycznych ("word") na tej samej osi w większości języków łacińskich lub słowo w innych językach.
Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach
Na ilustracji poniżej widać przykłady w porządku malejącym. Pierwszy zaznaczony blok (kolor błękitny) to blok tekstu. Drugi podświetlony na niebiesko bloki to linie tekstu. Trzecim wyróżnionym blokiem danych są ciemnozielone słowa.
W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożników, informacje o rotacji, wskaźnik ufności, rozpoznawane języki i rozpoznawany tekst.
Przykładowe wyniki

Zdjęcie: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Rozpoznawany tekst | |
---|---|
Tekst | Wege der Parlamentarischen Demokratie |
Bloki | (1 blok) |
Zablokuj 0 | |
---|---|
Tekst | Wege der Parlamentarischen Demokratie |
Ramka | (296, 665–796, 882) |
Punkty narożnikowe | (296, 719), (778, 665), (796, 828), (314, 882) |
Uznawany kod języka | de |
Linie | (3 wiersze) |
Wiersz 0 | |
---|---|
Tekst | Weder-der |
Ramka | (434, 678–670, 749) |
Punkty narożnikowe | (434, 705), (665, 678), (670, 722), (439, 749) |
Uznawany kod języka | de |
Wskaźnik ufności | 0,8766741 |
Stopień obrotu | –6 611 6457 |
Elementy | (2 elementy) |
Element 0 | |
---|---|
Tekst | Wege |
Ramka | (434, 689–575, 749) |
Punkty narożnikowe | (434, 705), (570, 689), (575, 733), (439, 749) |
Uznawany kod języka | de |
Wskaźnik ufności | 0,8964844 |
Stopień obrotu | –6 611 6457 |
Elementy | (4 elementy) |
Symbol 0 | |
---|---|
Tekst | W |
Ramka | (434, 698–500, 749) |
Punkty narożnikowe | (434, 706), (495, 698), (500, 741), (439, 749) |
Wskaźnik ufności | 0,87109375 |
Stopień obrotu | –6 611 646 |