Dzięki ML Kit i interfejsowi cyfrowego rozpoznawania atramentu możesz rozpoznawać napisany ręcznie tekst na setkach języków i klasyfikować szkice. Interfejs cyfrowy rozpoznawanie atramentu korzysta z tej samej technologii, która obsługuje rozpoznawanie pisma odręcznego w Gboard, Tłumaczu Google i w grze Quick, Draw!.
Rozpoznawanie cyfrowych atramentów umożliwia pisanie na ekranie zamiast pisanie na klawiaturze wirtualnej. Dzięki temu użytkownicy mogą rysować znaki, które nie są dostępne na klawiaturze, na przykład ệ, अ lub 森 w przypadku klawiatur łacińskich. Interfejs API może też tworzyć transkrypcje odręcznych notatek i rozpoznawać ręcznie rysowane kształty oraz emotikony.
Rozpoznawanie cyfrowych atramentów działa w odpowiedzi na ruchy użytkownika na ekranie. Jeśli chcesz odczytać tekst z obrazów zrobionych aparatem, użyj interfejsu Text Recognition API.
Rozpoznawanie cyfrowych atramentów działa w trybie offline i jest obsługiwane na Androidzie i iOS.
Najważniejsze funkcje
- Konwertuje tekst napisany odręcznie na sekwencje znaków Unicode.
- działa na urządzeniu niemal w czasie rzeczywistym,
- Pismo odręczne użytkownika pozostaje na urządzeniu. Rozpoznawanie odbywa się bez połączenia z siecią.
- Obsługa ponad 300 języków i ponad 25 systemów pisma, w tym wszystkich głównych języków, a także chiński, japoński, koreański, arabski i cyrylica. Zobacz pełną listę obsługiwanych języków.
- Rozpoznaje emotikony i podstawowe kształty.
- Utrzymuje mało miejsca na urządzeniu, dynamicznie pobierając pakiety językowe.
Rozpoznawanie przyjmuje obiekt Ink
jako dane wejściowe. Ink
to wektorowa informacja o tym, co użytkownik zapisał na ekranie: sekwencja kresek, z których każdy jest listą współrzędnych z informacjami o czasie nazywanym punktami styczności z klientem. Pociąg można rozpocząć, gdy użytkownik umieści rysik lub palec, a potem go zakończy. Parametr Ink
jest przekazywany do narzędzia do rozpoznawania, które zwraca co najmniej jeden możliwy wynik rozpoznawania z pewnością siebie.
Przykłady
Pismo angielskie
Obraz po lewej stronie pokazuje, co użytkownik zobaczył na ekranie. Obraz po prawej stronie to odpowiedni obiekt Ink
. Zawiera kreski z czerwonymi kropkami reprezentującymi punkty styczności z klientem w każdym ujęciu.
Występują cztery style. Pierwsze 2 kreski w obiekcie Ink
wyglądają tak:
Atrament | ||
Styl 1 | x | 392, 391, 389, 287, ... |
r. | 52, 60, 76, 97... | |
T | 0, 37, 56, 75 i ... | |
Styl 2 | x | 497, 494, 493, 490... |
r. | 167, 165, 165, 165... | |
T | 694, 742, 751, 770... | |
… |
Wysłanie tego Ink
do rozpoznawalnego języka angielskiego zwraca kilka możliwych transkrypcji zawierających 5 lub 6 znaków.
Kolejność jest malejąca z pewnością:
Rozpoznawanie wyników | |
Uznanie nr 1 | ręcznie |
Uznanie nr 2 | podręczna |
Uznanie nr 3 | twarda |
Uznanie nr 4 | Handu |
Uznanie nr 5 | Handwe |
Szkice emotikonów
Obraz po lewej stronie pokazuje, co użytkownik zobaczył na ekranie. Obraz po prawej stronie to odpowiedni obiekt Ink
. Zawiera kreski z czerwonymi kropkami reprezentującymi punkty styczności z klientem w każdym ujęciu.
Obiekt Ink
zawiera 6 kresek.
Atrament | ||
Styl 1 | x | 269, 266, 262, 255... |
r. | 40, 40, 40, 41... | |
T | 0, 36, 56, 75 i ... | |
Styl 2 | x | 179, 182, 183, 185... |
r. | 157, 158, 159, 160... | |
T | 2475, 2522, 2531, 2541... | |
… |
Gdy wyślesz ten token Ink
do rozpoznawania emotikonów, możesz otrzymać kilka możliwych transkrypcji, posortowanych według stopnia ufności:
Rozpoznawanie wyników | |
Uznanie nr 1 | 😂 (U+1F62D) |
Uznanie nr 2 | 😅 (U+1F605) |
Uznanie nr 3 | 😹 (U+1F639) |
Uznanie nr 4 | 😄 (U+1F604) |
Uznanie nr 5 | 😆 (U+1F606) |