Rozpoznawanie cyfrowych atramentów

Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Dzięki ML Kit i interfejsowi cyfrowego rozpoznawania atramentu możesz rozpoznawać napisany ręcznie tekst na setkach języków i klasyfikować szkice. Interfejs cyfrowy rozpoznawanie atramentu korzysta z tej samej technologii, która obsługuje rozpoznawanie pisma odręcznego w Gboard, Tłumaczu Google i w grze Quick, Draw!.

Rozpoznawanie cyfrowych atramentów umożliwia pisanie na ekranie zamiast pisanie na klawiaturze wirtualnej. Dzięki temu użytkownicy mogą rysować znaki, które nie są dostępne na klawiaturze, na przykład ệ, अ lub 森 w przypadku klawiatur łacińskich. Interfejs API może też tworzyć transkrypcje odręcznych notatek i rozpoznawać ręcznie rysowane kształty oraz emotikony.

Rozpoznawanie cyfrowych atramentów działa w odpowiedzi na ruchy użytkownika na ekranie. Jeśli chcesz odczytać tekst z obrazów zrobionych aparatem, użyj interfejsu Text Recognition API.

Rozpoznawanie cyfrowych atramentów działa w trybie offline i jest obsługiwane na Androidzie i iOS.

iOS Android

Najważniejsze funkcje

  • Konwertuje tekst napisany odręcznie na sekwencje znaków Unicode.
  • działa na urządzeniu niemal w czasie rzeczywistym,
  • Pismo odręczne użytkownika pozostaje na urządzeniu. Rozpoznawanie odbywa się bez połączenia z siecią.
  • Obsługa ponad 300 języków i ponad 25 systemów pisma, w tym wszystkich głównych języków, a także chiński, japoński, koreański, arabski i cyrylica. Zobacz pełną listę obsługiwanych języków.
  • Rozpoznaje emotikony i podstawowe kształty.
  • Utrzymuje mało miejsca na urządzeniu, dynamicznie pobierając pakiety językowe.

Rozpoznawanie przyjmuje obiekt Ink jako dane wejściowe. Ink to wektorowa informacja o tym, co użytkownik zapisał na ekranie: sekwencja kresek, z których każdy jest listą współrzędnych z informacjami o czasie nazywanym punktami styczności z klientem. Pociąg można rozpocząć, gdy użytkownik umieści rysik lub palec, a potem go zakończy. Parametr Ink jest przekazywany do narzędzia do rozpoznawania, które zwraca co najmniej jeden możliwy wynik rozpoznawania z pewnością siebie.

Przykłady

Pismo angielskie

Obraz po lewej stronie pokazuje, co użytkownik zobaczył na ekranie. Obraz po prawej stronie to odpowiedni obiekt Ink. Zawiera kreski z czerwonymi kropkami reprezentującymi punkty styczności z klientem w każdym ujęciu.

    

Występują cztery style. Pierwsze 2 kreski w obiekcie Ink wyglądają tak:

Atrament
Styl 1 x 392, 391, 389, 287, ...
r. 52, 60, 76, 97...
T 0, 37, 56, 75 i ...
Styl 2 x 497, 494, 493, 490...
r. 167, 165, 165, 165...
T 694, 742, 751, 770...

Wysłanie tego Ink do rozpoznawalnego języka angielskiego zwraca kilka możliwych transkrypcji zawierających 5 lub 6 znaków. Kolejność jest malejąca z pewnością:

Rozpoznawanie wyników
Uznanie nr 1 ręcznie
Uznanie nr 2 podręczna
Uznanie nr 3 twarda
Uznanie nr 4 Handu
Uznanie nr 5 Handwe

Szkice emotikonów

Obraz po lewej stronie pokazuje, co użytkownik zobaczył na ekranie. Obraz po prawej stronie to odpowiedni obiekt Ink. Zawiera kreski z czerwonymi kropkami reprezentującymi punkty styczności z klientem w każdym ujęciu.

    

Obiekt Ink zawiera 6 kresek.

           

Atrament
Styl 1 x 269, 266, 262, 255...
r. 40, 40, 40, 41...
T 0, 36, 56, 75 i ...
Styl 2 x 179, 182, 183, 185...
r. 157, 158, 159, 160...
T 2475, 2522, 2531, 2541...

Gdy wyślesz ten token Ink do rozpoznawania emotikonów, możesz otrzymać kilka możliwych transkrypcji, posortowanych według stopnia ufności:

Rozpoznawanie wyników
Uznanie nr 1 😂 (U+1F62D)
Uznanie nr 2 😅 (U+1F605)
Uznanie nr 3 😹 (U+1F639)
Uznanie nr 4 😄 (U+1F604)
Uznanie nr 5 😆 (U+1F606)