ML Kit Text Recognition v2 API는 한국어, 중국어, 데바나가리어, 한국어, 라틴 문자 집합의 텍스트를 인식할 수 있습니다. API를 사용하여 신용카드, 영수증, 명함 처리와 같은 데이터 입력 작업을 자동화할 수도 있습니다.
주요 기능
- 다양한 스크립트와 언어에서 텍스트 인식 한국어, 중국어, 데바나가리어, 일본어, 라틴어 스크립트의 텍스트 인식을 지원합니다.
- 텍스트 구조 분석 기호, 요소, 줄, 단락 감지를 지원합니다.
- 텍스트 언어 식별 인식된 텍스트의 언어 식별
- 실시간 인식 다양한 기기에서 실시간으로 텍스트를 인식할 수 있습니다.
텍스트 구조
텍스트 인식기는 텍스트를 블록, 선, 요소, 기호로 분류합니다. 대략적으로 설명하면 다음과 같습니다.
블록은 단락이나 열과 같은 연속된 텍스트 행 집합입니다.
선은 동일한 축에 있는 연속된 단어 집합입니다.
요소는 대부분의 라틴 언어에서 같은 축에 있는 연속된 영숫자 문자 ('단어') 또는 다른 언어의 단어입니다.
기호는 대부분의 라틴 언어에서 같은 축에 있는 영숫자 문자 1개 또는 다른 언어의 문자입니다.
아래 이미지는 각각의 예시를 내림차순으로 보여줍니다. 초록색으로 표시된 첫 번째 블록은 텍스트 블록입니다. 파란색으로 강조표시된 두 번째 블록 세트는 텍스트 행입니다. 마지막으로, 세 번째 강조표시된 블록 세트(진한 파란색)는 단어입니다.
감지된 모든 블록, 선, 요소, 기호에 대해 API가 경계 상자, 모서리 지점, 회전 정보, 신뢰도 점수, 인식된 언어, 인식된 텍스트를 반환합니다.
결과 예시

사진: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
인식된 텍스트 | |
---|---|
텍스트 | 베게 데르 팔라멘타리첸 Demokratie |
블록 | (1개 블록) |
블록 0 | |
---|---|
텍스트 | 베게 데르 팔라멘타리첸 민주크라티 |
프레임 | (296, 665~796, 882) |
코너 포인트 | (296, 719), (778, 665), (796, 828), (314, 882) |
인식된 언어 코드 | de |
노선 | (3줄) |
0행 | |
---|---|
텍스트 | 베게 데르 |
프레임 | (434, 678 - 670, 749) |
코너 포인트 | (434, 705), (665, 678), (670, 722), (439, 749) |
인식된 언어 코드 | de |
신뢰도 점수 | 0.8766741 |
회전 각도 | -6.6116457 |
요소 | (2개 요소) |
엘리먼트 0 | |
---|---|
텍스트 | 베게 |
프레임 | (434, 689 - 575, 749) |
코너 포인트 | (434, 705), (570, 689), (575, 733), (439, 749) |
인식된 언어 코드 | de |
신뢰도 점수 | 0.8964844 |
회전 각도 | -6.6116457 |
요소 | (4개 요소) |
기호 0 | |
---|---|
텍스트 | W |
프레임 | (434, 698 - 500, 749) |
코너 포인트 | (434, 706), (495, 698), (500, 741), (439, 749) |
신뢰도 점수 | 0.87109375 |
회전 각도 | -6.611646 |