ML Kit Text Recognition v2 API 可辨識任何中文、梵文字母、日文、韓文和拉丁字元集的文字。這個 API 也可用來自動處理資料輸入工作,例如處理信用卡、收據和名片。
主要功能
- 辨識各種指令碼和語言的文字:支援辨識中文、梵文字母、日文、韓文和拉丁字母的文字
- 分析文字結構:支援偵測符號、元素、線條和段落
- 辨識文字語言:辨識可辨識文字的語言
- 即時辨識:可在多種裝置上即時辨識文字
文字結構
文字辨識器會將文字分成區塊、行、元素和符號。大聲說出:
「區塊」是一組連續的文字行,例如段落或資料欄。
「線條」是同一軸上的連續字詞組合,且
「元素」是一組連續的英數字元 (「字詞」),在大部分拉丁語系中都在同一個軸上,也可能是其他語言的單字
「符號」是單一拉丁字母在相同軸上的單一英數字元,或其他其他語言中的字元
下方圖片以低順序,分別列出這些範例。第一個醒目顯示的青色區塊是青色區塊。第二組以藍色醒目顯示的區塊是文字行。最後,第三組醒目顯示的深色區塊是深藍色,代表 Words。
針對所有偵測到的區塊、行、元素和符號,API 會傳回定界框、角落點、旋轉資訊、可信度分數、可辨識的語言和可辨識的文字。
搜尋結果範例

相片: Dietmar Rabich、 Wikimedia Commons、 "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
辨識的文字 | |
---|---|
文字 | 校長 學士學位 民主國 |
模塊 | (1 個區塊) |
區塊 0 | |
---|---|
文字 | 民主黨國民 |
頁框 | (296、665 - 796、882) |
邊角 | (296, 719), (778, 665), (796, 828), (314, 882) |
已識別的語言代碼 | de |
路線 | (3 行) |
第 0 行 | |
---|---|
文字 | 韋格德 |
頁框 | (434、678 - 670、749) |
邊角 | (434, 705), (665, 678), (670, 722), (439, 749) |
已識別的語言代碼 | de |
可信度分數 | 0.8766741 |
旋轉角度 | -6.6116457 |
元素 | (2 個元素) |
元素 0 | |
---|---|
文字 | 微 |
頁框 | (434、689 - 575、749) |
邊角 | (434, 705), (570, 689), (575, 733), (439, 749) |
已識別的語言代碼 | de |
可信度分數 | 0.8964844 |
旋轉角度 | -6.6116457 |
元素 | (4 個元素) |
符號 0 | |
---|---|
文字 | 三 |
頁框 | (434、698 - 500、749) |
邊角 | (434, 706), (495, 698), (500, 741), (439, 749) |
可信度分數 | 0.87109375 |
旋轉角度 | -6.611646 |