概要
リリースノート
既知の問題
早期アクセスプログラム
ML Kit から Firebase への移行
Mobile Vision からの移行
GenAI
概要
要約（ベータ版）
校正（ベータ版）
書き換え（ベータ版）
画像の説明（ベータ版）
音声認識（アルファ版）
プロンプト（ベータ版）
AICore デベロッパープレビュープログラム
ビジョン
テキスト認識 v2
顔検出
顔メッシュ検出（ベータ版）
姿勢検出（ベータ版）
自撮り写真の分類（ベータ版）
サブジェクトセグメンテーション（ベータ版）
- 概要
- Android
ドキュメントスキャナ
- 概要
- Android
バーコードスキャン
画像ラベル付け
- 概要
- ベースモデル
- カスタムモデル
  - Android
  - iOS
- AutoML Vision Edge
オブジェクトの検出とトラッキング
- 概要
- ベースモデル
  - Android
  - iOS
- カスタムモデル
  - Android
  - iOS
デジタルインク認識
カスタムモデル
自然言語
言語識別
Translation
スマートリプライ
エンティティ抽出（ベータ版）
ヒント
Android でのモデルのインストールパス
Android アプリのパッケージサイズを小さくする
コロフォン
利用規約とプライバシー
- 概要
- 生成 AI API 利用規約
Android データ開示
iOS データ開示

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

テキスト認識 v2

ML Kit Text Recognition v2 API は、中国語、デバナーガリ語、日本語、韓国語、ラテン文字セットのテキストを認識できます。また、クレジットカード、領収書、名刺の処理などのデータ入力タスクを自動化するためにも使用できます。

主な機能

さまざまな文字と言語のテキストを認識 中国語、デバナーガリ文字、日本語、韓国語、ラテン文字のテキストの認識をサポートします。
テキストの構造の分析記号、要素、行、段落の検出をサポートします。
テキストの言語の確認 認識したテキストの言語を指定します
リアルタイム認識 さまざまなデバイスでテキストをリアルタイムで認識できます。

テキストの構造

テキスト認識ツールは、テキストをブロック、線、要素、記号に分割します。大まかな流れは次のとおりです。

ブロックは段落や列などの連続したテキスト行であり、
Line は、同じ軸上で連続した単語のセットです。
要素は、ほとんどのラテン言語では同じ軸上に連続した英数字（「単語」）の集合であり、それ以外の言語では 1 つの単語です。
Symbol は、ほとんどのラテン文字で同じ軸に 1 つの英数字（その他の言語では 1 文字）です。

以下の画像は、それぞれの例を降順で示しています。最初にハイライトされたシアンのブロックは、テキストのブロックです。青色のハイライト表示されたブロックの 2 つ目のセットは、テキスト行です。最後に、濃い青色でハイライト表示された 3 つ目のブロックは単語です。

検出されたすべてのブロック、線、要素、記号について、API は境界ボックス、角のポイント、回転情報、信頼スコア、認識された言語、認識されたテキストを返します。

検索結果の例

認識されたテキスト
テキスト	Wege der parlamentarischen 民主主義者
ブロック	（1 ブロック）

ブロック 0
テキスト	ウェゲデルパラメンタリッシェンデモクラティエ
フレーム	（296, 665 ～ 796, 882）
角のポイント	（296, 719）、（778, 665）、（796, 828）、（314, 882）
認識された言語コード	de
線	（3 行）

行 0
テキスト	ヴェーゲデル
フレーム	（434、678 ～ 670、749）
角のポイント	（434, 705）、（665, 678）、（670, 722）、（439, 749）
認識された言語コード	de
信頼スコア	0.8766741
回転の度数	-6.6116457
要素	（2 要素）

要素 0
テキスト	ウェージ
フレーム	（434、689 ～ 575、749）
角のポイント	（434, 705）、（570, 689）、（575, 733）、（439, 749）
認識された言語コード	de
信頼スコア	0.8964844
回転の度数	-6.6116457
要素	（4 要素）

記号 0
テキスト	W
フレーム	（434、698 ～ 500、749）
角のポイント	（434, 706）、（495, 698）、（500, 741）、（439, 749）
信頼スコア	0.87109375
回転の度数	-6.611646

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2025-07-25 UTC。