はじめに
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
テキスト分類アルゴリズムは、テキストデータを大規模に処理するさまざまなソフトウェア システムの中核となります。メール ソフトウェアは、テキスト分類を使用して、受信メールが受信トレイに送信されるか、迷惑メールフォルダに振り分けられるかを判断します。ディスカッション フォーラムでは、テキスト分類を使用して、コメントを不適切として報告するかどうかを判断しています。
これらは、テキスト分類を事前定義されたトピックのセットに分類する 2 つの例です。多くのトピック分類問題では、この分類は主にテキスト内のキーワードに基づいて行われます。
図 1: トピック分類を使用して、受信した迷惑メールを迷惑メールフォルダに振り分けます。
テキスト分類のもう 1 つの一般的な分類に感情分析があります。これは、テキスト コンテンツの極性(表現の考え方)を特定することです。これには、高評価/低評価の 2 項評価、または 1 ~ 5 の星評価などのより詳細なオプションがあります。感情分析の例には、Twitter の投稿を分析してブラックパンサーの映画が気に入ったかどうかを判断する、ウォルマートのレビューからナイキシューズの新ブランドについて一般ユーザーの意見を推測する、などがあります。
このガイドでは、テキスト分類の問題を解決するための主要な機械学習のベスト プラクティスについて説明します。主なポイント:
- 機械学習を使用してテキスト分類の問題を解決するための高レベルのエンドツーエンドのワークフロー
- テキスト分類問題に適したモデルを選択する方法
- TensorFlow を使用して任意のモデルを実装する方法
テキスト分類ワークフロー
ここでは、機械学習の問題の解決に使用されるワークフローの概要を示します。
図 2: 機械学習の問題を解決するためのワークフロー
以降のセクションでは、各ステップの詳細と、テキストデータ用にステップを実装する方法について説明します。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2022-09-27 UTC。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"必要な情報がない"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"複雑すぎる / 手順が多すぎる"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"最新ではない"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻訳に関する問題"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"サンプル / コードに問題がある"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"その他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"わかりやすい"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"問題の解決に役立った"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"その他"
}]
{"lastModified": "\u6700\u7d42\u66f4\u65b0\u65e5 2022-09-27 UTC\u3002"}
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2022-09-27 UTC。"]]