機械学習の概要

機械学習（ML）は、翻訳アプリから自動運転車まで、私たちが使用する最も重要なテクノロジーの一部を支えています。このコースでは、ML の背後にあるコアコンセプトについて説明します。

ML は、問題を解決し、複雑な質問に回答し、新しいコンテンツを作成するための新しい方法を提供します。ML は、天気の予測、移動時間の推定、曲のおすすめ、文の自動補完、記事の要約、見たことのない画像の生成を行うことができます。

簡単に言うと、ML は、モデルと呼ばれるソフトウェアをトレーニングして、有用な予測を行ったり、データからコンテンツ（テキスト、画像、音声、動画など）を生成したりするプロセスです。

たとえば、降雨量を予測するアプリを作成するとします。従来のアプローチまたは ML アプローチのいずれかを使用できます。従来のアプローチでは、地球の大気と地表の物理学ベースの表現を作成し、膨大な量の流体力学方程式を計算します。これは非常に難しいです。

ML アプローチを使用すると、ML モデルに膨大な量の気象データが提供され、最終的に ML モデルは、異なる降雨量を生み出す気象パターンの数学的関係を学習します。次に、モデルに現在の気象データを渡すと、降水量を予測します。

理解度チェック

ML における「モデル」とは何ですか？

モデルは、ML システムが予測を行うために使用する、データから導き出された数学的関係です。

モデルはコンピュータハードウェアの一部です

モデルは、学習対象のものを小さく表現したものです。

ML システムの種類

ML システムは、予測やコンテンツの生成方法に基づいて、次の 1 つ以上のカテゴリに分類されます。

教師あり学習
教師なし学習
強化学習
生成 AI

教師あり学習

教師あり学習モデルは、正解を含む大量のデータを学習し、正解を生成するデータ内の要素間の関連性を発見した後、予測を行うことができます。これは、生徒が質問と回答の両方を含む過去の試験を学習して新しい教材を学ぶようなものです。過去の試験で十分にトレーニングを積んだ生徒は、新しい試験を受ける準備が整っています。これらの ML システムは、人間が既知の正しい結果を含むデータを ML システムに提供するという意味で「教師あり」です。

教師あり学習の最も一般的なユースケースは、回帰と分類です。

回帰

回帰モデルは数値を予測します。たとえば、降水量をインチまたはミリメートルで予測する天気モデルは回帰モデルです。

回帰モデルの例については、次の表をご覧ください。

シナリオ	入力データの候補	数値予測
将来の住宅価格	面積、郵便番号、寝室とバスルームの数、敷地面積、住宅ローンの金利、固定資産税率、建設費用、その地域で販売されている住宅の数。	家の価格。
将来の乗車時間	過去の交通状況（スマートフォン、交通センサー、配車アプリ、その他のナビゲーションアプリケーションから収集）、目的地までの距離、気象条件。	目的地に到着するまでの時間（分と秒）。

分類

分類モデルは、あるものがカテゴリに属する可能性を予測します。出力が数値である回帰モデルとは異なり、分類モデルは、特定のカテゴリに属するかどうかを示す値を出力します。たとえば、分類モデルは、メールが迷惑メールかどうか、写真に猫が含まれているかどうかを予測するために使用されます。

分類モデルは、バイナリ分類とマルチクラス分類の 2 つのグループに分類されます。バイナリ分類モデルは、2 つの値のみを含むクラスから値を出力します。たとえば、rain または no rain のいずれかを出力するモデルです。マルチクラス分類モデルは、2 つ以上の値を含むクラスから値を出力します。たとえば、rain、hail、snow、sleet のいずれかを出力できるモデルなどです。

理解度チェック

ML モデルを使用して商業ビルのエネルギー使用量を予測する場合、どのようなモデルを使用しますか？

回帰

エネルギー使用量はキロワット時（kWh）で測定され、数値であるため、回帰モデルを使用します。

分類

分類モデルは、あるものがカテゴリに属するかどうかを予測しますが、回帰モデルは数値を予測します。エネルギー使用量はキロワット時（kWh）という数値で測定されるため、回帰モデルを使用します。

教師なし学習

教師なし学習モデルは、データセット内の意味のあるパターンを特定することを目的としています。たとえば、多くの教師なし学習モデルは、クラスタリングと呼ばれる手法を使用して、類似したデータをグループ（「クラスタ」）に整理します。

図 1. 類似したデータポイントをクラスタリングする ML モデル。

図 2. 自然な境界線で区切られたクラスタのグループ。

クラスタリングは、カテゴリがユーザーによって定義されないため、分類とは異なります。たとえば、教師なしモデルは、気温に基づいて気象データセットをクラスタリングし、季節を定義するセグメンテーションを明らかにします。次に、データセットの理解に基づいて、これらのクラスタに名前を付けようとします。

図 3. 同様の気象パターンをクラスタリングする ML モデル。

雪、雨、雹、雨なしとラベル付けされた色の付いた点が、それぞれ形状で囲まれ、互いに隣接している画像。

図 4. 雪、みぞれ、雨、雨なしとラベル付けされた気象パターンのクラスタ。

理解度チェック

教師ありアプローチと教師なしアプローチの違いは何ですか？

教師ありアプローチでは、正解を含むデータが提供されます。

教師ありアプローチでは、正解を含むデータが提供されます。モデルの役割は、正しい答えを生成するデータ内の関連性を見つけることです。教師なし学習では、正解のないデータが提供されます。その役割は、データ内のグループを見つけることです。

教師ありアプローチでは通常、クラスタリングが使用されます。

教師なしアプローチではクラスタリングが使用されます。

教師なしアプローチでは、データのクラスタにラベルを付ける方法を認識しています。

教師なしアプローチでは、データのクラスタの意味を把握できません。データに対する理解に基づいて、ユーザーが定義する必要があります。

強化学習

強化学習モデルは、環境内で行われたアクションに基づいて報酬またはペナルティを受け取ることで予測を行います。強化学習システムは、最も多くの報酬を得るための最適な戦略を定義するポリシーを生成します。

強化学習は、ロボットに部屋を歩き回るなどのタスクを実行させるために使用されます。また、 AlphaGo などのソフトウェアプログラムで囲碁をプレイするためにも使用されます。

生成 AI

生成 AI は、ユーザー入力からコンテンツを作成するモデルの一種です。たとえば、生成 AI は、独自の画像、音楽、ジョークを作成したり、記事を要約したり、タスクの実行方法を説明したり、写真を編集したりできます。

生成 AI は、さまざまな入力から、テキスト、画像、音声、動画など、さまざまな出力を生成できます。また、これらの組み合わせを取得して作成することもできます。たとえば、モデルは画像を入力として受け取り、画像とテキストを出力として作成したり、画像とテキストを入力として受け取り、動画を出力として作成したりできます。

生成モデルは、入力と出力（通常は「入力のタイプ」から「出力のタイプ」）で説明できます。たとえば、生成モデルの入力と出力の一部を次に示します。

Text-to-text（テキストからテキスト）
Text-to-image（テキストから画像）
テキストからの動画生成
Text-to-code
テキスト読み上げ
画像とテキスト画像変換

次の表に、生成モデル、入力、出力の例を示します。

モデル	入力	出力例
Text-to-text（テキストからテキスト）	ルマン 24 時間レースを発案したのは誰ですか？	ルマン 24 時間レースは、1906 年に設立された自動車団体である Automobile Club de l'Ouest（ACO）によって創設されました。最初のレースは 1923 年 5 月 26 日と 27 日に、フランスのルマンの町の近くにある 13.426 km（8.345 マイル）のロードサーキットであるサルトサーキットで開催されました。このレースは、ACO とサルト地方を宣伝する方法として考案されました。出典: Bard
Text-to-image（テキストから画像）	新聞を読みながらポータルを漂うタコのエイリアン。	出典: Imagen
テキストからの動画生成	サンフランシスコの海で泳ぐフォトリアリスティックなテディベア。テディベアが水中に沈んでいく。テディベアは、カラフルな魚と一緒に水中で泳ぎ続けます。パンダが水中で泳いでいます。	出典: Phenaki
Text-to-code	数値のリストをループ処理して素数を出力する Python ループを作成します。	for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) 出典: Bard
画像からテキストへの変換		これはフラミンゴです。カリブ海に生息しています。出典: Google DeepMind

生成 AI はどのような仕組みで機能しますか？大まかに言うと、生成モデルは新しいが類似したデータを生成することを目的として、データ内のパターンを学習します。生成モデルは次のようになります。

人々の行動や話し方を観察して、他人の真似をすることを学ぶコメディアン
特定のスタイルの絵画をたくさん研究して、そのスタイルで絵を描くことを学ぶアーティスト
特定の音楽グループの音楽をたくさん聴いて、そのグループの音を再現するカバーバンド

独自のクリエイティブな出力を生成するために、生成モデルは最初に教師なしアプローチでトレーニングされます。このアプローチでは、モデルはトレーニングに使用されたデータを模倣することを学習します。モデルは、モデルが実行を求められる可能性のあるタスク（記事の要約や写真の編集など）に関連する特定のデータで、教師あり学習や強化学習を使用してさらにトレーニングされることもあります。

生成 AI は急速に進化しているテクノロジーであり、新しいユースケースが常に発見されています。たとえば、生成モデルは、邪魔な背景を自動的に削除したり、低解像度の画像の品質を向上させたりすることで、企業の e コマース商品画像の改善に役立っています。

機械学習の概要

教師ありの学習

機械学習の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

理解度チェック

ML システムの種類

教師あり学習

回帰

分類

理解度チェック

教師なし学習

理解度チェック

強化学習

生成 AI

機械学習の概要