演習 7a: 問題であり、ML 問題として定式化される
問題に適した技術ソリューションと思われるものを書き留めるか、クリックします。この問題は、
バイナリ分類
一次元回帰
マルチクラス 単一ラベル分類
マルチクラス マルチラベル分類
多次元回帰
クラスタリング(教師なし)
ジェネレーティブ AI
その他
次のものを予測または生成します。
ソリューションが予測 ML ソリューションとして最適に構成されている場合は、次の質問をご覧ください。ソリューションがジェネレーティブ AI のソリューションとしてフレームされている場合、MakerSuite をご覧ください。これは、ジェネレーティブ モデルを使用した迅速なプロトタイピング用にさまざまなプロンプトを試すことができるブラウザベースの IDE です。演習 7b: 問題をシンプルな問題として設定する
導入が始まった頃は、簡単な問題を簡単に組み立てられるため、実装の判断や実装が容易になります。与えられた問題をバイナリ分類または一次元回帰問題(あるいはその両方)として記述します。
演習 8: モデル用にデータを設計する
予測 ML モデルで予測に使用するデータを記述します。
最適化のヒント
1 行は、1 つの予測が行われる 1 つのデータを構成します。
予測が行われた時点で利用可能な情報のみを含めます。
各入力は、整数、浮動小数点数、またはバイト(文字列を含む)のスカラーまたは 1D リストです。
入力がスカラーリストまたは 1D リストとは異なる構造である場合は、それがデータに最適な表現かどうかを検討してください。次に例を示します。
1D リストのセルが意味的に異なるものを 2 つ以上表す場合は、これらを別々の入力に分割することをおすすめします。
セルがネストされたプロトコル バッファを表している場合は、ネストされたプロトコル バッファの各フィールドをフラット化できます。
例外: 音声、画像、動画のデータ(セルがバイトの blob)。
演習 9: データの取得元
各入力の発生元を書き留めます。
行の各列を構築するためのデータ パイプラインの開発にかかる時間を評価します。
最適化のヒント
トレーニングで、サンプル出力はいつ利用できるようになりますか?
出力例を取得するのが難しい場合は、演習 5(出力を使用)を再度確認して、モデルに別の出力を利用できるかどうかを確認できます。
(予測が行われたときに)書き込んだ形式で、すべての入力(出力を除く)がサービング時に利用可能になるようにします。
サービング時にすべての入力をまったく同じ形式で取得することが難しい場合は、演習 8(モデル用のデータを設計する)を見直して入力を再検討するか、演習 5 でサービングを行うときに再検討することをおすすめします。
演習 10: 簡単に取得できる入力データ
演習 8 で挙げた入力の中から、取得しやすく、妥当な初期結果が得られると思われる 1 ~ 3 個の入力を選択します。
最適化のヒント
演習 6 では、使用できる一連のヒューリスティックを使用しました。これらのヒューリスティックの実装で役立つ入力は次のうちどれですか。
入力を準備するデータ パイプラインを開発するためのエンジニアリング コストと、モデルに各入力を有すると見込まれるメリットについて検討します。
単純なパイプラインを持つ単一のシステムから得られる入力に注目する。最初は最小限のインフラストラクチャから始めることをおすすめします。
印刷または保存
下のボタンをクリックして、回答を印刷するか、.pdf として保存してください。
ページの印刷