問題
問8 AIの機械学習で利用するデータの取扱いに関する記述のうち,バイアスの低減やデータの品質を確保するために考えられる対策として,適切なものだけを全て挙げたものはどれか。 a 学習の目的に適したデータであることを確認する。 b データの入手元・作成来歴を確認する。 c データへのアノテーションの付与は学習目的に合わせて実施する。 d 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。
選択肢
- アa, b
- イa, b, c, d
- ウa, d
- エb, c, d
解説
正解:イ
概要
AIの機械学習で利用するデータの取扱いにおいて、バイアスを減らし、データの品質を確保するための適切な対策について問う問題です。学習データの選定や管理の重要性がテーマです。
正解の理由
aは学習目的に適したデータかを確認する対策であり、bは入手元や作成履歴を確認することで信頼性を確保します。cは学習目的に沿った適切なアノテーションを行う対策で、dは判別が困難な不適切データを除外する対応です。いずれもバイアス低減や品質確保に有効であるため、全て正しいです。
各選択肢の解説
ア(〇): 学習の目的に適したデータであることを確認することは、不要な偏りや誤学習を防ぐために重要です。目的に合わないデータを使うと精度が低下するため、適切な対策といえます。
イ(〇): データの入手元や作成履歴を確認することは、信頼性や偏りの有無を把握するために重要です。出所が不明確なデータは品質に問題がある可能性があるため、正しい対策です。
ウ(〇): データへのアノテーションを学習目的に合わせて実施することは、モデルの精度向上に直結します。不適切なラベル付けは誤学習の原因となるため、品質確保の観点から正しい対策です。
エ(〇): 人間の目でも判別が難しい画像データを除外することは、誤った学習を防ぐための有効な方法です。不明確なデータを減らすことで、モデルの信頼性向上につながります。
ポイント
機械学習ではデータの質が結果を左右します。目的に合った信頼できるデータを用意し、適切にラベル付けすることが重要です。