問題
テクノロジ系
問78 利用者がスマートスピーカーに向けて話し掛けた内容に対して,スマートスピーカーから音声で応答するための処理手順が(1)~(4)のとおりであるとき,音声認識に該当する処理はどれか。 (1) 利用者の音声をテキストデータに変換する。 (2) テキストデータを解析して,その意味を理解する。 (3) 応答する内容を決定して,テキストデータを生成する。 (4) 生成したテキストデータを読み上げる。
選択肢
- ア(1)
- イ(2)
- ウ(3)
- エ(4)
解説
正解:ア
概要
この問題は、スマートスピーカーの処理手順のうち、音声認識に当たる処理がどれかを問う問題です。音声を文字に変換する処理と、意味理解や読み上げを区別できるかがポイントです。
正解の理由
音声認識は、利用者の発話音声を解析してテキストデータに変換する処理を指します。手順(1)は「利用者の音声をテキストデータに変換する」であり音声認識そのものなので、正解はア(1)です。
各選択肢の解説
ア(〇): (1)は音声をテキストに変換する処理であり、音声認識に該当します。発話内容を文字列として取り出す段階なので正しいです。
イ(×): (2)はテキストの意味を理解する処理で、自然言語処理や意図理解に当たります。音声を文字に変換する段階ではないため誤りです。
ウ(×): (3)は応答内容を決めて文章を生成する処理で、対話制御やテキスト生成に当たります。音声認識ではないため誤りです。
エ(×): (4)はテキストを音声として読み上げる処理で、音声合成に当たります。音声を文字にする音声認識ではないため誤りです。
ポイント
音声認識は「音声→テキスト」、音声合成は「テキスト→音声」と覚えます。意味理解や応答生成は別工程なので混同しないようにします。