マルチモーダル

G検定 実践演習の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 基本 ID: G-390

問題

Image Captioningに関する説明として、最も適切な選択肢を1つ選べ。

  1. A. 画像の内容を説明する文章を生成するタスクである
  2. B. 文章から画像を生成するタスクである
  3. C. 音声から話者を識別するタスクである
  4. D. 報酬を最大化する行動を選ぶタスクである

解説(正解: A)

正解はA。Image Captioningは、画像の内容を自然言語の文章で説明するタスクである。画像認識と自然言語生成を組み合わせたマルチモーダルタスクである。BはText-To-Image、Cは話者識別、Dは強化学習の説明である。

演習モードで解く 前の問題 次の問題