マルチモーダル

G検定 実践演習の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 基本 ID: G-391

問題

Text-To-Imageに関する説明として、最も適切な選択肢を1つ選べ。

  1. A. テキストの指示や説明から画像を生成するタスクである
  2. B. 画像から説明文を生成するタスクである
  3. C. 音声信号を文字列へ変換するタスクである
  4. D. クラスタ中心を更新するタスクである

解説(正解: A)

正解はA。Text-To-Imageは、テキストによる説明や指示をもとに画像を生成するタスクである。DALL-EやDiffusion Modelなどと関連して説明されることがある。BはImage Captioning、Cは音声認識、Dはクラスタリングの説明である。

演習モードで解く 前の問題 次の問題