マルチモーダルAI

G検定 一問一答の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 標準 ID: TF-166

問題

マルチモーダルAIは、画像、音声、テキストなど複数種類の情報を扱うAIを指す。

正解: ○

解説

マルチモーダルAIは、単一形式のデータだけでなく、画像と文章、音声と映像など複数のモダリティを組み合わせて処理します。VQAや画像キャプション生成などが代表例です。

演習モードで解く 前の問題 次の問題