TF-166 · マルチモーダルAI

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

問題

マルチモーダルAIは、画像、音声、テキストなど複数種類の情報を扱うAIを指す。

正解: ○

マルチモーダルAIは、単一形式のデータだけでなく、画像と文章、音声と映像など複数のモダリティを組み合わせて処理します。VQAや画像キャプション生成などが代表例です。