マルチモーダルAI

G検定 一問一答の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 標準 ID: TF-167

問題

画像キャプション生成は、画像を入力として、その内容を説明する自然言語文を生成するタスクである。

正解: ○

解説

画像キャプション生成では、画像認識と自然言語生成を組み合わせます。視覚情報から物体や関係を捉え、それを文章として表現するため、マルチモーダル処理の例になります。

演習モードで解く 前の問題 次の問題