G検定 一問一答の問題です。解説付きで個別に学習できます。
画像キャプション生成は、画像を入力として、その内容を説明する自然言語文を生成するタスクである。
正解: ○
画像キャプション生成では、画像認識と自然言語生成を組み合わせます。視覚情報から物体や関係を捉え、それを文章として表現するため、マルチモーダル処理の例になります。