マルチモーダルAI

G検定 一問一答の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 応用 ID: TF-168

問題

CLIPのようなモデルは、画像とテキストを対応づけた表現学習に利用される。

正解: ○

解説

CLIPは画像とテキストの対応関係を学習し、両者を近い表現空間で扱えるようにする代表的なモデルです。ゼロショット分類や検索などに応用できます。

演習モードで解く 前の問題 次の問題