G検定 一問一答の問題です。解説付きで個別に学習できます。
CLIPのようなモデルは、画像とテキストを対応づけた表現学習に利用される。
正解: ○
CLIPは画像とテキストの対応関係を学習し、両者を近い表現空間で扱えるようにする代表的なモデルです。ゼロショット分類や検索などに応用できます。