TF-123 · 画像認識

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

ディープラーニングの応用例応用 ID: TF-123

問題

Vision Transformerは、画像をパッチに分割し、Transformerの仕組みを画像認識に適用するモデルである。

正解: ○

解説

Vision Transformerは画像をパッチ列として扱い、Transformerで処理する。CNNとは異なる画像認識アプローチとして重要である。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答ディープラーニングの応用例用語辞典 Transformer モデル CNN

同じトピックの問題