G-328 · 画像認識

G検定の実践演習模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

ディープラーニングの応用例応用 ID: G-328

問題

Vision Transformerに関する説明として、最も適切な選択肢を1つ選べ。

A. 画像をパッチに分割し、Transformerの仕組みを画像認識に適用するモデルである
B. RNNだけで画像を逐次的に生成する音声モデルである
C. 決定木を多数組み合わせた教師あり学習モデルである
D. 個人情報を匿名加工情報に変換する制度である

解説（正解: A）

正解はA。Vision Transformerは、画像をパッチに分割し、それらを系列としてTransformerに入力することで画像認識を行うモデルである。CNNとは異なるアプローチで画像の関係性を扱う。BからDはVision Transformerの説明ではない。

演習モードで解く前の問題次の問題

関連キーワード

G検定実践演習ディープラーニングの応用例用語辞典 Transformer モデル CNN

同じトピックの問題