ImageNetは、WordNetの概念階層に沿ってラベル付けされた大規模画像分類データセットです。AlexNetが2012年のILSVRCで躍進した舞台——データとコンペが揃って深層学習の実用性が一気に可視化された——本記事は画像枚数の暗記より、「なぜデータセットがモデルより歴史に刻まれたか」と、AlexNet・COCOとの役割分担に焦点を当てます。
データセットが主役になる理由
機械学習ではデータの規模と質が性能の上限を決めます。ImageNetは、インターネットから収集した画像に人間によるラベル付けを行い、カテゴリ数・枚数ともに当時としては突出した規模を実現しました。
深層学習はパラメータが多く、小さなデータでは過学習しやすい——ImageNetのような大規模教師データが揃って初めて、深いCNNの学習が現実的になった、という語りが試験の歴史パートで繰り返されます。
WordNetと1000クラス
ImageNetのカテゴリはWordNetの同義語集合(synset)に紐づけられ、犬・車・楽器など意味の階層に沿って整理されています。ILSVRCの画像分類タスクでは、代表として1000クラスのサブセットがよく使われます。
| 観点 | ImageNetの特徴 |
|---|---|
| タスク | 画像全体に1ラベル(分類) |
| 規模 | 百万枚規模のデータセットとして知られる |
| ラベル設計 | WordNet階層に基づく概念カテゴリ |
| 試験の整理 | 大規模画像分類データセットの代表例 |
物体の位置を矩形で囲む注釈が主役のCOCOとは、ImageNetは画像全体のクラス当てが中心——データセット選びはタスク選び、とセットで覚えます。
ILSVRC——競技会としてのImageNet
ILSVRC(ImageNet Large Scale Visual Recognition Challenge)は、ImageNetを用いた画像認識の国際コンペティションです(TF-328)。2012年、AlexNetが従来手法を大きく上回り、ディープラーニング普及の重要な契機になった——と試験では定型句として出ます。
ダートマス会議(1956年)をImageNetのために開催した、という説明は誤りです(TF-347)。時代も目的も別の出来事——すり替え問題の定番です。
2012年以降の遺産
ImageNetの影響はコンペ当日で終わりません。転移学習では、ImageNetで学習したCNNの重みを初期値として、別タスクにファインチューニングする流れが長く標準でした(G-382)。
| 層 | 例 | ImageNetとの関係 |
|---|---|---|
| データ | ImageNet | 大規模分類の教師データ |
| コンペ | ILSVRC | モデル性能の公開ベンチマーク |
| モデル | AlexNet、VGG等 | コンペで勝った設計の名前 |
| 応用 | 転移学習 | 学習済み重みを他タスクへ移植 |
現在はより巨大なデータや自己教師あり学習が台頭していますが、試験ではImageNetを深層学習ブームの燃料と舞台として押さえることが優先です。
試験で押さえるポイント
- 定義 — 大規模画像分類データセット(WordNet階層)
- ILSVRC — ImageNetを用いた競技会。2012年AlexNetが象徴的
- 歴史 — 深層学習実用化の契機として引用される
- 対比 — ImageNet=データ、AlexNet=モデル、COCO=検出・セグ向け
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| ImageNet=AlexNet | データセット vs 2012年のCNNモデル |
| ImageNet=COCO | 分類中心 vs 検出・セグメンテーション注釈 |
| ImageNet=ダートマス会議 | 2010年代のデータ・コンペ vs 1956年のAI起源(TF-347) |
| ImageNet=CNN | 教師データ vs ネットワーク構造 |
| ImageNet=ランダムフォレスト | 深層学習のデータ vs 古典的アンサンブル(TF-331すり替え文脈) |
よくある質問
ImageNetは何ですか?
多数のカテゴリに分類された大規模な画像データセットです。ILSVRCではその一部(1000クラスなど)を用いた画像分類競技が行われ、2012年のAlexNetの躍進とともにディープラーニング普及の象徴的出来事になりました。データセットそのものと、そこで競われたコンペの文脈をセットで覚えると試験に効きます。
ImageNetとAlexNetは同じですか?
同じではありません。ImageNetは画像とラベルのデータセット(およびそれを用いた競技会ILSVRC)であり、AlexNetは2012年のコンペで高性能を示したCNNモデルの名前です。データとモデルは別物です。
ImageNetとCOCOは同じですか?
同じではありません。ImageNetは主に画像分類向けの大規模データセットとして知られます。COCOは物体検出・セグメンテーションなどにバウンディングボックスやマスク注釈が付いたデータセットです。タスクと注釈の形式が異なります。