モデル・技術

ImageNetとは?1000クラスで競った——深層学習を起動した画像データの基盤

読み:イメージネット / 英:ImageNet

更新日: 読了目安:約6分

ImageNetは、WordNetの概念階層に沿ってラベル付けされた大規模画像分類データセットです。AlexNetが2012年のILSVRCで躍進した舞台——データとコンペが揃って深層学習の実用性が一気に可視化された——本記事は画像枚数の暗記より、「なぜデータセットがモデルより歴史に刻まれたか」と、AlexNet・COCOとの役割分担に焦点を当てます。

データセットが主役になる理由

機械学習ではデータの規模と質が性能の上限を決めます。ImageNetは、インターネットから収集した画像に人間によるラベル付けを行い、カテゴリ数・枚数ともに当時としては突出した規模を実現しました。

深層学習はパラメータが多く、小さなデータでは過学習しやすい——ImageNetのような大規模教師データが揃って初めて、深いCNNの学習が現実的になった、という語りが試験の歴史パートで繰り返されます。

WordNetと1000クラス

ImageNetのカテゴリはWordNetの同義語集合(synset)に紐づけられ、犬・車・楽器など意味の階層に沿って整理されています。ILSVRCの画像分類タスクでは、代表として1000クラスのサブセットがよく使われます。

観点ImageNetの特徴
タスク画像全体に1ラベル(分類
規模百万枚規模のデータセットとして知られる
ラベル設計WordNet階層に基づく概念カテゴリ
試験の整理大規模画像分類データセットの代表例

物体の位置を矩形で囲む注釈が主役のCOCOとは、ImageNetは画像全体のクラス当てが中心——データセット選びはタスク選び、とセットで覚えます。

ILSVRC——競技会としてのImageNet

ILSVRC(ImageNet Large Scale Visual Recognition Challenge)は、ImageNetを用いた画像認識の国際コンペティションです(TF-328)。2012年、AlexNetが従来手法を大きく上回り、ディープラーニング普及の重要な契機になった——と試験では定型句として出ます。

  • 2012年以前 — 手作り特徴+古典的分類器が主流
  • 2012年 — 深いCNN+GPU+大規模データがベンチマークで勝利
  • 以降GoogLeNetResNet等、CNNアーキテクチャ競争が加速

ダートマス会議(1956年)をImageNetのために開催した、という説明は誤りです(TF-347)。時代も目的も別の出来事——すり替え問題の定番です。

2012年以降の遺産

ImageNetの影響はコンペ当日で終わりません。転移学習では、ImageNetで学習したCNNの重みを初期値として、別タスクにファインチューニングする流れが長く標準でした(G-382)。

ImageNetとの関係
データImageNet大規模分類の教師データ
コンペILSVRCモデル性能の公開ベンチマーク
モデルAlexNet、VGG等コンペで勝った設計の名前
応用転移学習学習済み重みを他タスクへ移植

現在はより巨大なデータや自己教師あり学習が台頭していますが、試験ではImageNetを深層学習ブームの燃料と舞台として押さえることが優先です。

試験で押さえるポイント

  • 定義 — 大規模画像分類データセット(WordNet階層)
  • ILSVRC — ImageNetを用いた競技会。2012年AlexNetが象徴的
  • 歴史 — 深層学習実用化の契機として引用される
  • 対比 — ImageNet=データ、AlexNet=モデル、COCO=検出・セグ向け

演習で確認する

G検定:TF-328TF-347TF-331TF-330G-382G-315

すり替えに注意

誤った説明正しい理解
ImageNet=AlexNetデータセット vs 2012年のCNNモデル
ImageNet=COCO分類中心 vs 検出・セグメンテーション注釈
ImageNet=ダートマス会議2010年代のデータ・コンペ vs 1956年のAI起源(TF-347)
ImageNet=CNN教師データ vs ネットワーク構造
ImageNet=ランダムフォレスト深層学習のデータ vs 古典的アンサンブル(TF-331すり替え文脈)

よくある質問

ImageNetは何ですか?

多数のカテゴリに分類された大規模な画像データセットです。ILSVRCではその一部(1000クラスなど)を用いた画像分類競技が行われ、2012年のAlexNetの躍進とともにディープラーニング普及の象徴的出来事になりました。データセットそのものと、そこで競われたコンペの文脈をセットで覚えると試験に効きます。

ImageNetとAlexNetは同じですか?

同じではありません。ImageNetは画像とラベルのデータセット(およびそれを用いた競技会ILSVRC)であり、AlexNetは2012年のコンペで高性能を示したCNNモデルの名前です。データとモデルは別物です。

ImageNetとCOCOは同じですか?

同じではありません。ImageNetは主に画像分類向けの大規模データセットとして知られます。COCOは物体検出・セグメンテーションなどにバウンディングボックスやマスク注釈が付いたデータセットです。タスクと注釈の形式が異なります。