粗いクラスラベルを使って細かい分類問題を解く

概要

  • 粒度が粗いクラスラベルが大量にあり、細かいラベルが少量しかない場合の学習方法の紹介
    • 例) ペンギン → フンボルトペンギン
  • 「細かいラベルは一切学習に使わず、粗い学習ラベルだけで細かいラベルを推論したい。」という問題設定
    • (細かいラベルの意味付けとかはまた別の話っぽい)
    • (粗い学習ラベルで学習 → 細かいラベルでファインチューニングも試してほしい)
  • 粗いラベルで学習するだけだと、細かい差異を区別する特徴量が抽出できないと考え、自己教師あり学習を組み合わせる
    • 推論時はEmbeddingからknnを使って近傍top-Nの多数決で細かいラベルを決定
  • 学習はCEではなくてKNN損失を使う。メトリックラーニング的な。
  • データセットもクラス毎にサンプルサイズを揃えたもの(ギャラリーB)と、そのままのデータセット(ギャラリーA)を使ったもので実験
  • 結果
    • KNN損失の方が良く、サンプルサイズを揃えるとサンプルが小さいクラスの精度は向上するが、サンプルが多いクラスのサイズの精度が下がるトレードオフ
      •