サイバーエージェント、広告クリエイティブに特化した独自日本語OCR(光学文字認識)モデルを開発

 

概要

  • CAさんが内製でOCRを開発。
  • 確かに広告のクリエイティブの文字のフォントとかフォーマットって特殊なので難しいんだろな。
  • クリエイティブ作成の背景などでLLM開発も行っていたはずなので、文字認識の部分まで一気通貫でやっていてすごい。