Delta Lakeを用いたLLM処理基盤

 
  • 国内の企業情報を収集し、会社概要を生成できるようにしたい
  • 高品質な会社概要を低コストで出力するためLLMを活用
    • 収集データを入力し、会社概要を得る
    • 生成した文章をLLMに評価させる
  • 品質とコストの両観点に注目
    • 品質: LLMに生成された文章をLLMに評価させた時の正確性
    • コスト: 人件費(人によるアノテーション) vs. LLMのAPI利用量
  • LLMによる評価方法
    • LLMによって生成された文章が、必要要件を満たしているかを3点満点で採点
    • 人による採点(真の評価)と比較し、評価の正確性を確認する
  • 評価結果(内容の正しさ)
    • LLMによる評価が満点のうち、その評価が正しかったものは約91%
    • 全体の中で、LLMのみで正しい文章を生成できたのは約24%
  • 品質を追求しつつコストのバランスを考えるなら、「LLMによる生成 & 評価 → 満点のもののみ人間が確認してリリース」がよさそう