Delta Lakeを用いたLLM処理基盤
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/35a1a9fb-44fc-4670-bf79-e9ffcbc31bc2/d939928f6e306af9cd516b3b2da89100.png)
- 国内の企業情報を収集し、会社概要を生成できるようにしたい
- 高品質な会社概要を低コストで出力するためLLMを活用
- 収集データを入力し、会社概要を得る
- 生成した文章をLLMに評価させる
- 品質とコストの両観点に注目
- 品質: LLMに生成された文章をLLMに評価させた時の正確性
- コスト: 人件費(人によるアノテーション) vs. LLMのAPI利用量
- LLMによる評価方法
- LLMによって生成された文章が、必要要件を満たしているかを3点満点で採点
- 人による採点(真の評価)と比較し、評価の正確性を確認する
- 評価結果(内容の正しさ)
- LLMによる評価が満点のうち、その評価が正しかったものは約91%
- 全体の中で、LLMのみで正しい文章を生成できたのは約24%
- 品質を追求しつつコストのバランスを考えるなら、「LLMによる生成 & 評価 → 満点のもののみ人間が確認してリリース」がよさそう
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/33379755-8a44-409f-896c-073fd2c3d25c/8032fa4def5e4e1293c2b01811c0b125.png)
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/3029f47c-3621-4db9-9ab0-a65be6d884e2/db0cfa445af4921ec2793409b04dd912.png)
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/e2f694f6-773e-4ead-ad57-dfeddb9dbf80/d547a489838c77a2d3e200338eb326f9.png)