Microsoftのphi-2がMITライセンスに
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/034c57b2-1332-4508-a491-af42a7c06562/ad995f89be748644a98f1382164f13b1.png)
概要
- Phi-2は高品質なデータセットを使うことで、高性能な小規模モデルを実現したmicrosoftの論文
- 2.7Bの大きさでLlama2やMistral 7Bなどの性能を凌ぐ
- 130億パラメータ以下のモデルの中では最先端な性能を持つ
- 強化学習もされていない
- Small Language Model (SLM)らしいが、27億パラメータはある
- A100 96個で14日トレーニング
- 基本構造はphi-1.0から変わっておらず、データを追加したりしている模様
- 「Textbooks Are All You Need」https://arxiv.org/abs/2306.11644
- 教科書 (textbooks)レベルの質の高いデータセットが重要だ、ということらしい
- 実際にMacbook proで動かしている記事もある
- 英語以外の処理機能はないらしい