BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/72c65520-2f58-4cf2-af47-518747914160/d6490aede093135d665f23c8cfb4560d.png)
概要
- BigQuery MLを駆使してBQだけでRAGの基盤作ったよという話
- とりあえずBigQueryで簡単な検索システムならできるようになった感じ。
- ONNXとかにすればリモートモデルでなくてもGCSのパス指定だけでEmbedding生成できたりするので、やろうと思えばなんでもできそう
- https://cloud.google.com/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-onnx
- LLMの推論速度だけ気になる。裏側ではどういう環境で推論しているんだろう。
- コサイン類似度もBQで計算できる (便利)