【LLM】ベクトルデータベースって多くてどれを使ったら良いか分からないというあなたのための記事(6つのツールを比較)

ベクトルデータベース、単純に詳しくなかったので勉強になった。
 
  • Pinecone
    • 一番人気。手軽だから?
    • クラウド前提でローカル環境を用意するすべはないらしい。
  • pgvector
    • PostgreSQLの拡張機能として存在
      • デカい(といっても1000次元程度?)ベクトル入れると死ぬという噂も
    • RDS for PostgreSQLなどいくつかのクラウドサービスで対応しているのは大きそう。
  • Weaviate
    • Dockerイメージが用意されている。マネージドサービスもある。
    • 「モジュール」という概念が存在し、MLモデルとかも中に突っ込める。生データをインプットすればベクトル化して保存してくれるイメージ。
    • ベクトル以外の情報もええ感じに持てる。ベクトル検索じゃなくて通常のキーワードを与える検索も可能。
    • 通常のRDBがなくともこれ一つで完結可能?
  • Qdrant
    • Dockerイメージが用意されている。マネージドサービスもある。
    • 早いらしい。
    • self host できるWeb UIも。
  • Milvus
    • Dockerイメージが用意されている。マネージドサービスもある。
    • WalmartとかeBayとかで利用実績あるので強そう?
  • Chroma
    • マネージドはない。
    • LangchainやLlamaIndexと一緒によく使われるそう。
    • サーバレス化を計画してるとか。