【LlamaIndex】LlamaIndex 概要
PUBLISHED 2023-09-07
UPDATED 2024-08-13
LlamaIndexについて
LlamaIndexは、大量の公開データで事前学習されたLLM (言語モデル) の能力を最大限に引き出すためのデータフレームワークです。
LlamaIndexの存在意義は?
LLMは、人と推論データとの間の自然言語インターフェースを提供します。多くのモデルはWikipedia、メーリングリスト、教科書、ソースコードなどの大量の公開情報で事前に訓練されています。LlamaIndexは、これらのモデルにプライベートデータやドメイン固有のデータを補完する重要な役割を果たします。
LlamaIndexの利点
- データコネクタ API、PDF、SQLなどのネイティブソースやフォーマットから既存のデータをインポートします。
- データインデックス LLMが容易に取り込むことができるフォーマットでデータを構造化します。
- エンジン データへの自然言語アクセスを提供します。
LlamaIndexの対象者
LlamaIndexは、初心者、上級者、およびその中間のすべてのユーザー向けのツールを提供しています。
LlamaIndexの始め方
LlamaIndexの使用を開始するには、pipを使用してインストールします。 完全なインストール手順と初心者向けのチュートリアルも提供されています。
pip install llama-index
コードガイド
-
OpenAI APIキーの設定
import os os.environ["OPENAI_API_KEY"] = 'YOUR_OPENAI_API_KEY' -
データの読み込みとインデックスの作成
from llama_index import VectorStoreIndex, SimpleDirectoryReader documents = SimpleDirectoryReader('data').load_data() index = VectorStoreIndex.from_documents(documents) -
クエリの実行
query_engine = index.as_query_engine() query_engine.query("<question_text>?") -
データの永続化
index.storage_context.persist() -
ディスクからのデータの読み込み
from llama_index import StorageContext, load_index_from_storage storage_context = StorageContext.from_defaults(persist_dir='./storage') index = load_index_from_storage(storage_context)
主なサードパーティのパッケージ要件にはtiktoken、openai、およびlangchainが含まれます。すべての要件は次のコマンドでインストールできます
pip install -r requirements.txt CATEGORY
TAGS