LangGraphでCRAGエージェントを構築！『ヒロアカ』について聞く

2024年10月18日2024年12月18日

【LangGraph】CRAG(Corrective-RAG)を構築！『ヒロアカ』を聞く

CRAG(Corrective-RAG)とは、RAGで取得したドキュメントが、質問に対して正しいかを評価する手法です。

この記事では、LangGraphを使ってCRAGエージェントを構築する方法を紹介します。

ざっくり言うと

CRAGはRAGの検索品質を向上するための手法
RAGエージェント構築にはLangGraphを使用する
LLMには無料の日本語モデルのLlama-3-ELYZA-JP-8Bを使用する

LangGraphでCRAG(Corrective-RAG)を構築する

CRAG(Corrective-RAG)とは、RAGで取得したドキュメントが、質問に対して正しいかを評価する手法です。

この記事では、RAGで取得したドキュメントが、質問に対して関連性が不十分である場合に、WEB検索で回答を補完するCRAGを構築します。

LangGraphは、LangChainやLLMを使ってAIエージェントを構築するライブラリです。

LangGraphのワークフローは次のとおりです。

ワークフローの説明

Retriver：質問をもとにベクトルストアからドキュメントを取得する
ドキュメントの関連性評価：ベクトルストアから取得したドキュメントが質問に関連しているか評価する
Web検索の判定：関連性評価に応じて、回答を生成するか、Web検索をするかを判定します。
WEB検索：質問と取得したドキュメントとの関連性がないときにWeb検索を行う
回答の生成：質問と取得したドキュメントとの関連性がある場合は、RAGで回答を生成する

LangGraphの実行環境

この記事で用意した実行環境は以下のとおりです。

GPU：NVIDIA A100 80GB
GPUメモリ（VRAM）：80GB
OS ：Ubuntu 22.04
Docker

Dockerで環境構築

Dockerを使用してLangGraphの環境構築をします

Dockerの使い方は以下の記事をご覧ください。

環境変数・LLM・Retrieverの設定

Dockerコンテナで起動したJupyter Lab上でLangChainを使ったRAGの実装をします。

STEP

環境変数の設定

LangChainとTavilyのAPIに関する環境変数を設定します。

import os
from uuid import uuid4

unique_id = uuid4().hex[0:8]

os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_PROJECT"] = f"crag - {unique_id}"
os.environ["LANGCHAIN_ENDPOINT"] = "https://api.smith.langchain.com"
os.environ["LANGCHAIN_API_KEY"] = "***************"
os.environ["TAVILY_API_KEY"] = "***************"

コードの説明

unique_id = uuid4().hex[0:8]

8桁のランダムな一意の識別子unique_idを生成しています。

os.environ[“LANGCHAIN_TRACING_V2”] = “true”

この設定により、LangChainのトレースが可能になります。

os.environ[“LANGCHAIN_PROJECT”] = f”crag – {unique_id}”

angChainプロジェクトの名前を設定しています。ここでは、生成したunique_idを使用してプロジェクト名を「crag – {unique_id}」の形式で一意にしています。

os.environ[“LANGCHAIN_ENDPOINT”] = “https://api.smith.langchain.com”

LangChainのAPIエンドポイントを指定しています。

os.environ[“LANGCHAIN_API_KEY”] = “***************”

LangChain APIを利用するためのAPIキーを設定しています。

os.environ[“TAVILY_API_KEY”] = “***************”

Tavily APIを利用するためのAPIキーを設定しています。

STEP

LLMの設定

日本語LLMモデル「Llama-3-ELYZA-JP-8B-q4_k_m.gguf」をダウンロードします。

!curl -L -o Llama-3-ELYZA-JP-8B-q4_k_m.gguf "https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B-GGUF/resolve/main/Llama-3-ELYZA-JP-8B-q4_k_m.gguf?download=true"

Llama-3-ELYZA-JPについては、別記事で詳しく解説しています。

各種Chainの構築

LangGraphのワークフロー内の関数で使用するChainを構築していきます。

ドキュメントの関連性を評価するChain
回答を生成するChain
ハルシネーションを評価するChain
回答の有用性を評価するChain
Web検索をするTool

STEP

ドキュメントの関連性を評価するChain

ユーザーの質問と取得したドキュメントが関連しているかを評価するChainを構築しています。

評価はバイナリースコア（yes または no）で表され、その結果はJSON形式で返されます。

# retrieval_chain
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate(
    template="""<|begin_of_text|><|start_header_id|>system<|end_header_id|> 
    あなたは採点者です。以下の内容が与えられます：
    ・質問
    ・事実
    
    あなたは「関連性の再現」を評価しています：
    スコアが1の場合、事実が質問に関連していることを意味します。
    スコアが0の場合、事実が質問に関連していないことを意味します。
    1が最高（最良）のスコアです。0は付けられる最低のスコアです。
    
    理由付けをステップバイステップで説明してください。理由付けと結論が正しいことを確認してください。
    最初に正しい答えを単に述べるのは避けてください。
    
    ドキュメントが質問に関連しているかどうかを示すバイナリスコア「yes」または「いいえ」を提供してください。 \n
    バイナリスコアを単一のキー「score」を持つJSON形式で提供し、前置きや説明は不要です。
     <|eot_id|><|start_header_id|>user<|end_header_id|>
    質問: {question} \n
    事実: \n\n {documents} \n\n <|eot_id|><|start_header_id|>assistant<|end_header_id|>
    """,
    input_variables=["question", "documents"],
)

llm = ChatOllama(model="elyza8b",format="json",temperature=0)
retrieval_chain = prompt | llm | JsonOutputParser()
question = "デクとは？"
docs = retriever.invoke(question)
doc_txt = docs[0].page_content
print(retrieval_chain.invoke({"question": question, "documents": doc_txt}))
print("\nユーザーの質問：\n" + question)
print("\n取得したドキュメント：\n" + docs[0].page_content)

コードの説明

PromptTemplate()

プロンプトのテンプレートを定義するために使用されるクラスです。テンプレート内で、指定された変数に動的に値を埋め込み、AIに指示を与えるプロンプトを生成します。

template には、AIに対してどのような指示を与えるかを記述します。

<|start_header_id|>assistant<|end_header_id|>...には、LLMの回答が入ります。

input_variables では、テンプレート内で動的に置き換えられる変数名をリストで指定します。

この場合、questionの変数が指定されています。

prompt | llm | JsonOutputParser()

プロンプトの作成から、LLMによる応答の生成、JSON形式の出力までを一連の処理として組み合わせたChainを構築しています。

retrieval_chain.invoke({“question”: question})

questionをプロンプトに渡して、定義したChainを実行しています。

出力結果の確認

{'score': 'yes'}

ユーザーの質問：
デクとは？

取得したドキュメント：
幼馴染の爆豪からは蔑称として「デク」と呼ばれるが、麗日が好意的に受け取ったことで「頑張れって感じ」という意味に転回し、後に自身のヒーロー名として定める。
私服は無地の物に「○○シャツ」（○○内には「T」や「Y」、「ポロ」、「ドレス」などが入る）と書かれた服をよく着る。深く考えるときは手を口にあて呟く癖があり、その際の台詞が入ったふきだしや背景は、「ブツブツ……」という文字の繰り返しで構成される。

質問とドキュメントが関連する場合、{'score': 'yes'}とJSON形式で出力されます。

STEP

回答を生成するChain

回答を生成するChainを構築します。

# generate_chain
from langchain_core.output_parsers import StrOutputParser

prompt = PromptTemplate(
    template="""<|begin_of_text|><|start_header_id|>system<|end_header_id|> 
    あなたは質問応答のためのアシスタントです。
    次のドキュメントを使って質問に答えてください。 
    答えがわからない場合は、正直に「わかりません」と言ってください。
    回答は最大で3文にまとめ、簡潔にしてください。
    <|eot_id|><|start_header_id|>user<|end_header_id|>
    質問: {question} 
    コンテキスト: {documents} 
    回答: <|eot_id|><|start_header_id|>assistant<|end_header_id|>""",
    input_variables=["question", "documents"],
)

llm = ChatOllama(model="elyza8b",temperature=0)
generate_chain = prompt | llm | StrOutputParser()

question = "デクとは？"
docs = retriever.invoke(question)
generation = generate_chain.invoke({"documents": docs, "question": question})
print("\nユーザーの質問：\n" + question)
print("\n生成した回答：\n" + generation)

コードの説明

prompt | llm | StrOutputParser()

プロンプトの作成から、LLMによる応答の生成、文字列形式の出力までを一連の処理として組み合わせたChainを構築しています。

出力結果の確認

ユーザーの質問：
デクとは？

生成した回答：
デクとは、緑谷出久のヒーロー名です。

STEP

Web検索Toolの設定

Tavily APIを利用してWEB検索を行うToolの設定をします。

# web_search_tool
from langchain_community.tools.tavily_search import TavilySearchResults

web_search_tool = TavilySearchResults(max_results=3)
question = "デクとは？"
web_search_tool.invoke({"query": question})

コードの説明

TavilySearchResults(max_results=5)

Tavily の検索 API を利用して、指定された検索クエリに対して上位5件の検索結果を取得します。

デクについてWeb検索した結果

[{'url': 'https://dic.pixiv.net/a/デク',
  'content': 'デクがイラスト付きでわかる! デクには複数の意味があるが、その殆どは緑谷出久のヒーロー名として使われる事が多い。 曖昧さ回避 +『僕のヒーローアカデミア』の主人公。ピクシブ上では彼を描いた作品に付けられることがほとんど→ 緑谷出久 +『僕のヒーローアカデミア』の構想段階で ...'},
(以下省略)

LangGraphワークフローで使用する関数の定義

LangGraphのワークフローで使用する各種関数の定義をしていきます。

GraphStateの定義
Retriver関数
回答を生成する関数
ドキュメントの関連性を評価する関数
Web検索の関数
WEB検索を判断する関数

STEP

ライブラリのインポート

必要なライブラリをインポートします。

from pprint import pprint
from typing import List
from langchain_core.documents import Document
from typing_extensions import TypedDict

STEP

Graphの状態を定義

Graphを初期化したときのノードやエッジの状態を定義します。

class GraphState(TypedDict):
    question: str
    generation: str
    search: str
    documents: List[str]
    steps: List[str]

STEP

Retriver関数

Retriverを使用してベクトルストアからユーザーの質問に関連するドキュメントを取得します。

「question(質問)」と「documents(ドキュメント)」、「steps」を次のステップで使用するため、状態 (state) を更新します。

# Retriver関数
def retrieve(state):
    print("---RETRIEVE---")
    question = state["question"]
    documents = retriever.invoke(question)
    steps = state["steps"]
    steps.append("retrieve_documents")
    return {"documents": documents, "question": question, "steps": steps}

STEP

回答を生成する関数

ユーザーの質問にもとづいた回答を生成します。

「documents(ドキュメント)」と「question(質問)」、「generation(回答)」、「steps」を次のステップで使用するため、状態 (state) を更新します。

# 回答を生成する関数
def generate(state):
    print("---GENERATE---")
    question = state["question"]
    documents = state["documents"]
    generation = generate_chain.invoke({"documents": documents, "question": question})
    steps = state["steps"]
    steps.append("generate_answer")
    return {
        "documents": documents,
        "question": question,
        "generation": generation,
        "steps": steps,
    }

STEP

ドキュメントの関連性を評価する関数

取得したドキュメントが質問に関連しているかどうかを評価します。

関連性の高いドキュメントを選別し、リストに格納します。

関連性が低いドキュメントが存在する場合は、Web検索に進むフラグを立てます。

「filtered_docs(関連性のあるドキュメント)」と「question(質問)」、「search(検索)」、「steps」を次のステップで使用するため、状態(sate)を更新します。

# ドキュメントの関連性を評価する関数
def grade_documents(state):
    print("---CHECK DOCUMENT RELEVANCE TO QUESTION---")
    question = state["question"]
    documents = state["documents"]
    steps = state["steps"]
    steps.append("grade_document_retrieval")
    filtered_docs = []
    search = "No"
    for d in documents:
        score = retrieval_chain.invoke(
            {"question": question, "documents": d.page_content}
        )
        grade = score["score"]
        if grade == "yes":
            print("---GRADE: DOCUMENT RELEVANT---")
            filtered_docs.append(d)
        else:
            print("---GRADE: DOCUMENT NOT RELEVANT---")
            search = "Yes"
            continue
    return {
        "documents": filtered_docs,
        "question": question,
        "search": search,
        "steps": steps,
    }

STEP

Web検索の関数

質問に基づいてウェブ検索を実行します。検索結果を取得して、それをドキュメントに追加します。

「question(質問)」と「documents(ドキュメント)」、「steps」を次のステップで使用するため、状態(state)を更新します。

# Web検索の関数
def web_search(state):
    print("---WEB SEARCH---")
    question = state["question"]
    documents = state.get("documents", [])
    steps = state["steps"]
    steps.append("web_search")
    web_results = web_search_tool.invoke({"query": question})
    documents.extend(
        [
            Document(page_content=d["content"], metadata={"url": d["url"]})
            for d in web_results
        ]
    )
    return {"documents": documents, "question": question, "steps": steps}

STEP

WEB検索を判断する関数

WEB検索をするか、RAGによる生成をするかを判断します。

この関数は「search」または「generate」を返します。この返り値は、後続のステップで利用されます。

#Web検索を判断する関数
def decide_to_generate(state):
    print("---GENERATE OR WEB SEARCH---")
    search = state["search"]
    if search == "Yes":
        print("---TO WEB SEARCH---")
        return "search"
    else:
        print("---TO GENERATE---")
        return "generate"

LangGraphワークフローの構築

下図のようなLangGraphのワークフローを構築していきます。

ワークフローの説明

Retriver：質問をもとにベクトルストアからドキュメントを取得する
ドキュメントの関連性評価：ベクトルストアから取得したドキュメントが質問に関連しているか評価する
WEB検索：質問と取得したドキュメントとの関連性がないときにWeb検索を行う
WEB検索の判定：関連性評価に応じて、回答を生成するか、Web検索をするかの判定をします。
回答の生成：質問と取得したドキュメントとの関連性がある場合は、RAGで回答を生成する

STEP

ライブラリのインポート

必要なライブラリをインポートします。

from langgraph.graph import END, StateGraph, START
from IPython.display import Image, display
from langchain_core.runnables.graph import CurveStyle, MermaidDrawMethod, NodeStyles

STEP

Graphの初期化とノードの追加

Graphのワークフローを作成し、各ノードを追加します。

#Graphのワークフローを作成
workflow = StateGraph(GraphState)

#ノードの追加
workflow.add_node("retrieve", retrieve)
workflow.add_node("grade_documents", grade_documents)
workflow.add_node("generate", generate)
workflow.add_node("web_search", web_search)

コードの説明

StateGraph(GraphState)

StateGraphは、複数の処理ステップ（ノード）をグラフ構造として扱い、それぞれのノード間で状態を渡しながら処理を進めることができます。

workflow.add_node(“web_search”, web_search)

web_searchという名前のノードがワークフローに追加され、web_search関数がそのノードで実行されます。

STEP

エッジの追加

ワークフローにおけるエッジ（ノード間の接続）の設定を行います。

エッジは、各ノードをどの順序で実行するか、どのような条件で次のノードに進むかを定義します。

# Edgeの追加
workflow.add_edge(START, "retrieve")
workflow.add_edge("retrieve", "grade_documents")
workflow.add_conditional_edges(
    "grade_documents",
    decide_to_generate,
    {
        "search": "web_search",
        "generate": "generate",
    },
)
workflow.add_edge("web_search", "generate")
workflow.add_edge("generate", END)

コードの説明

workflow.add_edge()：エッジの追加

workflow.add_edge(START, "retrieve")

ワークフローの開始点 START から "retrieve" ステップに進みます。

workflow.add_edge("retrieve", "grade_documents")

"retrieve" ステップから "grade_documents" ステップに進みます。

workflow.add_edge("web_search", "generate")

"web_search" が完了した後に "generate" ステップに進みます。

workflow.add_edge("generate", END)

"generate" ステップが完了すると、ワークフローが終了ENDします。

workflow.add_conditional_edges()：条件付きエッジの追加

workflow.add_conditional_edges( "grade_documents", decide_to_generate, { "search": "web_search", "generate": "generate", }, )

"grade_documents" ステップから次のステップへの接続を条件付きで追加します。

decide_to_generate 関数が返す値によって次のステップが決まります：

"search" の場合、"web_search" ステップに遷移します。

"generate" の場合、"generate" ステップに遷移します。

STEP

ワークフローのコンパイル

全体のワークフローをコンパイルして、実行可能な形にします。

# コンパイル
app = workflow.compile()

STEP

ワークフローの可視化

定義したLangGraphワークフローのグラフ構造を、Mermaid形式で可視化します。

# ワークフローの可視化
display(
    Image(
        app.get_graph().draw_mermaid_png(
            draw_method=MermaidDrawMethod.API,
        )
    )
)

CRAGエージェントに『ヒロアカ』について聞く

構築したCRAGエージェントに『ヒロアカ』について質問をしてみます。

RAGエージェントに質問する(１)

「デクとは誰ですか？」と質問してみます。

import uuid

def graph_output(inputs: dict):
    config = {"configurable": {"thread_id": str(uuid.uuid4())}}
    state_dict = app.invoke(
        {"question": inputs["input"], "steps": []}, config
    )
    return {"response": state_dict["generation"], "steps": state_dict["steps"]}

inputs = {"input": "デクとは誰ですか？"}
response = graph_output(inputs)
response

デクとは誰ですか？

—RETRIEVE—
—CHECK DOCUMENT RELEVANCE TO QUESTION—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT RELEVANT—
—GENERATE OR WEB SEARCH—
—TO GENERATE—
—GENERATE—
{‘response’: ‘緑谷出久（みどりやいずく）は、主人公の男子生徒で、9代目ワン・フォー・オール継承者です。’,
‘steps’: [‘retrieve_documents’,
‘grade_document_retrieval’,
‘generate_answer’]}

取得したドキュメントが全て質問に関連しているため、RAGによる生成が行われました。

RAGエージェントに質問する(２)

「ウラビティとは誰ですか？」と質問してみます。

def graph_output(inputs: dict):
    config = {"configurable": {"thread_id": str(uuid.uuid4())}}
    state_dict = app.invoke(
        {"question": inputs["input"], "steps": []}, config
    )
    return {"response": state_dict["generation"], "steps": state_dict["steps"]}

inputs = {"input": "ウラビティとは誰ですか？"}
response = graph_output(inputs)
response

ウラビティとは誰ですか？

—RETRIEVE—
—CHECK DOCUMENT RELEVANCE TO QUESTION—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT NOT RELEVANT—
—GENERATE OR WEB SEARCH—
—TO WEB SEARCH—
—WEB SEARCH—
—GENERATE—
{‘response’: ‘ウラビティは、漫画『僕のヒーローアカデミア』に登場する麗日お茶子のヒーロー名です。’,
‘steps’: [‘retrieve_documents’,
‘grade_document_retrieval’,
‘web_search’,
‘generate_answer’]}

一部関連性のないドキュメントを取得したため、WEB検索で回答がされています。

RAGエージェントに質問する(３)

「かっちゃんとは誰ですか？」と質問してみます。

def graph_output(inputs: dict):
    config = {"configurable": {"thread_id": str(uuid.uuid4())}}
    state_dict = app.invoke(
        {"question": inputs["input"], "steps": []}, config
    )
    return {"response": state_dict["generation"], "steps": state_dict["steps"]}

inputs = {"input": "かっちゃんとは誰ですか？"}
response = graph_output(inputs)
response

質問:
かっちゃんとは誰ですか？

—RETRIEVE—
—CHECK DOCUMENT RELEVANCE TO QUESTION—
—GRADE: DOCUMENT RELEVANT—
—GRADE: DOCUMENT NOT RELEVANT—
—GRADE: DOCUMENT NOT RELEVANT—
—GRADE: DOCUMENT NOT RELEVANT—
—GENERATE OR WEB SEARCH—
—TO WEB SEARCH—
—WEB SEARCH—
—GENERATE—
{‘response’: ‘かっちゃんは、「僕のヒーローアカデミア」に登場するキャラクターで、爆豪勝己のあだ名です。幼馴染の出久から「かっちゃん」と呼ばれています。強力な個性と戦闘センスを持ち、自尊心が強く攻撃的な性格ですが、妙な部分では冷静に判断するという複雑な人物です。’,
‘steps’: [‘retrieve_documents’,
‘grade_document_retrieval’,
‘web_search’,
‘generate_answer’]}

関連性のないドキュメントを取得したため、WEB検索で回答がされています。