LLM・RAG– category –
-
LLM・RAG
【LangChain】Tavily Search APIの使い方!『キングオブコント』を聞く
Tavily Searchは、AIエージェント用に設計された検索エンジンAPIで、リアルタイムかつ正確な情報を提供します。 外部情報の検索や抽出が可能でRAG向けに最適化されており、LangChainやLlamaIndexへの統合が簡単にできます。 この記事では、Tavily Search A... -
LLM・RAG
東大松尾研LLM「Tanuki-8x8B」の使い方・性能・商用利用を解説!
Tanuki-8x8Bは、東京大学松尾・岩澤研究室が開発した日本語特化のLLMです。 日本語での共感的かつ自然な対話や文章生成に優れ、GPT-3.5 Turboと同等の性能を誇ります。 この記事では、Tanuki-8x8Bの性能から使い方まで紹介します。 Tanuki-8x8Bとは Tanuki... -
LLM・RAG
LangGraphでCRAGエージェントを構築!『ヒロアカ』について聞く
CRAG(Corrective-RAG)とは、RAGで取得したドキュメントが、質問に対して正しいかを評価する手法です。 この記事では、LangGraphを使ってCRAGエージェントを構築する方法を紹介します。 ざっくり言うと CRAGはRAGの検索品質を向上するための手法 RAGエージ... -
LLM・RAG
LangChainでRAGチャットボットの構築!『弱ペダ』について聞く
LangChainでは、RAGを使って回答を生成するチャットボットを構築できます。 この記事では、会話履歴を考慮したRAGチャットボットの実装について紹介します。 ざっくり言うと LangChainを使って会話履歴を考慮したRAGチャットボットを構築する 日本語のロー... -
LLM・RAG
【LangSmith】アカウント作成からAPIキーの発行方法を解説!
LangSmithは、LLMアプリケーションの開発やデバッグを効率化するプラットフォームです。 LangSmithはLLMアプリケーションのログ記録やモデル評価、パフォーマンスの監視ができます。 この記事では、LangSmithのアカウント作成から、APIキーの発行方法、簡... -
LLM・RAG
LangGraphでAdaptive-RAGエージェントを構築!『チェンソーマン』について聞く
Adaptive-RAGとは、質問の内容に応じて動的に最適な検索方法を変えるアプローチです。 この記事では、LangGraphを使ってAdaptive-RAGエージェントを構築する方法を紹介します。 ざっくり言うと Adaptive-RAGは質問の内容に応じて動的に最適な検索方法を変... -
LLM・RAG
LangChainでRAGを簡単に構築!『呪術廻戦』について聞いてみる
RAGは外部から取得した情報をもとに、LLMの知識を強化して生成するしくみです。 RAGを使うとLLMが学習していない新しい情報を答えられるようになります。 この記事では、LangChainを使ってRAGを構築する方法を紹介しています。 ざっくり言うと LangChainの... -
LLM・RAG
自己修正をするLLM!「Reflection Llama-3.1 70B」の使い方
Reflection Llama-3.1 70Bは、自己修正機能を持つ「Reflection-Tuning」でトレーニングされたLLMです。 推論中に誤りを検出し修正することで、高い精度と生成過程の透明性を実現し、Claude 3.5 SonnetやGPT-4oに匹敵する性能があります。 この記事では、Re... -
LLM・RAG
Llama3.1のファインチューニング!UnslothでGPUメモリ削減!
この記事では、Unslothを使ったLlama3.1のファインチューニング(QLoRA)を紹介します。 UnslothとQLoRAによりGPUメモリの使用量を大幅に削減して、高速にファインチューニングができるようになります。 ざっくり言うと Llama3.1は、Meta社が開発した最新のL... -
LLM・RAG
Googleの最新LLM「Gemma2」の使い方・性能・商用利用について解説!
Gemma 2は、Googleが開発した軽量かつ高性能なオープンソースLLMです。 20億、90億、270億パラメータのモデルが公開され、Gemma2 27Bはパラメータが2倍以上の他モデルに匹敵する性能があります。 この記事では、Gemma2 の性能から商用利用、使い方までを紹...