LLM・RAG– category –
-
LLM・RAG
LangGraphでAdaptive-RAGエージェントを構築!『チェンソーマン』について聞く
Adaptive-RAGとは、質問の内容に応じて動的に最適な検索方法を変えるアプローチです。 この記事では、LangGraphを使ってAdaptive-RAGエージェントを構築する方法を紹介します。 ざっくり言うと Adaptive-RAGは質問の内容に応じて動的に最適な検索方法を変... -
LLM・RAG
LangChainでRAGを簡単に構築!『呪術廻戦』について聞いてみる
RAGは外部から取得した情報をもとに、LLMの知識を強化して生成するしくみです。 RAGを使うとLLMが学習していない新しい情報を答えられるようになります。 この記事では、LangChainを使ってRAGを構築する方法を紹介しています。 ざっくり言うと LangChainの... -
LLM・RAG
自己修正をするLLM!「Reflection Llama-3.1 70B」の使い方
Reflection Llama-3.1 70Bは、自己修正機能を持つ「Reflection-Tuning」でトレーニングされたLLMです。 推論中に誤りを検出し修正することで、高い精度と生成過程の透明性を実現し、Claude 3.5 SonnetやGPT-4oに匹敵する性能があります。 この記事では、Re... -
LLM・RAG
Llama3.1のファインチューニング!UnslothでGPUメモリ削減!
この記事では、Unslothを使ったLlama3.1のファインチューニング(QLoRA)を紹介します。 UnslothとQLoRAによりGPUメモリの使用量を大幅に削減して、高速にファインチューニングができるようになります。 ざっくり言うと Llama3.1は、Meta社が開発した最新のL... -
LLM・RAG
Googleの最新LLM「Gemma2」の使い方・性能・商用利用について解説!
Gemma 2は、Googleが開発した軽量かつ高性能なオープンソースLLMです。 20億、90億、270億パラメータのモデルが公開され、Gemma2 27Bはパラメータが2倍以上の他モデルに匹敵する性能があります。 この記事では、Gemma2 の性能から商用利用、使い方までを紹... -
LLM・RAG
東工大の日本語LLM「Llama-3-Swallow」の使い方!
Llama-3-Swallowは、MetaのLlama3をもとに、東工大・産総研が継続事前学習をした日本語に強いLLMです。 オープンなLLMの中で、日本語の言語理解・生成タスクにおいてトップクラスの性能があります。 この記事では、Llama-3-Swallowの性能、商用利用、使い... -
LLM・RAG
4050億の最強LLM「Llama 3.1」とは?使い方・性能・商用利用を解説!
Llama 3.1は、Meta社が開発した最新のLLMで、4050億のパラメータを持つ非常に大規模なモデルです。 Llama 3.1は、GPT-4oやClaude 3.5 Sonnetに匹敵する性能を持つと言われています。 この記事では、Llama 3.1の性能から商用利用、使い方まで紹介します。 L... -
LLM・RAG
サイバーエージェントの日本語LLM「cyberagent/Llama-3.1-70B」
cyberagent/Llama-3.1-70Bは、サイバーエージェントが公開した日本語に強いLLMです。 このモデルはMetaが開発した「Llama 3.1 70B」をベースに、日本語データを追加学習させたものです。 この記事では、cyberagent/Llama-3.1-70Bの性能から使い方まで紹介... -
LLM・RAG
OllamaをPythonで使いたい!ローカルLLMを快適に動かす!
ollama-pythonはPython環境でOllamaが使える無料のライブラリです。 ollama-pythonを利用すれば、ローカルLLMをAPIで簡単に活用できたり、RAGやエージェントへの統合も柔軟に行えます。 この記事では、ollama-pythonの環境構築からモデルを使ったテキスト... -
LLM・RAG
サイバーエージェントのVLM「llava-calm2-siglip」の使い方!
llava-calm2-siglipは、サイバーエージェントが開発した日本語対応のVLM(視覚言語モデル)です。 画像の内容をもとにテキストを生成することができ、特に日本語を得意としています。 この記事では、llava-calm2-siglipの使い方を分かりやすく解説します。...