-
「OmniGen」ローカル環境の使い方! ComfyUIで画像生成AIに挑戦
VectorSpaceLabは、マルチモーダル画像生成AIモデル「OmniGen」を2024年11月にリリースしました。 「OmniGen」は、単一のフレームワークで多様な生成作業を実行可能にすることを目指して開発されています。 この記事では、初心者向けに「OmniGen」の概要と... -
【LangChain】PDFから回答するRAGを構築!『情報通信白書』を読む
LangChainでは、PDFから情報を抽出して回答を生成するRAGを構築できます。 この記事では、『情報通信白書』のPDFを読み込んで回答するRAGの実装について紹介します。 ざっくり言うと PDFから情報を抽出して回答を生成するRAGを構築する 日本語のローカルLL... -
RAG進化のさらに先へ!自律型AIエージェント ウェビナー【12/25無料開催】
RAG進化のさらに先へ! 大好評につきRAGシリーズ第3弾が開催決定! 「自律型AIエージェント」の無料ウェビナー 12/25(水)14:00~15:00開催します。 今回は、RAGの精度を向上させる「自律型AIエージェント」のデモを交えてご紹介します。 ぜひご参加く... -
Stable Diffusionを使ったロゴ作成のステップガイド
ロゴ作成の悩みをStable Diffusionが解決します! ロゴを作りたいけど、デザインが思い浮かばない。 という方でも、Stable Diffusionはテキストを入力するだけで、いくつものロゴデザインパターンを簡単に生成でき、理想のロゴを見つけられるでしょう。 ... -
【Llama 3.1 Swallow】東工大の日本語に強いLLM!
Llama 3.1 Swallowは、MetaのLlama 3.1をベースに、東工大・産総研が日本語能力を強化したLLMです。 オープンな日本語LLMの中で、日本語の言語理解・生成タスクにおいてトップクラスの性能があります。 この記事では、Llama 3.1 Swallowの性能、商用利用、... -
LlamaIndexでRAGを構築!『HUNTER×HUNTER』について聞く
LlamaIndexでは、外部から情報を抽出して質問に回答するRAGを構築できます。 この記事では、『HUNTER×HUNTER』のWikipediaを読み込んで質問に回答するRAGを作る方法を紹介します。 ざっくり言うと LlamaIndexでは外部から情報を抽出して質問に回答するRAG... -
LangGraphでRAGエージェントを構築!『ジブリ』について聞く
LangGraphでは、人間の指示をもとに自律的に判断や行動をするRAGエージェントを構築できます。 この記事では、LangGraphを使ってAdaptive-RAG、CRAG、Self-RAGの手法を組み合わせたエージェントの作り方を解説します。 ざっくり言うと LangGraphでは、自律... -
ControlNet Referenceの使い方!エラーが出てしまったときの解決策も
Stable DiffusionのControlNet Referenceを使って、お気に入りのキャラクターにさまざまなアレンジを加えた差分画像をつくってみませんか? 背景やポーズ、服装を変えても、元のイメージをしっかりと残したまま、思い通りにアレンジできるので、画像生成の... -
【メディア掲載のお知らせ】レバテックフリーランスにてEdgeHUBが紹介されました
レバレジーズ株式会社様が運営する「レバテックフリーランス」にて、EdgeHUBが「AI・データサイエンスを学ぶためのおすすめサイト」として取り上げられました。 詳しくは、以下のリンクからご覧いただけます。ぜひご一読ください! AI・データサイエンスを... -
Sakana AIの進化的モデルマージVLM「Llama-3-EvoVLM-JP-v2」
Llama-3-EvoVLM-JP-v2は、Sakana AIが開発した日本語VLM(視覚言語モデル)です。 進化的モデルマージを用いて、複数画像のVLM、説明力の高いVLM、日本語のLLMの長所を組み合わせたモデルです。 この記事では、Llama-3-EvoVLM-JP-v2の使い方を分かりやすく...