EdgeHub編集部– Author –

-
話題のgpt-ossとは?ローカル版ChatGPTで構築するAIエージェント【9/24開催】
OpenAIが新たに公開した「gpt-oss」は、ChatGPTと同等の性能をローカル環境で無料利用できるオープンソースモデルです。 「OpenAIのAPIコストが高い」「機密情報を外部に送るのが不安」といった課題を、ローカル実行によって解消できる新しい選択肢です。 ... -
Stable Diffusionで漫画を描こう!プロンプト設計から仕上げまで完全ガイド
Stable Diffusionの進化により、誰でも手軽に漫画制作へ挑戦できる時代になりました。 成功のカギは、プロンプト設計、モデル選び、そして仕上げまでのフローを正しく押さえること。 この記事ではStable Diffusionで便利なツールやプロンプトのコツまで、... -
Qwen ImageをComfyUIで使いこなそう!インストールから使い方まで徹底解説!
「Qwen Image」は、Alibaba Cloudが開発した画像生成AIです。日本語での指示を正確に理解し、高精度な画像を生成できる点から、今大きな注目を集めています。 そのポテンシャルを最大限に引き出すなら、ノードベースで柔軟なワークフローを組み立てられる... -
ChatGPTをクラウドGPUで!gpt-ossの使い方をゼロから解説
2025年8月5日、OpenAIはオープンソースモデル gpt-oss-120bとgpt-oss-20bを公開しました。 gpt-ossは、ChatGPTをローカル環境で自由に使える初のツールであり、使い方次第でさまざまな可能性を秘めています。この記事では、プログラミングやサーバーの知識... -
Stable Diffusionで視線をそらす方法!プロンプト(呪文)
Stable Diffusionで人物を生成すると、視線がカメラを向いてばかり…そんなお悩みはありませんか? 実は、プロンプトを少し工夫するだけで、カメラ目線を避けた自然な視線を簡単に作れます。 この記事では、Stable Diffusionで視線をそらすための具体的なプ... -
マルチモーダルRAGとは?仕組みと活用事例を徹底解説
従来のRAGでは、画像や音声を検索に活かすことはできませんでした。 この課題を解決するのが、画像・音声・動画などを統合的に扱える「マルチモーダルRAG」です。 この記事では、マルチモーダルRAGの仕組みや使い方について、わかりやすく解説します。 マ... -
マルチモーダルRAGとは?画像文書に強いRAGをデモで解説【8/27開催】
マルチモーダルRAGとは、画像とテキストを組み合わせて検索し、AIが文脈を理解して回答する手法です。設計書や取扱説明書、論文など、図表やグラフを多く含む文書の検索に利用されています。 ウェビナーでは、ColPaliを活用したマルチモーダルRAGの実装方... -
Civitaiの使い方完全ガイド!初心者でも安心
Civitaiは、Stable Diffusionで画像を生成する際に使用するモデルを探すのに便利なサイトです。 ただし、Civitaiは英語のサイトであるため、初めての方には使い方がわかりづらいかもしれません。 この記事では、Civitaiの基本的な使い方や便利な機能につい... -
ChatGPTで翻訳の精度を向上させるには?他ツールとの比較やプロンプト設定術
ChatGPTによる翻訳が注目を集める中、翻訳文書をそのまま使用できるのか、精度を上げる方法はないのかといった疑問をお持ちの方も増えています。 この記事では、ChatGPTを使用した翻訳の注意点、他の翻訳ツールと比較したChatGPTの特徴やプロンプトの設定... -
NVIDIA H200を深掘り、最強の次世代GPUを徹底解説!
NVIDIAの最新GPUであるH200は、AIやHPC分野で求められる計算能力を飛躍的に向上させた製品です。 本記事では、H200とは何か、その技術的な特徴や具体的な活用方法について掘り下げていきます。 さらに、NVIDIA H200を導入する際に起こりうる問題点や、それ...