Data Commonsは、信頼性の高い機関から収集した膨大な公開データを、単一のAPIを通じて簡単にアクセスできるようにしています。
Data Commonsの信頼性の高いデータをLLMに提供することで、ハルシネーションの発生を抑制できます。
この記事では、Data Commonsの概要から、アカウントの作成手順やAPIキーの取得方法まで解説しています。
Data Commonsとは
Data Commonsは、Googleが提供するプロジェクトで、信頼性の高い機関から収集した膨大な公開データを、単一のAPIを通じて簡単にアクセスできるようにしています。
健康、経済、人口統計、環境、教育など多岐にわたるトピックをカバーし、自然言語インターフェースを通じて、データの探索や質問が可能です。
LLMの「ハルシネーション」問題に対しては、RIGとRAGという手法を用いて、Data Commonsの信頼性の高い統計データを参照し、事実に基づいた情報を生成することができます。
Data Commonsのアカウント作成
Data Commonsのアカウントを作成します。
初めて登録する場合は、「Create an account」をクリックします。
ユーザー情報を入力して、利用規約に同意しチェックを入れて、「Create Account」をクリックします。
登録したメールアドレスに認証メールが届きます。
認証URLをクリックすると、アカウント作成が完了です。
Data CommonsのAPIキーの取得方法
Data CommonsのAPIキーの取得方法を解説します。
「App Name」に任意の名前を入力します。
「Data Commons API」と「Data Commons NL API」の「Enable」をクリックします。
Data Commons API
Data Commonsの主要なAPIで、統計データの取得やグラフクエリの実行など、さまざまな操作をプログラム的に行うためのインターフェースです。REST APIリクエストは、api.datacommons.org
のエンドポイントで処理されます。
Data Commons NL API
自然言語を利用してデータにアクセスするためのAPIで、特にDataGemmaツールで使用されます。DataGemmaは、自然言語インターフェースを通じてユーザーが簡単にデータを取得できるようにするツールです。これらのリクエストはnl.datacommons.org
のエンドポイントで処理されます。
「SAVE」をクリックして、設定を保存します。
「API Keys」にAPIキーが表示されますので、コピーして大切に保管します。
生成AI・LLMのコストでお困りなら
GPUのスペック不足で生成AIの開発が思うように進まないことはありませんか?
そんなときには、高性能なGPUをリーズナブルな価格で使えるGPUクラウドサービスがおすすめです!
GPUSOROBANは、高性能GPU「NVIDIA H200」を業界最安級の料金で使用することができます。
NVIDIA H200は、生成AI・LLMの計算にかかる時間を大幅に短縮することが可能です。
クラウドで使えるため、大規模な設備投資の必要がなく、煩雑なサーバー管理からも解放されます。