Data Commonsは、信頼性の高い機関から収集した膨大な公開データを、単一のAPIを通じて簡単にアクセスできるようにしています。
Data Commonsの信頼性の高いデータをLLMに提供することで、ハルシネーションの発生を抑制できます。
この記事では、Data Commonsの概要から、アカウントの作成手順やAPIキーの取得方法まで解説しています。
Data Commonsとは

Data Commonsは、Googleが提供するプロジェクトで、信頼性の高い機関から収集した膨大な公開データを、単一のAPIを通じて簡単にアクセスできるようにしています。
健康、経済、人口統計、環境、教育など多岐にわたるトピックをカバーし、自然言語インターフェースを通じて、データの探索や質問が可能です。
LLMの「ハルシネーション」問題に対しては、RIGとRAGという手法を用いて、Data Commonsの信頼性の高い統計データを参照し、事実に基づいた情報を生成することができます。
Data Commonsのアカウント作成

Data Commonsのアカウントを作成します。
Data Commons API Portalにアクセスして、「Sign In」をクリックします。

初めて登録する場合は、「Create an account」をクリックします。

ユーザー情報を入力して、利用規約に同意しチェックを入れて、「Create Account」をクリックします。

登録したメールアドレスに認証メールが届きます。
認証URLをクリックすると、アカウント作成が完了です。

Data CommonsのAPIキーの取得方法

Data CommonsのAPIキーの取得方法を解説します。
Data Commons API Portalにログインし、右上の「My Apps」をクリックします。

「App Name」に任意の名前を入力します。
「Data Commons API」と「Data Commons NL API」の「Enable」をクリックします。

Data Commons API
Data Commonsの主要なAPIで、統計データの取得やグラフクエリの実行など、さまざまな操作をプログラム的に行うためのインターフェースです。REST APIリクエストは、api.datacommons.org
のエンドポイントで処理されます。
Data Commons NL API
自然言語を利用してデータにアクセスするためのAPIで、特にDataGemmaツールで使用されます。DataGemmaは、自然言語インターフェースを通じてユーザーが簡単にデータを取得できるようにするツールです。これらのリクエストはnl.datacommons.org
のエンドポイントで処理されます。
「SAVE」をクリックして、設定を保存します。

「API Keys」にAPIキーが表示されますので、コピーして大切に保管します。

生成AI・LLMのコストでお困りなら
GPUのスペック不足で生成AIの開発が思うように進まないことはありませんか?
そんなときには、高性能なGPUをリーズナブルな価格で使えるGPUクラウドサービスがおすすめです!

GPUSOROBANは、高性能GPU「NVIDIA H200」を業界最安級の料金で使用することができます。
NVIDIA H200は、生成AI・LLMの計算にかかる時間を大幅に短縮することが可能です。
クラウドで使えるため、大規模な設備投資の必要がなく、煩雑なサーバー管理からも解放されます。