NVIDIA A100とは？販売終了したのに性能はすごい！価格情報も

2025年4月16日

NVIDIA A100は、トレーニングや実行に特化した、非常に高性能なGPUで、AIを作るときや動かすときに必要な計算を速く、効率的にこなせる特別なコンピュータパーツです。

この記事ではNVIDIA A100のすごさを解説していきます。

無料ウェビナー！

参加者募集中

NVIDIA A100とは？

NVIDIA A100は、AI、データ分析、高性能計算を劇的に高速化する強力なGPUです。

GPUについてはこちらに詳しい記事がありますのでご参照ください。

NVIDIA A100は、AIやデータ解析の分野で大きな貢献を果たしたGPUです。

ディープラーニングのモデルを素早く処理したり、科学研究をより効率的に進めたりするための新しい基準をA100が作ったといっても過言ではありません。計算の効率が高く、消費電力も抑え、パフォーマンスと省エネの両方を実現しています。

画像分類、物体検出、自然言語処理といったタスクのベンチマークで、前世代のGPUを大きく上回ってきました。

ここでは、NVIDIA A100がどれだけすごいのか、主な特徴をまとめました。

Ampereアーキテクチャは、NVIDIAが開発したGPUアーキテクチャで、GeForce RTX 30シリーズやNVIDIA A100 GPUなどに搭載されています。

前世代のTuringアーキテクチャと比較して大幅に進化し、とくにワット当たりの性能が最大1.9倍向上しました。その結果、電力効率が改善されています。

Ampereアーキテクチャには、108個のSM（ストリーミングマルチプロセッサ）が搭載されており、それぞれに以下のような計算ユニットが含まれています。

Ampereアーキテクチャでは、AIの計算効率を高めるために「スパース性」の活用が強化されました。

AIの計算では、大量のデータを処理しますが、その中には「ほとんど影響を与えないデータ」も含まれています。スパース性を活用することで、この不要なデータを間引き、重要な部分だけを効率よく計算できます。

Ampereアーキテクチャの導入により、A100は従来のGPUよりもAI処理やデータ解析がより高速かつ効率的に行えるようになり、幅広い分野で活用が進んだのです。

GPUコア「GA100」とは、NVIDIAが開発したAmpereアーキテクチャに基づくGPUコアで、高性能コンピューティング（HPC）やAI、ディープラーニング向けに設計されたプロセッサです。

GA100は6個のHBM2モジュールと12個の512bit HBMコントローラーを搭載しています。

初期バージョンはメモリ容量40GB、帯域幅1,555GB/秒だったのに対し、新バージョンでは80GB、2TB/秒と大きく性能が向上しているのが特徴です。

GA100は、高帯域幅で大規模データ処理を効率化します。

CUDA（Compute Unified Device Architecture）は、NVIDIAが開発した並列計算用のプラットフォームおよびプログラミングモデルです。

CUDAは、NVIDIA製GPUを使った並列計算を可能にする開発ツールで、グラフィックス以外の汎用計算（GPGPU）を実現します。

C、C++などのプログラミング言語と互換性があり、AI、科学計算、映像処理、金融モデリングなど幅広い用途で計算高速化が可能です。

NVIDIA GPU専用に設計され、並列処理や専用ライブラリ（cuBLAS、cuDNNなど）を提供して科学技術やAI分野の効率化に大きく貢献しています。

A100 80GB PCIeとA100 80GB SXMの比較表は以下になります。

項目	A100 80GB PCIe	A100 80GB SXM
FP64	9.7 TFLOPS	9.7 TFLOPS
FP64 Tensor コア	19.5 TFLOPS	19.5 TFLOPS
FP32	19.5 TFLOPS	19.5 TFLOPS
Tensor Float 32 (TF32)	156 TFLOPS	312 TFLOPS
BFLOAT16 Tensor コア	312 TFLOPS	624 TFLOPS
FP16 Tensor コア	312 TFLOPS	624 TFLOPS
INT8 Tensor コア	624 TOPS	1248 TOPS
GPU メモリ	80GB HBM2e	80GB HBM2e
GPU メモリ帯域幅	1,935 GB/秒	2,039 GB/秒
最大熱設計電力（TDP）	300W	400W
マルチインスタンス GPU （MIG）	最大 7 基の MIGs @ 10GB	最大 7 基の MIGs @ 10GB
フォームファクター	PCIe（デュアルスロット空冷またはデュアルスロット液冷）	SXM
相互接続	NVIDIA NVLink Bridge（2 GPU 用: 600GB/秒）、PCIe Gen4: 64GB/秒	NVLink: 600 GB/秒、PCIe Gen4: 64GB/秒
サーバーオプション	1～8 GPU 搭載のパートナーおよび NVIDIA-Certified Systems	NVIDIA HGX A100（4、8、16 GPU 搭載のパートナーおよび NVIDIA-Certified Systems）、8 GPU 搭載の NVIDIA DGX A100

仕様データ（出典：NVIDIA）

それでは、NVIDIA A100とその他にラインナップされているGPU製品を性能面で比較してみます。

A100は、ハイエンドとローエンド製品のちょうど真ん中あたりに位置しますが、NVIDIAエンタープライズ（サーバー利用）向けのGPUは、ローエンド製品でも十分な高性能です。

	NVIDIA H200 Tensor Core GPU	NVIDIA H100 Tensor Core GPU	NVIDIA A100 Tensor Core GPU	NVIDIA L40S	NVIDIA A40 Tensor Core GPU
FP64	34 TFLOPS	24.0 TFLOPS	9.7 TFLOPS	－	－
FP64 Tensor コア	67 TFLOPS	48.0 TFLOPS	19.5 TFLOPS	－	－
FP32	67 TFLOPS	48.0 TFLOPS	19.5 TFLOPS	91.6 TFLOPS	90.5 TFLOPS
TF32 Tensor コア（スパース性機能）	989 TFLOPS	400 TFLOPS （800 TFLOPS）	156 TFLOPS （312 TFLOPS）	366 TFLOPS	90.5 TFLOPS （181 TFLOPS）
BFLOAT16 Tensor コア（スパース性機能）	1,979 TFLOPS	800 TFLOPS（ 1,600 TFLOPS）	312 TFLOPS （624 TFLOPS）	733 TFLOPS	181.0 TFLOPS （362.1 TFLOPS）
FP16 Tensor コア（スパース性機能）	1,979 TFLOPS	800 TFLOPS （1,600 TFLOPS）	312 TFLOPS （624 TFLOPS）	733 TFLOPS	181.0 TFLOPS （362.1 TFLOPS）
FP8 Tensor コア（スパース性機能）	3,958 TFLOPS	1,600 TFLOPS （3,200 TFLOPS）	－	1,466 TFLOPS	362 TFLOPS （724 TFLOPS）
INT8 Tensor コア（スパース性機能）	3,958 TFLOPS	1,600 TFLOPS （3,200 TFLOPS）	624 TFLOPS （1,248 TOPS	1,466 TFLOPS	362 TFLOPS （724 TFLOPS）
倍精度演算性能	－	－	－	－	－
単精度演算性能	－	－	－	－	－
GPUメモリ	141GB	80 GB HBM2e	80 GB HBM2e	48 GB GDDR6	48 GB GDDR6