専用コンピュータが汎用に負けた2025年02月01日 11:42

専用コンピュータが汎用に負けた
 天文学専用コンピュータ・アテイル3の解説を国立天文台がするというので聞いてきたのだが、想像していたのとは全然違った。
 万有引力の法則で引き合う物体の運動は対象が2個なら数学で解けるが、3個以上になると解けないというのは有名だ。よくある誤解は、「解けない」=「答がない」。解けないというのは純粋な数学だけではできないという意味で、答えがないわけではない。
 星や銀河の誕生のように、何万、何億と物体が集まってできるのを、それぞれの位置と速度、受ける力を時間と空間を細かく刻んで、ごり押しで計算する。この重力多体問題というと、90年代から四半世紀ぐらいにわたって東大のGRAPEが有名だった。学生が秋葉原あたりで買ってきたLSIを使って、特定の計算をソフトではなく、ハードでやってしまう。他の計算に使える汎用性が全くないのだが、その代わり、重力多体問題に関してだけは、当時のスパコンの100分の1ぐらいのコストで同じレベルの計算ができ、多大な成果を上げた。
 アテイルも専用と言うからにはそういうものだと想像していたのだが。GRAPEとの関係を質問したら予想外だった。
GRAPEが進化するに従い、そのコストも上がってくる。CPUやGPUなどと呼ばれる市販の汎用プロセッサの高性能化が凄まじく、ついに価格競争でGRAPEが何にでも使えるコンピューターに勝てなくなってしまったというのだ。で、アテイル3には、インテルXeon(ジーオン)シリーズというサーバー用の市販CPUが入ってる。天文学専用に設置したが、使おうと思えばほかのことにも使えないわけじゃない。
 かつて、大きな企業は、自社の業態に特化した機能だけを持つ業務用プログラムをかなりの予算で独自開発していた。Windowsを買えば付いてくるエクセルなどの性能が馬鹿上がりして機能でもコストでもたちうちできないので、今じゃ市販品を使うのが普通。

■実は、前身のアテイル2より計算速度は遅い
 アテイル3の理論ピーク性能(計算速度みたいなもの)は2.2ペタフロップス(Pflops)で、前世代のアテイル2の3Pflopsより落ちる。この速度を犠牲にして、CPUとメモリーの間のデータのやりとりの速度を2倍以上にした。
 例えば、A+B=Cという計算をする際、CPUはメモリーからAとBという値を持ってきて、足し算という演算をし、Cという結果をメモリーに戻すという手順が必要。演算1回に対し、メモリーとのデータ転送が3回になる。この転送速度と計算速度の比をB/Fという値で表すのだが、アテイル2では0.1を切っているのが、アテイル3では0.3に向上した。アテイルで走らせているプログラムはこの比が0.1~1.0ぐらいのところなので、アテイル2だと計算の速さにデータ転送が追いつかず、計算は終わっているのに、メモリーへの転送待ちがしょっちゅう生じているということ。
 このアンバランスを解消した。
個人用のPCでも同じようなことがあった。90年代、CPUの性能(クロック周波数やマルチコア化)がどんどん上がり、ペンティアムなどが登場すると、計算速度が上がったけど、メモリーへの読み書きがついて行けなくて、結局、モニターの前で待たされることになった。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

名前:
メールアドレス:
URL:
コメント:

トラックバック

このエントリのトラックバックURL: http://kajiyan.asablo.jp/blog/2025/01/31/9751369/tb