理論グループのミーティングの報告
日時:97/05/20
場所:齋藤理一郎 助教授 西5-517
メモリ,GL,GSの配置と ハウスホルダー変換の手順について
- ○今回の変更点は、GL のメモリの データバスを 独立にした。
-
- この様な構成にすると GL を通過して GS に 入力される場合についでに演算を加えることが出来る。
- ○ハウスホルダー変換の手順を示した。
- Wk Ck αk βk を求める。
- Pk を 求める
- qk を求める
- Ak+1 を求める
- チップ間の通信 がおおいのは Ak+1 の計算で
4 N2 /NGS cycle、
次に多いのが Pk+1 を求めるもので
N2 /NGS cycle
- 全ての k について の通信 は 約 5 N3/(3 NGS) cycle となる。
- ○上の説明のファイル読んでも わかるのは書いた人だけなので、データのフローを図に示す。
- データのフローの簡略図
- ○データ量と演算量と計算速度 の関係
- ハウスホルダー変換に必要な 計算は データ量 N に対して N^3 に比例した演算が必要といわれる。計算速度をあげるには、演算速度をあげるか、演算器の数を増やすことになる。演算器の速度は、そんなに自由にならないが、数の方は比較的自由である。ここでどのように メモリと演算器を構成すれば良いかを考えることになる。
- ハウスホルダー変換に必要な計算はベクトルの内積とか、引き算がほとんどであるが、それ(内積・引き算)を速くするために、演算器の数を増やしても、通信速度が律速になってしまう。なぜなら、データ数/2 と 演算回数 の 比は 1 : 1 程度であるから、演算器にデータを配る時間がそのまま、計算速度になってしまう。
- 計算速度を速くするには、同時に演算器にデータを送らなくてはならない。チップ のなかにすっぽり データが存在できれば、それは可能であるが、いまのところ実現不可能。
- ハウスホルダー変換は、ベクトルにわけて、それぞれ 別々に内積や引き算してもかまわないので、それぞれのベクトル計算を 並列に計算出来るので、そこに注目して、演算器を増やしたのが
今回の、Ver.2 の構成である。
(注: グェン君風邪で欠席)
戻る