高田様、こんにちは、松尾＠木村・齋藤研です。いつもの meeting の報告です。それでは失礼します。 =============================================================== 5/22 第１０回 meeting の報告 ○ GS <-> メモリの通信で、読みと書き込みが重なってしまう部分の処理 # メモリcache を置いたりする ○ GS のメモリ容量総計 < 行列の容量の場合を考える。この場合いままで考えてきた、ハウスホルダー変換では、外部に、巨大な行列A 用のメモリ(もしくは低速なデバイス) を持っていると、、GS の数に寄らず、計算速度が大体一定になってしまう。つまりGS が一個でも構わないことになる。 (入れ換えには分割数に関わらず 2N^2 step かかる →つまり、毎回入れ換える必要のないアルゴリズムが必要) これは構成の問題より、アルゴリズムの問題であるが、この場合でも、GS を増やしたことによるそれなりに速度の向上が望めるアルゴリズムがあるなら、商業的に意味があるらしい。 > 考えても思いつかない..... ○ 演算の実際の演算時間は? ○ パイプラインのレイテンシーはどのくらい? ○ 掛け算割算 sqrt の記述は? 課題 : GS のメモリ容量総計 < 行列の容量のときどうするか? 1 うまいアルゴリズムを考える 2 とりあえずswapしながら計算する。(ウルトラ遅い) 3 計算をあきらめる ================================================================