高田様、こんにちは、松尾@木村・齋藤研です。 いつもの meeting の報告です。 それでは失礼します。 =============================================================== 5/22 第10回 meeting の報告 ○ GS <-> メモリ の通信で、読みと書き込みが 重なってしまう部分の処理 # メモリcache を 置いたりする ○ GS のメモリ容量 総計 < 行列の容量 の場合を考える。 この場合いままで考えてきた、ハウスホルダー変換では、 外部に、巨大な 行列A 用のメモリ(もしくは低速なデバイス) を持っていると、、GS の数に寄らず、計算速度が大体一定に なってしまう。つまりGS が 一個でも構わないことになる。 (入れ換えには 分割数に関わらず 2N^2 step かかる →つまり、毎回入れ換える必要のないアルゴリズムが必要) これは構成の問題より、アルゴリズムの問題であるが、この場 合でも、GS を増やしたことによるそれなりに速度の向上が望め るアルゴリズムがあるなら、商業的に意味があるらしい。 > 考えても思いつかない..... ○ 演算の 実際の演算時間は? ○ パイプラインのレイテンシーはどのくらい? ○ 掛け算 割算 sqrt の 記述は? 課題 : GS のメモリ容量 総計 < 行列の容量 のとき どうするか? 1 うまいアルゴリズムを考える 2 とりあえずswapしながら計算する。(ウルトラ遅い) 3 計算をあきらめる ================================================================