松尾君 グェン君 だんだん環境が整って来ましたね。5/6 (火) 9:00 から こちらで もセミナーを開いて作業をいたしましょう。当面はいままで皆さん が勉強したことを話してもらいます。windows に表示できる画面で あれば、projector にうつせますので、資料、OHP、卒論と多用途 に使えるように作ってみて下さい。 八木君 一番したに 八木君に質問があります。 高田様 昨日は楽しかったです。社長様に宜しくお伝え下さいませ。 -------- 電気通信大学電子工学科 齋藤 理一郎 rsaito@tube.ee.uec.ac.jp 以下コメントです。 Ryouma> =========================================================== Ryouma> 5/1 第 7回 meeting の報告 Ryouma> 今日のmeeting の話題 Ryouma> ○ボードには FLEX10K が 4個まで この ボードは存在するのですか? それともこれから設計するので すか? Ryouma> ○ICの構成はどうするか -> Ex. 内積unit 内積unit と メモリを配置した構成ですが、内積 unit に段取りを 伝えるところが必要だと思います。 Ryouma> ○ICとメモリの接続構成 -> 外付 や chip内部にVHDL で書く FPGA では メモリーを幾つ積むことができるのですか? Ryouma> ○定数倍も同様に出来る Ryouma> ・内積の例 Ryouma> Ryouma> +---+ +---+ +---+ +---+ Ryouma> |MUL|=>|ADD| とか |MUL|====|MUL| Ryouma> +---+ +---+ |ADD|====|ALL| Ryouma> +---+ +---+ 右の図が不明です。 Ryouma> ・メモリーの構成 Ryouma> 共通バスにする? Ryouma> ↓ Ryouma> +-----+ 双方向?+-----+ ? Ryouma> PC D <==32==>| |-+-------| |----+ Ryouma> <==10==>| | | | | | Ryouma> etc. <===8==>| |----+----| |-+ | Ryouma> +-+---+ | | +-+---+ | | Ryouma> | | | | | | Ryouma> 5 +------+ 5 +------+ Ryouma> +---+メモリ| +---+メモリ| Ryouma> +------+ +------+ Ryouma> SIM 32M SIM 32M Ryouma> ↑ ↑ Ryouma> chip に独立? ___/______/ Ryouma> #chip独立メモリ と 共通のメモリ一つ の構成だと pin 足りるかな? このへんは全く今までの考え方に因われないで設計したいものです。 Ryouma> ○1/x や srqt(x) Ryouma> MD chip の 関数発生機は Ryouma> Ryouma> bit列の 上位bit+下位数bit を table index として Ryouma> 上位の数bit+下位bit を delta X として、 Ryouma> C0 + C1X + C2X^2 + C3X^3 + C4X^4 という計算をするようだ Ryouma> table は 4K x 128 だそうです。 Ryouma> ↓ <-delta X-> ↓ Ryouma> +--------+---------+---------+ Ryouma> | e | MH | ML | Ryouma> +--------+---------+---------+ Ryouma> ↑<-table inddx->↑ Ryouma> Ryouma> #今回のは大きめのテーブルを使えるかも? 多項式に近似する方法は、よく行われます。有限の数の場合には Tayler 展開より良い方法があります。log はだめですか? Ryouma> ○宿題のコンパイル Ryouma> 並列の内積unit (n = 4) を書いてきた。 それはすごい。原理的に 4 倍の speed がでますか? Ryouma> 一番大きいchip に 7,8 個の演算部(32bit)が入るようだ。 Ryouma> もっと入るかな? 掛け算と足し算がどれぐらい速度が違うのでしょうか? それによっ ては、掛け算の演算部と足し算の演算部の数が違うことも考えられ ます。 Ryouma> VHDL を書き慣れてきたらしく、すんなりコンパイルできた Ryouma> △でも掛け算がまだ 通らない authorization code がきました。flex のほうですが... いれてお きました。 Ryouma> ○試作ボードをどのような物にするか考える まず動くことを第一目標に考えましょう。 Ryouma> 今回の課題 : chip とメモリの構成をどうするか 考える。 Ryouma> 当面の課題と同じ。 メモリの大きさですが、1000x1000 の実数行列 (n=1000) で 8MB 10000x10000 で 800MB です。これに 作業領域として 7n の空間が必要です。ハ ウスホルダー変換と逆変換のところ以外は作業領域の空間のみで全 ての計算ができます。したがって、作業領域は必ず chip 内にある 必要があります。また 内積 の計算 A x B で A が いつも同じで B が変わっていく計算があります。(行列の掛け算を想像して ください。) これには特別に対応し A は 1 度しか load しません。 ハウスホルダー変換と逆変換のところでも、作業領域 があると便 利です。 八木君この大きさはどれぐらいですか? 7n の 作業領域に含まれま すか? 内積の次元の最大数は n ですから 1000 - 10000 で 最少は 2 です。内積の次元数によらず効率良く処理することが 必要です。 Ryouma> =============================================================