先做轉置 (det)。
因為 CPU 會一次 fetch 1byte in each row, 而 matrix mul 是 col * row,所以可以直接把做一次 det(row) -> col,就能直接 fetch det(row) -> col。速度較快!
不要使用 recursive,因為 OS 要 handle 很多 stacks is a heavy-loading job。直接改用多個 whilie 把 huge-matrix 展開,開 threads 去分割成 strsen algo smaller-matrix.
這是 yrchen 給的 common hint.
2 則留言:
WOW
a2n 越來越專業了! :D
do you wanna provide subversion repo ? :P
張貼留言