スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

粒子法(SPH):1コアCPUでの検証その2

ただGPUを使えば速くなるというわけではないと痛感しました。
アルゴリズムの選択も非常に大事です。
前回結果はどうやらNeighbor Map作成の方法自体が遅いものだったようです。
SPH法の実装(GPU実装含む)を参考にGrid方式を採用しました。
結果は少し改善されて2→5fpsといったところです。
まだまだ遅すぎ。。。



さらにGrid方式の中で使用するSortについても工夫が必要でした。
高速化を意識したSort方式でないと速度がでません。
ここではQuick Sortを用いました。

で、さらに重大な事に気づきました。
SPH計算をせずに粒子の初期状態を表示させているだけで
10fps程度しかでていないんです!!
この時点でCUDAデモより10倍ほど遅いです。。。
描画自体も工夫しないといけないようです。

その他、1ステップ内の計算時間内訳。

スクリーンショット 2012-07-03 19.28.45

100fpsを達成するには少なくとも計算時間を0.01[s]以下にする必要がある訳で。
Neighbor Map部分はSort後の部分をGPU並列化しないとだめですね。
他、SPH計算の各部分もGPU並列化は必須のようです。
道のりは長い。。。

スポンサーサイト

コメントの投稿

非公開コメント

カレンダー
10 | 2017/11 | 12
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 - -
プロフィール

uglab

Author:uglab
ソフト開発会社

【Twitter】
フォローお願いします

【You tube動画一覧】
チャンネル登録お願いします


最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
検索フォーム
スポンサードリンク
    【スポンサードリンク】

リンク
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。