スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

OpenCL GPGPU:陽解法、応力増分計算部分の並列化その2

GPGPUを使ってシングルスレッドCPUに勝つのは当然のこと。
OpenMPによる6スレッドCPU演算との比較を行いました。
結果はGPU勝利。
しかし計算速度は2倍にも届かずといったところ。
何10倍というわけにはいきませんでした。

スクリーンショット 2012-06-14 18.48.07 FEM_BLOCK_beam_drop_v207_thread6.jpg

PCが違うので正確な比較はできませんが。

「PC概要」
GPU演算PC:Intel Core i7 2.66GHz
      NVIDIA GeForce GT330M 512MB
CPU演算PC:Intel Core i7-2630QM 2.00Ghz
      演算には6スレッドを使用

「計算時間」
GPU:51[s]
CPU:82[s]

「解析FEMモデル概要」
要素数:6216
節点数:10358
自由度:31074

爆速というわけにはいきませんでした。
1ステップにおける応力計算部分のGPU演算時間が約0.02[s]
つまり全体(1000ステップ)で20[s]費やしているわけです。
GPUへの転送時間が問題かと思いましたが
演算時間でこれだけかかっているのでこれ以上工夫の方法がないです。。。

あとはGPUの性能を上げるしかないですかね。

スポンサーサイト

コメントの投稿

非公開コメント

カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
プロフィール

uglab

Author:uglab
ソフト開発会社

【Twitter】
フォローお願いします

【You tube動画一覧】
チャンネル登録お願いします


最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
検索フォーム
スポンサードリンク
    【スポンサードリンク】

リンク
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。