2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

数値計算に最適なCPU

1 :名無しさん@3周年:03/12/27 21:50
Pentium4
Xeon
Itanium
Athron64
Opteron
Alpha
PowerPC


どれがいい?

2 :名無しさん@3周年:03/12/27 22:13
Athlon64

3 :名無しさん@3周年:03/12/27 22:58
計算と言えば4004

4 :名無しさん@3周年:03/12/27 22:58
Fortran90/95ならIntelのコンパイラ使うということで、やはりP4、Xeonかな。
Fortran77、C/C++ならどうだろう?
Athron64、Opteronって早いのかな?

5 :名無しさん@3周年:03/12/28 11:56
Celeron でGamess動いてます。 P4と変わんないかんじ。
PCクラスタなのですが、PCそのものの騒音が小さいことが大事(部屋が狭いので)
クラスタ自分で組むならこれが一番割安かとおもはれ

6 :名無しさん@3周年:03/12/30 16:29
FPU が貧弱な VIA C3 はいかが?

7 :名無しさん@3周年:03/12/30 16:42
C3はFPU以前に686用に書かれたコードが動かんからなぁ・・・。

8 :名無しさん@3周年:03/12/30 21:36
Opteronはどうなんでしょうね?
インテルコンパイラで最適化のXeonとどっちが早いのかな?

9 :名無しさん@3周年:03/12/31 05:44
>>8
Opteron
ttp://www.specbench.org/cpu2000/results/res2003q4/

10 :名無しさん@3周年:04/01/01 03:35
Opteronの相手はItanium2であり、Xeonではない.

11 :名無しさん@3周年:04/01/01 10:48
Itaniumは完全に失敗作だと思うし、何より値段が高すぎる

12 :名無しさん@3周年:04/01/02 22:32
昔DECがミニコンのハイエンドに回路素子としてECLを採用したVAXを
作って、まさにミニコンのメインフレームですという製品を作ったが、
結果的にこれがDECが急速に傾く原因の一つになったと思う。

現状のITANIUMはいってみれば、WSのCPUであってPCのCPUではない。
HPの為の部品にはなるだろうが。DECのALPHAが技術的にはうんと先行
していてソフトウェアもしだいに蓄積しつつあったのに、なぜか敗退
したのと同じ理由でITANIUMも敗退しそうな気がするよ。とにかく現状の
消費電力等では、あれは一般PCやまちがってもノートPCにはならない。
値段も電機消費量も高過ぎる。コンパイルも遅すぎ。

13 :名無しさん@3周年:04/01/02 22:44
ここは、数値計算に最適なCPUを語るスレです。

14 :名無しさん@3周年:04/01/02 23:47
>>13
誤爆か?

15 :名無しさん@3周年:04/01/03 01:33
数値計算屋は、消費電力が10kWだろうが10MWだろうが挑戦をする人種です。

16 :名無しさん@3周年:04/02/05 02:15
区間演算を真面目にサポ-トした演算機構を持ったCPUを作ってくれよ。

17 :名無しさん@3周年:04/02/10 02:01
プレスコの31段パイプラインはどーよ?

18 :名無しさん@3周年:04/02/10 10:03
>>16

大石タン監修ということでよろしいでつか?
それとも中尾たん?
精度保証つき数値計算は21世紀の主流になるんでしょうかね.

19 :名無しさん@3周年:04/02/14 17:57
領域分割FEM計算(市販コード)で、P4 3GHz 16node16CPU 対 Opteron 246 8node16CPUで、
計算時間で20%ほどOpteronの方が速かった。ちょっとびっくり。

20 :名無しさん@3周年:04/02/16 03:46
>>19
maji-de?

21 :名無しさん@3周年:04/02/16 09:46
同じプロセッサで1cpu×16と2cpu×8のクラスタを組んでも
そのくらいの差は出るんじゃないの?

22 :名無しさん@3周年:04/02/18 03:44
PCクラスタならば1x16の方が20%速いと言う事ですね。
PCクラスタにSMPを混ぜるなんざ足引っ張ってくれちゃって
他のシングルCPUマシンのロードアベレージが60%くらいしか出ない罠

23 :名無しさん@3周年:04/03/02 13:36
>>19
市販コードな時点で・・・
コンパイルは自分でやったの?
pen4はpen4用の最適化をしないとダメダメさんですよ。

24 :名無しさん@3周年:04/03/02 13:37
>>22
2x8のopteronの方が速いって言ってんじゃねーの、19は。

25 :名無しさん@3周年:04/03/03 00:31
インテル謹製のコンパイラ使ってコード選べば
発熱分の能力向上はあるようだ。プレスコット。

http://pc.2ch.net/test/read.cgi/linux/1007024009/l50

26 :19:04/03/06 16:07
>>23
コンパイルはベンダーさんまかせだけど、Pen4のベンダさんは
Intelコンパーラ使用。Opteronのベンダさんは
Intelコンパイラの32bitとPGI/64bitと試してくれた。

Intelコンパイラ対PGIのほうが速かったけど、コードのバージョンがちがったり...
Pen4対Opteronは、コードのバージョンもコンパイラも同じ。
# 最適化オプションはベンダまかせだけど。

>>24
そです。ふつー(というかPen4は)SMP構成にするとパフォーマンス
落ちていくから、スペースが許すなら1CPU16ノードにするけど、
Opteronなら2CPU8ノードでOKと。
市販コードだからCPU数で値段がきまる。ハードウェア価格より
ライセンス料のほうが高くなるから、Pen4でいくならシングルプロセッサ
構成しか考えられない。でもオプテロンは違った、と。

27 :名無しさん@3周年:04/03/14 01:50
pen4 だね

28 :名無しさん@3周年:04/03/20 10:52
ここに各CPUの速度が乗ってるから参考にしてみそ。
http://n0cgi.distributed.net/speed/  

以下、自作板より宣伝。


数学・情報学の基礎研究しま専科?

UD,SETIと同様の分散処理プロジェクトのお誘いです。
  それは、クライアントを一つダウンロードし実行するだけ。
皆様の通常の作業にほとんど影響しないよう、実行されます。
メールアドレス一つで登録可能。あなたの力をわけて下さい。
   Win,Unix,MacOS ,Linux,Freebsd等ほとんどのアーイテクチャやOSに対応済み。
・ 参加方法、質問等は自作PC板で。
【自作PC】 Distributed.net の2chチーム作ってみますた
 http://pc3.2ch.net/test/read.cgi/jisaku/1076947927/


29 :名無しさん@3周年:04/03/26 01:19
age

30 :名無しさん@3周年:04/04/17 02:30
最適の定義をしないで議論しても無駄。
全てのデジタルコンピュータはチューリングマシンと同等で
できることも原理的には皆同じ。

31 :名無しさん@3周年:04/04/30 15:12
分野で区別したらどうよ?
Pentium4,Xeon→何でもそつなくこなせるが分岐予測のペナルティーが大きいので分岐の少ない計算向け
           LinuxだとIntelのコンパイラが無料で使える
           Xeonは周波数が低いけど信頼性やMultiProcesserで動作させたい人へ
Itanium→コストパフォーマンス悪すぎ、でも金があるからそんなの気にしない所向け
Athron64,Opteron→Pen4系よりもコストパフォーマンスに優れるがFortranコンパイラにifcを使っても完全に最適化されないので不利
            C,C++コンパイラは選択肢多いので特に問題はない。OSなどの環境が整うまでもう少し待つ必要があるが
            数値計算にしか使わないのであればすでに十分環境は整っている。
Alpha→未来はない
PowerPC→使ったことないので他の人のコメント待ち。
ベクトルCPU→流体・有限要素・第一原理(連立シュレーディンガー方程式)を解くにはいまだに最強!
         ただし、コストパフォーマンスは?が付くので買うよりも計算機センターのリソースを借りた方が安い

科研費はずれたのでどれも買えないよ(´д`)
それじゃなくても計算機の性能が低すぎてやりたいシミュレーションできないのに・・・
計算機のスペック低い→先進的なシミュレーションが出来ない→結果が出ない→科研費もらえない
のスパイラルに陥ってる気がする(−−;
というか自宅のPCクラスタの方が研究室の計算機よりも早いってのはどうよ\(`Д´#/
電気代くれ (TдT)

32 :名無しさん@3周年:04/04/30 19:06
PowerPC G5はまあまあいいらしい。コンパイラの話も聞いたけど忘れた。
何せ自分で使ってないもんで。使ってる人のコメントを漏れも期待。

33 :名無しさん@3周年:04/04/30 20:03
>>31
漏れもそんな感じで認識してる。
今買うならopteronかpentium4だよね。

34 :名無しさん@3周年:04/04/30 22:35
日本をブロードバンド大国に押し上げたのは堺屋太一の功績が大きい。

森内閣のIT担当大臣&経企庁長官として「IT基本法」を策定した堺屋太一。
IT基本法によってNTTの通信回線網が開放され、日本のブロードバンド料金
が世界最安になったことは皆さんご存知の通りです。

その堺屋太一の未来予測小説「平成三十年」に注目!
http://f37.aaacafe.ne.jp/~sakaiya/index.html

35 :名無しさん@3周年:04/06/15 04:39
ウチはビンボーなんでFC2+プレスコ+ifortだけど、速いよぉ。
大きめ配列の計算だと、RH9+ノースウッドの2倍以上出る。

36 :名無しさん@3周年:04/06/17 06:32
スッゲ

37 :名無しさん@5周年:2005/11/08(火) 23:45:16
一年と五ヶ月か・・・

38 :名無しさん@5周年:2005/11/09(水) 18:01:34
モバアス64で数値計算をしようと思うんですけど、
5時間ぐらい計算し続けたら壊れちゃいますかね?

39 :名無しさん@5周年:2005/11/24(木) 15:38:50
古木 トロンチップだって絶滅寸前でしょうが!

新田 そうでもありませんよ。
      そもそも「RISCの時代だ」なんて言ったって、
      アメリカで作られたMPUで売れてるのは
      インテルとスパークだけでしょう。インテルはCISCだし。
      パソコン・ワークステーションは「互換性」の壁で、
      結局は入る隙間が無いですが、
      組み込みチップとしてGマイクロでもローエンドなやつとか、
      93年頃に開発されたM16はかなり広範囲で使われています。

中野 M16ってトロンチップだったんですか?
      SHマイコンあたりと並べてトロンチップと対比して、
     「落ち目のトロンチップに比べて、日本製でも売れてる」と
      引き合いに出す人もいるけど・・・

新田 トロンチップですよ。
      三菱はトロンチップの最ローエンド品の、Gマイクロ100が
      一番売れたんで、さらに下のM16を造ったんです。

40 :名無しさん@5周年:2006/01/30(月) 21:26:58
ベクトルプロセッサってどこで売ってんのよ?
直接ベンダに掛け合うしかないわけ?

41 :名無しさん@5周年:2006/01/31(火) 16:05:53
x86なCPUは数値計算に向いてないよな
でも価格を考えると他に選択肢ない・・・

42 :名無しさん@5周年:2006/01/31(火) 19:23:09
Itanium2は向いてるな。
2器のハードウェアの拡張倍精度演算積和演算器
+128個の浮動小数点レジスタ
+プレディケート
短精度を速くしたら多分最強

43 :名無しさん@5周年:2006/01/31(火) 22:20:52

最適ってなにを最適化とする訳なのか・・・
価格?
価格性能比?
絶対速度?



44 :名無しさん@5周年:2006/02/03(金) 20:34:24
映画タイタニックがLinux並列マシンで作成されてた頃、Alphaが一番て昔は言われてた気がするけど、今はPentiumで十分な気がするけど、時代の流れに取り残されたからわかんないなぁ

45 :名無しさん@5周年:2006/02/03(金) 20:38:34
やっぱ羽柴秀吉が時代の主役になるのかな?、選挙出てテレビ出てすごいね、お家も平等院鳳凰堂から国会議事堂にグレードアップしてたし〜

46 :名無しさん@5周年:2006/02/05(日) 00:26:02
>>42
itaniumはx86じゃないけどな

つうか最近安いのは何故?

47 :名無しさん@5周年:2006/02/06(月) 20:09:27
Opteronって数値計算向きかなぁ?最近やたら採用されまくってるけど。
バス幅がショボすぎだと思うんだが・・・

48 :名無しさん@5周年:2006/02/07(火) 09:03:08
貧者にとおてのスーパーカーみたいなもんだとおもふ
他からみるととろい

49 :名無しさん@5周年:2006/02/13(月) 13:56:06
これからの数値計算向きなCPUってどうなるんかな?
Cellみたいなのが流行って安くなってくれればかなり良いよね

50 :名無しさん@5周年:2006/02/14(火) 00:40:38
>>46
デュアルコア版のアレがそろそろ出るから
シングルコアは在庫処分してんじゃね?

51 :名無しさん@5周年:2006/02/18(土) 11:38:34
PentiumM780
Xeon 3.6GHzのPowerEdge SC1425よりThinkPad T43p の方が速かった...orz


52 :名無しさん@5周年:2006/02/18(土) 18:50:37
自慰恩はオワットル
淫照も位置づけに困ってるほど

53 :名無しさん@5周年:2006/02/21(火) 22:25:44
51です
MPIパラレル演算させたところ
同じ自慰恩3.6GHzなデュアルCPUマシンの4CPUパラレルより
PentiumD8402台(デュアルコアx2)パラレルの方が1.3倍早かった。
クロックだけ見てちゃダメですね。
確かに電気だけ食って熱だけは他の追随を許さない自慰恩はオワットリます...orz


54 :名無しさん@5周年:2006/02/21(火) 23:06:08
使い方やマシン構成にもよる。

55 :名無しさん@5周年:2006/02/23(木) 20:29:28
EM64T Xeonは、x87がかなり遅くなっている気がする。
でも、SSE2使ってればわりとまとも。


56 :名無しさん@5周年:2006/02/24(金) 00:12:23
>>53
>自慰恩3.6GHzなデュアルCPUマシンの4CPUパラレル
デュアルコアのデュアルCPU、つまり1ノードのみってこと?
それなら妥当な結果かな。
淫輝はシェアードバスだからメモリアクセスが多いやつだとバス幅競合しまくり。

淫輝がシェアードバスに拘る理由が分からんけど、これを続ける限り未来はないな。
つーかシェアードのメリットって何かあるのかね?NUMAコントロールとか気にせずに済むってぐらいじゃ?

57 :名無しさん@5周年:2006/04/07(金) 11:34:31
CPU内部のモデルチェンジごとにCPUソケットの形状を替えられてしまうので
本体までふくめて買い直さないと追従できないのが辛い。
CPUをソケットから抜いて差し替えるだけで移行できて欲しいぞ、インテル。

58 :名無しさん@5周年:2006/04/07(金) 13:51:23
   
あーな賂愚

59 :名無しさん@5周年:2006/05/06(土) 05:14:25
今後は、「システム全体の電力あたりの性能」といったものがたとえ数値計算
であっても重視される。この値が高いほど、同じ冷却能力で作られた
システムとして高い性能を出すことが可能になるからだ。
IBMのBLUE GENEのぎっちりと詰め込まれた高密度の実装、あれこそ素晴らしい。

60 :名無しさん@5周年:2006/05/08(月) 22:09:29
体積あたりの性能と電力あたりの性能がごっちゃにw

61 :うわ:2006/05/10(水) 18:59:55
CPUで計算する事が、もう流行遅れと思われ。

なんだかんだ言ってもGPGPUはINTELの10倍程度の速度あるし
精度も同じで、価格も8万円もしない。

10台以下の並列化は、無意味だろ?




62 :名無しさん@5周年:2006/05/10(水) 19:41:11
単に汎用性とのトレードオフだろ。

決まりきった処理ならASIC起すなりDSPでやったり、その辺の安い家電でも
膨大な計算処理を効率よくやってるよw

63 :名無しさん@5周年:2006/05/10(水) 21:53:32
トレードオフを考えるなら、ルネサスのSH3−DSP、SH4あたりも
結構使える。 もちろん、大規模計算には不可だが。

64 :名無しさん@5周年:2006/05/11(木) 00:04:39
で、結局PCが一番C/PいいってことでFAと。

65 :名無しさん@5周年:2006/05/11(木) 23:18:20
Core 2 Duoはどうなのさ

66 :名無しさん@5周年:2006/05/12(金) 06:05:28
64bit対応してないんだろ?
レジスタすくねーよ

67 :名無しさん@5周年:2006/05/19(金) 08:08:41
Opteronの浮動小数点演算性能強化か?

http://pc.watch.impress.co.jp/docs/2006/0519/spf03.htm
 またFPU/SSEユニットをおそらく倍増させているようで、今までよりも
浮動小数点演算性能を上げる方向性を見せているが、そもそも今の
OpteronでもXeon系とはかなり良い勝負をしている(動作周波数の違い
もあって、圧勝には至っていないが)。従って理由の1つはSSE系命令で
Xeonを圧倒することだろうが、それよりもこの強化の目線はItaniumを
向いているように思われる。HPCの分野などではまだまだItaniumの高い
浮動小数点演算能力が重用されており、この分野で肩を並べるには、
FPU/SSEユニットの強化が必要ということだろう。

68 :うわ:2006/05/22(月) 10:26:27
GPGPUは、既に言語も持ち、パソコン内部につけれるわけで、

こういうのをASICやDSPと同じと思う感覚が、全くわからん。
パソコンのオマケをパソコンとC/P比較するのも変。

ま、そのオマケに、計算速度で、ボコボコに負けるんだけど?





69 :名無しさん@5周年:2006/05/22(月) 12:40:52
>>68
だからまずちゃんと倍精度対応してから出直してきてね。

70 :名無しさん@5周年:2006/05/22(月) 17:31:01
PhysXってどうなん?

71 :名無しさん@5周年:2006/05/22(月) 20:31:53
>>70
ゲーム専用だろうな。
倍精度対応してないはず。

>>68
GPGPUなんて掛け声だけでまだまともに使えやしない。
プレステ2がスーパーコンピュータ並といわれて出てきて、こりゃ数値計算にも
いいじゃね、ってなったが、まともに実用になった話を聞いたことあるか?

GPGPUをASICやDSPと並べるのは一理ある。ここではCPUとの対比としての
話なんだから。
理解力あるか?

72 :名無しさん@5周年:2006/05/23(火) 04:41:25
http://grape.astron.s.u-tokyo.ac.jp/~makino/articles/future_sc/face.html
GPGPUにはあまり期待しないほうがいいとのことです。

73 :名無しさん@5周年:2006/05/28(日) 18:09:15
>>72
一読しましたが、すごい詳しそうっすね。情報の人ならともかく天文の教授とは…
つーか↓に吹いたw
ttp://grape.astron.s.u-tokyo.ac.jp/~makino/talks/mitaka20060113.pdf

>その方向が GPGPU なのか、あるいは GRAPE-DR のようなSIMD 付加プロセッサなのか、はたまた貫通電極によってベクトルプロセッサが蘇るのかはまだわかりません。

と言ってるが、要するに今後の半導体技術の進歩如何によるってことかな…ウーン先が見えん

74 :うわ:2006/06/01(木) 12:06:42
>> 69

仮想24bitなんだけど?

そんなのにINTELは、ボロ負けするよ?




75 :名無しさん@5周年:2006/06/02(金) 07:16:10
仮想24bitってなに?


76 :名無しさん@5周年:2006/06/03(土) 00:34:58
つか倍精度ないと意味ないじゃん。

77 :うわ:2006/06/03(土) 13:49:29
>>76

ぷぷぷ

掲載精度が精度がINTELと全く同等で速度10倍。

こういうのを単精度と言うの?

GPUはCPUでは無いので、計算に適したCPUでは無いが
現在はCPUで計算する事自体が趣味って事だよ。

GPUの速度は今のところ好調に伸びているが、将来も
伸びるとは思えない。

けど、タコINTELに追いつかれるには、何年かかるかな?


78 :名無しさん@5周年:2006/06/03(土) 15:12:53
IntelもAMDも次CPUではクロックあたり最大演算速度が2倍に
なるし、来年にはすぐにQuad-Coreも出るし、それでいて安い
し、他のCPUがコストパフォーマンスで対抗するのはきつそう。


79 :名無しさん@5周年:2006/06/03(土) 15:33:50
まぁCPUは情勢はほぼ固まったしね。他社の参入は無理でしょう。
後はPPU、GPGPU、コプロあたりがどこまで頑張るか・・・(かなり未知数だけど)。あとCellかw


80 :名無しさん@5周年:2006/06/03(土) 16:51:03


81 :名無しさん@5周年:2006/06/03(土) 16:55:48
PS3コケるの確定で、他にも使う人もいなくて開発費回収できな
いし、爆熱Cellの先がないのもほぼ決定...。チーン...。


82 :名無しさん@5周年:2006/06/03(土) 19:32:01
ホントどうかは知らないがWoodcrestは画期的な高性能らしい。

ttp://www.geocities.jp/andosprocinfo/wadai06/20060603.htm


83 :名無しさん@5周年:2006/06/03(土) 20:43:44
さすがコンロー・メロムと兄弟なだけのことはあるな
いよいよインテル挽回か

84 :名無しさん@5周年:2006/06/03(土) 23:42:31
>>73
この文章を読むと、CPUの肥大化を批判してて、
チップ上に単純なプロセッサを多数集積することを提案しているみたいだけど、
そううまくいくかなあ…という気はする。

今のx86系デュアルコアCPUは、だいたい2億トランジスタ強。これに単純なプロセッサを集積することを考えてみる。
できるだけ単純なプロセッサで学術計算に使えるギリギリの機能…となると387だけど、
ここは486DXのコアを積んだほうが絶対に楽(386系だと浮動小数点性能がショボイ上にL1キャッシュも無い)。
すると、同じトランジスタ数なら単純計算で200弱のプロセッサを集積できる。

性能は、486は50MHzで2Mflops前後だったかな。
2GHzでぶん回すと理論上80Mflops。それが200個あると16Gflops。
…実は、もとのCPUとあんまり変わらない。

実際には、メモリアクセスを減らすためにダイにL2キャッシュを乗せる必要があるし、
1MBのキャッシュを積むとSRAMだけで5000万トランジスタくらい食われてしまう。その分、集積できるコア数は減る。
CPU内部のバスがえらいことになるから、できればコアごとのキャッシュも拡大したい。
SIMDを実装すると演算能力は飛躍的に向上するけど、それでまたコアが肥大して搭載できる数が減る。
だいいち、486の構造だと、いくらプロセスが微細化していてもギガヘルツの周波数で駆動するのは苦しいはず。
高クロック駆動のためにはパイプラインを実装する必要が出てきて、ここでまたコアが大きくなる。
いろいろ頑張ってコアの性能を高めてきたのに、その分どんどん実装数が減っていくからピーク性能があがらない。
で、結局は数個の高性能コアを集積するという、現在の状況に行き着いてしまう気がする。

同じピーク性能なら、コア数が少ないほうが実効性能は出やすいから、今の状況がそんなに的外れとも思えない。

85 :名無しさん@5周年:2006/06/04(日) 00:03:21
>>84
言っていることは同意!

ただ、最新のプロセッサは486より数千〜1万倍高速ってこと?
そんなに速いとは思えないから、もとの2MFLOPSってのが間違ってないかい?
(あ、論理速度ではなく実効速度ならそんなもんか?)


もっとも理想なのは単一プロセッサでとてつもなく高速なもの。
それが出来ないからやむを得ず並列だのなんだのやっているわけで、
ほぼ理想的なベクトルスーパーをここまで貶す意図が???

86 :名無しさん@5周年:2006/06/04(日) 00:12:56
>>77
なんかGPUに幻想でも抱いてるようだなw
瞬間最大風速に何の意味が?キモ。

87 :名無しさん@5周年:2006/06/04(日) 00:26:15
逆に、化け物なのがSX系ベクトルプロセッサだね。
>>73の文章では広すぎるメモリバンドが批判されているけど、
それはNECの人間も考えているはず。

単段クロスバスイッチでプロセッサとメモリがダイレクトに繋がっているというのは、
誰がどう見ても「こりゃやりすぎだろ」と思って当然。
可能なら、ダイに複数コアを乗せてメモリバスを共有し、コストダウンとピーク性能の向上を図ると思う。
ただ、それを未だにしていないってことは、恐るべきことに
「SXシリーズのユーザーの多くはあのメモリ帯域を使い切っている」ということなんじゃないかと。

逆に言えば、そんな使い方をするユーザーに応えられるのはSXシリーズしかない。
SXシリーズが、あの競争力のなさげな価格で生き残ってこれたのは、なんだかんだ言って
「他に選択肢が無い」ってユーザーが存在するということなんだろうな。

88 :名無しさん@5周年:2006/06/04(日) 00:41:48
そのやりすぎなほどの構成が、使いやすさに直結している。
少々高くてもやりたい仕事が速くできるのは、何にも替えられない。

趣味で使ってるんじゃないなら、最適化やアルゴリズムの研究なんかに血道を
上げる間に自分の研究を進めたい。

SXでも演算器を数倍載せて、見かけの速度だけ上げるのは簡単にできる。
それをやらないのがコンピュータ技術者の良心だろう。

89 :名無しさん@5周年:2006/06/20(火) 12:48:57
>それをやらないのがコンピュータ技術者の良心だろう。
ワケワカメ。慈善事業やってんじゃないんだからさ

スカラーとベクトル、今後もお互い切磋琢磨して頑張ってくれ、ってところだね

90 :名無しさん@5周年:2006/06/20(火) 12:55:29
>>85
>それが出来ないからやむを得ず並列だのなんだのやっているわけで、
きっと将来半導体のブレイクスルーが起きて何もかも解決してくれる










といいなぁ

91 :名無しさん@5周年:2006/06/20(火) 21:17:41
>>それをやらないのがコンピュータ技術者の良心だろう。
>ワケワカメ。慈善事業やってんじゃないんだからさ

役に立たないピーク時の数字だけ上げるのは簡単だが、
あえてそういうことはやってない、って意味だろ。

オレも同意。PS3なんて2Tflopsなんてカタログに書いてあるw
よく恥ずかしくないな。

92 :名無しさん@5周年:2006/06/20(火) 23:53:47
PS3は本当に2TFlopsなんだw
http://www.scei.co.jp/corporate/release/pdf/050517.pdf
誰か200台ほど買ってBG/Lと勝負しません。


93 :名無しさん@5周年:2006/06/21(水) 12:21:40
>>91
恥ずかしいとか言ってる場合じゃないのでは?
社運かけてるようだし…
まぁ今回はコケるだろうがw

94 :名無しさん@5周年:2006/06/24(土) 00:18:06
>>91
そのうち1.8TflopsはGPUだからなあ…
GRAPE系がべらぼうな浮動小数点能力を持つのと一緒で、専用プロセッサはピーク性能を上げやすいし。

…もっとも、CPUが200Gflopsを超えているのも十分にすごいが。
こっちもかなり癖のある構成だけど、LINPACKでどの程度の性能を出すんだろ?
もしLINPACKですら性能出なかったりすると、実質的に使いこなすのはかなり困難だとは思うが。

95 :名無しさん@5周年:2006/06/24(土) 00:37:22
ゲーム向けにはそれでも(活用次第で)なんとかなるんだろうが
HPC向けにはおもちゃだろうね。

96 :名無しさん@5周年:2006/06/29(木) 20:41:14
HPCには向かないの?
どの辺が?(倍精度がないっての以外で)

97 :名無しさん@5周年:2006/06/29(木) 22:11:48
じゃあ逆に言うがあの搭載メモリ容量でやってけそうか?

98 :名無しさん@5周年:2006/06/30(金) 02:05:52
マルチコア化すると、歩留まりが上昇する。
例えば64コア製品の為に80コアで製造すれば、
コアの部分に欠陥があっても、最後の工程で
ディスエーブルして64コア品として保つことが
容易になる。あるいはコア数によるグレード
を設けて、何ランクかのグレード製品として
販売することができる。

99 :名無しさん@5周年:2006/06/30(金) 02:11:46
そんな当たり前のことをいまさら。
キャッシュ容量にグレードがあるのも同じ理屈。

100 :名無しさん@5周年:2006/06/30(金) 08:01:23
>>96
倍精度がないのは、HPCにとって致命的だよ。
あと、データ転送の帯域も弱いかな。

101 :名無しさん@5周年:2006/06/30(金) 19:31:31
>>100
Cellは倍精度がないわけではない。ただ性能は単精度の1/10程度。
でも倍精度20GFlopsはあるのでpeakだけで言えばIntel,AMDと差
はない。問題は消費電力と性能を出すプログラミング。
ちゃんとした開発環境が用意されれば全く絶望という訳でもない。


102 :名無しさん@5周年:2006/06/30(金) 22:42:40
>>101
>>97

103 :名無しさん@5周年:2006/07/01(土) 02:43:11
>>97
メモリ容量はPS3の問題であって、Cell自体の問題ではないと思うが。
まさか、PS3そのものをクラスタリングしてHPCを構築するような豪気なことをする人もいないだろうし。

104 :名無しさん@5周年:2006/07/01(土) 10:52:49
>>103
それなら、IBMとかがそういうマシンを出すだろうが、やはり用途によるだろうな。


105 :・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/07(金) 23:58:05
>>101
> Cellは倍精度がないわけではない。ただ性能は単精度の1/10程度。

それってPPEのFPUだけでしかできないって意味?
SPEならソフトでやるしかないよ。


Core 2アーキテクチャなら4DP(FPadd/FPmul)×クロック数×2で20GFlopsは余裕で超えますね。

106 :名無しさん@5周年:2006/07/09(日) 14:19:27
>>105
SPEに倍精度演算命令がある。ただsIMD演算器は単精度用。
demmで14GFlops/chipとの論文がある。
ttp://www.cs.berkeley.edu/~samw/projects/cell/CF06.pdf
ホントならHPC用に悪くないが実効性能が出るかは相当に怪しい。



107 :名無しさん@5周年:2006/07/10(月) 18:13:48
出先でシミュレーションしたいんですが、
Windowsの64ビット版に対応したノート用CPUって何かありますか?

ノート用の64bit CPUだとTurion64がありますけど、こいつは64bit版のWindowsには
対応していませんよね?

現状では選択肢無しなのかなぁ?

次善の策として、CoreDuoを考えているんですが、Xeon 3GHz × デュアルCPU(デスクトップ)とのベンチマーク比較ってどこかに無いでしょうか?
出来れば、シミュレーション性能の評価に直結したベンチマークが知りたいです。


108 :名無しさん@5周年:2006/07/10(月) 23:45:14
出先で計算自体をする必要があるってこと?
データが大きすぎて伝送時間がかかるから?

109 :名無しさん@5周年:2006/07/11(火) 00:25:17
>>108
出張が多い人はハイスペックノートがあると便利なんじゃない?
ホテルにNETWORKあるとは限らないし。



110 :107:2006/07/11(火) 07:17:24
>>108-109
そうです。
計算とモデル作成を出先でやろうと思っています。

計算速度の速いCPU(64bit)のノートが欲しいんですが、
何がお勧めですか?
出来れば、OpenGLに強いGPUが載せられれば言うこと無し
ですが。


111 :名無しさん@5周年:2006/07/11(火) 09:19:09
>>110
64bitだから速いって訳じゃないからね。
そんなに大規模なものはノートじゃ無理。

HPとかDELLとかから販売してるモバイルワークステーションってタイプが良いと思う。
ただし、結構重いよ。

そこそこハイスペックなデスクトップ並の性能あるからこれで十分だと思う。

キーワード:モバイルワークステーション

112 :名無しさん@5周年:2006/07/11(火) 22:27:32
>>111
使ってるソフトが64bit化されるんで、
64bit CPUが欲しかったんですが、
64bit版 Windowsが動作するノートは、
結局現時点では無いんですかね?
T60pもCoreDuoだし。

113 :名無しさん@5周年:2006/07/14(金) 22:46:46
>>112
http://www.dospara.co.jp/goods_pc/feature.php?v17=566&v18=0&v19=0
http://journal.mycom.co.jp/news/2005/04/13/010.htm
http://plusd.itmedia.co.jp/pcupdate/articles/0508/19/news056.html
l

114 :名無しさん@5周年:2006/07/20(木) 08:38:32
数値計算の種類で最適が何かは変わるだろ。

x86の64ビットの利点て、メモリアドレス解決の問題だけで
数値計算には整数が倍になったのは良いが言語が変わらなければ意味がないと
思われる。


115 :名無しさん@5周年:2006/07/20(木) 09:21:01
そういうふうにおもっていた時期が俺にもありました

116 :名無しさん@5周年:2006/07/24(月) 16:33:47
>115
もれも、同じようにそういう風におもった、でも振り返ってやはり
もとの意見に戻る、人生そんなもんだ。

117 :名無しさん@5周年:2006/07/25(火) 13:50:26
>>116
x86の64bit化で物理レジスタ数が倍増されたのを
ご存じでのうえなら、解説をもとむ。


118 :・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/30(日) 07:09:37
>>106
まぁ、確かにダイをみればDPユニットは存在するのだけど、SPユニットと比べて明らかに小さい。
パイプライン化されてなかったり、n分の1クロック動作だったりするのかなと思ったり。


まぁ、加算だけのTPでしょうな。
8コア分の合計最大TPで14GFlopsってそんなに性能良くないっすね
除算や逆数平方根は単精度でしかできない。となると肝心なところはソフトでやらざるを得ない。
結局ソフト的で多売長整数演算やった方がよさげ。

単精度ですら積和算で稼いでるようなものなので、安定した性能は得にくいかと。

今年末か来年明け頃に出るClovertown×2で160GFlops(単精度)程度に達するだろうけど、
Woodcrestのハイエンドで50万切ることを考えると、60万程度もあれば購入できるでしょう。

いっぽう、Cellワークステーションは平気で1基数百万程度しそう。
PS3がユーザープログラムが可能なLinux Boxとしてリリースされればそれなりに遊べそうだけど
正直望みは薄いですな。

119 :・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/30(日) 07:11:38
>>117
論理レジスタじゃないの?
P6以降のx86マイクロアーキでは物理レジスタは論理レジスタに対して圧倒的にいっぱいある

120 :名無しさん@5周年:2006/07/30(日) 14:47:21
>>107
CoreDuoって64ビットに対応してないしCore2Duoのノートはまだ出ていないですよ。
現時点ではPenDかアスロン64X2のノートしか無いと思うけど。

121 :名無しさん@5周年:2006/07/31(月) 17:08:46
牧野さんの頁が更新されてる。スパコンの歴史は読み物として大変に面白い。
http://jun.artcompsci.org/articles/future_sc/face.html#TOC

122 :名無しさん@5周年:2006/07/31(月) 18:58:59
そうか?ちょっと興味あればすでにそういった歴史本はもう読んでんじゃね?

123 :名無しさん@5周年:2006/08/02(水) 00:53:34
>>121
自分は数値計算素人だが面白かった。
なぜスパコンは価格性能比が悪く見え
るのか、論旨が明確で理解しやすい。
シミュレーション分野の人は、そこに在る
問題をモデル化しそれを解く方法論を
予測する能力に秀でていると思うが、
それが自らの道具を発展させる力にも
なっている点が面白い。


124 :名無しさん@5周年:2006/08/02(水) 17:07:42
Cell搭載アクセラレータカード
http://pc.watch.impress.co.jp/docs/2006/0802/mercury.htm
PS3よりクロックが低いくせにPS3の10倍は高い。さて売れる可能性は
少しはあるのだろうか。

125 :名無しさん@5周年:2006/08/02(水) 23:04:43
>>120
PenDって64bit対応なの?


126 :名無しさん@5周年:2006/08/04(金) 18:16:27
XDR-DRAMを積んでることを考慮してもなお高いな

>>125
全モデル対応してるよ。Pentium 4も600番台や500番台の一部が対応してる

127 :名無しさん@5周年:2006/08/06(日) 01:56:18
>>125
penDはやめとけよとマジレス

128 :名無しさん@5周年:2006/08/06(日) 02:59:02
>>127
どして?

129 :名無しさん@5周年:2006/08/06(日) 20:51:01
>>128
電力あたりの性能の効率が今ひとつだからでは?


それにしても、SX系が今後どうなるのか気になるな。
あのアーキテクチャで高速化しようとすると、もはやクロックを上げていくしかないような気が。
それとも、プログラマ(orコンパイラ)の負担が増すことを承知で
プロセッサあたりの演算機の数を増やすのかな。

現状だと、あのメモリアクセス性能を維持しようとすると、どうあがいても袋小路という気がする。

130 :名無しさん@5周年:2006/08/09(水) 07:32:14
>>129
買っちゃったからなぁ
とりあえず遊んどこ

131 :128:2006/08/13(日) 01:29:10
>>130
買っちゃったか… いやまぁ、目的に適ってるならいいんだけどね
値段もintelにしては安めだからC/Pは悪くないかもしれないんだが、
自作板で鬼のように酷評されてるのを目にしてきた俺としては、C/Pは問題なくても物凄くイメージが悪い…

まぁ、がんがん使い倒してください


132 :名無しさん@5周年:2006/08/13(日) 01:32:39
>プログラマ(orコンパイラ)の負担が増すことを承知でプロセッサあたりの演算機の数を増やすのかな。
intelとかのPC系の石はそういう方向に向かってるよね

>現状だと、あのメモリアクセス性能を維持しようとすると、どうあがいても袋小路という気がする。
だよね。ほんとこれからどーすんのって感じ
そういや京速計算機の仕様って決まったのかなぁ。どうなるんだろう

133 :名無しさん@5周年:2006/08/13(日) 03:36:05
計算尺使え

134 :名無しさん@5周年:2006/08/13(日) 04:08:35
>>131
とりあえずサーバーとして連続稼動させてるのだけど、一番の目的は64ビットアセンブラを弄りたかったので…
自作板で酷評されてるのはどんな理由なのでしょうか?もしよかったらURLお願いします。

135 :名無しさん@5周年:2006/08/13(日) 11:33:23
>あのアーキテクチャで高速化しようとすると、もはやクロックを上げていくしかないような気が。
>それとも、プログラマ(orコンパイラ)の負担が増すことを承知で
>プロセッサあたりの演算機の数を増やすのかな。
既に高クロック、多プロセッサのSX以外の方がもっと大変だと思う。
もっと別の方法で高速化してるのある?

136 :名無しのモライヤ:2006/08/13(日) 12:01:28
                ∧_∧                    
               (ロ ・∀・)<このバカどもがっ!                      
         <三三┠⊂    つ                       
               / /ヽ ヽ                       
              (__) (__)                   


137 :名無しさん@5周年:2006/08/13(日) 17:36:00
>>135
SX8は既に2GHzに達しているから、高クロック化もなかなか難しそう。
コンシューマ向けはデュアルコアと言う方向に行ったけど、
ベクトルプロセッサをデュアルコアにしても、
同じメモリ帯域に演算器が増えるだけなんで、性能的にはそれほど……

進化を続けようと思うと、分散メモリに行くしかないのかなあ。
ただ、それだと過去のソフトウェア資産が、アルゴリズムによっては極端に遅くなる可能性がありそう。
ユーザーがそれを認めてくれればいいんだろうけど。

138 :名無しさん@5周年:2006/08/14(月) 02:04:49
>>134
131じゃないけど、
TomsHardwareとかいうサイトで負荷テストをやってて、電力の供給不足にすぐ
陥って頻繁にリセットがかかっていた気がする。
あと、EISTを切らないと自動的にクロックダウンされるから性能がでなかったとか。

漏れは、PenDにx64のFedoraいれて開発用に使ってるけど、
いまんとこ全然問題ないよ。
性能もSSE2/3で自分で書けば、AMDのCPUよりいい性能出せるし。
自分で電気代払う環境じゃなきゃ、サーバとしても問題ないと思う。

>>137
NECは光配線でメモリバンド幅増やす方針が…
うまくいくのか知りませんが。


139 :名無しさん@5周年:2006/08/25(金) 22:00:06
>>107
64ビットに対応してるよ。
>>137
2Ghzだったらまだ倍は出せるよね。

140 :名無しさん@5周年:2006/09/07(木) 17:26:02
http://pc.watch.impress.co.jp/docs/2006/0907/ibm.htm
1.6Pflops。倍精度だと全然計算が合わないので単精度性能? それ
とも拡張したCellを使うのか? 16,000個のCellの冷却はさすがの
IBMでも大変だろう。かなり無理して使っている感は否めない。



141 :名無しさん@5周年:2006/09/07(木) 22:16:46
>>140
単精度だと、学術計算に使うには微妙な気が…

単一用途と考えれば、それが単精度で間に合うならそれでいいんだろうけど。

142 :名無しさん@5周年:2006/09/08(金) 16:57:25
>>140
もはや、ベンチマークのためのマシンとしか思えない

143 :名無しさん@5周年:2006/09/08(金) 17:29:48
>> 142
米エネルギー省国家核安全保障管理局に納入されるから、
ベンチマークのためのマシンとは言えないだろう。

144 :名無しさん@5周年:2006/09/08(金) 23:12:03
でもほとんど専用機にはちげえねえ。

145 :名無しさん@5周年:2006/09/09(土) 00:29:34
>>143
核シミュレーションって単制度で良いのかな?

146 :名無しさん@5周年:2006/09/10(日) 01:12:06
>>143
でもなぁ、DOEは、ESにトップ奪われて以来、異常だと思う。
現在でも。

147 :名無しさん@5周年:2006/09/10(日) 01:42:40
実効性能ではまだ負けてるっていうのもあんじゃね?

148 :名無しさん@5周年:2006/09/10(日) 03:48:28
そうなんだよね。
これでもベクトル機に将来がないってのがわからない。

149 :名無しさん@5周年:2006/09/10(日) 21:29:01
ESが出たときは相当ショックだったそうだが何で?
国家の威信がどーのこーのって話にまでなってたそうだが
技術って抜きつ抜かれつだから、抜かれたのなら相手のいいとこパクるなり何なりして抜き返せばいいだけじゃんね

150 :名無しさん@5周年:2006/09/10(日) 22:13:03
>>149
当時アメリカも似たような大規模計算機(ただし、スカラ型のクラスタ)を作ってた。
ところが、それが性能的にダメダメだった。

そんな状況で、地球シミュレータは、アメリカが既に時代遅れのアーキテクチャと思っていたベクトル型で
化け物じみた性能を出してきた。

結果、「日本がものすごい計算機を作った」というショックと、「俺たちは一体何をやっていたのか」というショックが組み合わさって
強烈な敗北感を抱いたそうな。
コンピュートニクと呼ばれた衝撃の正体は、そういうものだったらしい。

151 :名無しさん@5周年:2006/09/11(月) 11:26:48
Roadrunnerに強化版Cellを使うのではとしている。
http://www.geocities.jp/andosprocinfo/wadai06/20060909.htm
第2世代PS3は倍精度100GFlopsでパーソナルスパコンとして使える?


152 :149:2006/09/11(月) 19:01:55
>>150
へー
効率重視のメリケンともあろう者がスカラーしか目に入ってなかったってことか
>「俺たちは一体何をやっていたのか」
どっちかっつーと↑の要因のほうが大きそうだなw

153 :名無しさん@5周年:2006/09/11(月) 20:06:07
日本も戦艦大和造っちゃったし、時代を見間違うことはよくある。

154 :名無しさん@5周年:2006/09/12(火) 18:39:28
シミュレーションには単精度じゃ足りんとよく言われるけど、ほんとにそうなのか?
量子とか化学くらいじゃないの?

単精度でおkってんならCellスパコンも魅力的なんじゃまいか?

155 :名無しさん@5周年:2006/09/12(火) 22:08:48
だからってピーク性能にだまされてはいかん。実際は・・・

156 :名無しさん@5周年:2006/09/12(火) 22:13:51
モバイル明日論64で1時間くらいの計算やっても大丈夫ですか?

157 :名無しさん@5周年:2006/09/12(火) 23:00:46
>>154
実効が低いのは承知の上で、実際どーなのって話よ

Cellの何がいいって、PS3で量産されまくるからでしょ?
もしCellがアウトなら、低価格で組めるクラスターってintelやAMDの石しか選択肢なくなっちゃうじゃん

158 :名無しさん@5周年:2006/09/12(火) 23:05:12
値段で言ってんならCellもアウトだと思うぞ。

159 :名無しさん@5周年:2006/09/13(水) 00:52:05
8087はスタックだから遅いって言われてたが、あれは4004と同じく、
CPU上のレジスタ8つ分しかスタックが取れなかったせいで、本来の
スタック・プロセッサに期待される性能よりも遅かった。
浮動小数点スタック・ポインタを追加して、制限を払えばSSEなんていら
なかった。K8がやったように、プレフィクスを使ってスタック・トップか
ら16エントリまで計算に利用できるようにすれば、なおいい。

FADD ST,ST(15)

こんな感じだ。
レジスタ・リネームとアウト・オブ・オーダーがあれば、スタックの
制限なんて、大した問題じゃない。

160 :名無しさん@5周年:2006/09/15(金) 20:52:23
もう電卓でいいじゃん

161 :名無しさん@5周年:2006/10/14(土) 18:50:55
結局、PCクラスタの上で既存ソフトの性能がちゃんと出る自動並列化コンパ
イラを開発すれば大金持ちになれるということだそうです。
http://jun.artcompsci.org/articles/future_sc/note031.html#rdocsect36



162 :名無しさん@5周年:2006/11/29(水) 22:51:58
↑牧野先生ぜってー推敲してないよねこれ
まさか学会や論文もこの調子じゃ・・・

163 :名無しさん@5周年:2006/12/04(月) 08:50:13
jk

164 :名無しさん@5周年:2006/12/08(金) 14:36:36
アルファプロセサにベクトルユニット
http://journal.mycom.co.jp/articles/2006/12/08/sc1/

パソコン用CPUにベクトル演算ユニットが内蔵されるのが、当たり前の時代が来るんだろうな。

165 :名無しさん@5周年:2006/12/08(金) 18:43:22
そりゃもう

166 :名無しさん@5周年:2006/12/10(日) 17:05:15
アップルがやってたけど結局投げ出したじゃん。
最後のPOWERマシンなんかソートーな物だよ。

これからは、計算機もFPGAの時代だ。問題毎に瞬時に構成を変えられるからね。
A4サイズくらいのボードで演算ユニット数百個搭載。
ラック一本分もあれば数万個くらいの計算機が作れる時代だ。


167 :名無しさん@5周年:2006/12/10(日) 21:45:08
夢が広(ry

168 :名無しさん@5周年:2006/12/11(月) 00:17:48
>>166
問題ごとに演算回路を設計するってことだぞ?
だれがそんなめんどくさいことやるん?そんなことするなら少々遅くても普通のCPUで
やったほうがトータルで速い場合の方が多いよ。

169 :名無しさん@5周年:2006/12/11(月) 02:56:13
>>166
マキーノ先生に洗脳されすぎ!
おれは先生がなんと言おうと、スパコンベクトル機マンセーだよ!

170 :名無しさん@5周年:2006/12/11(月) 21:54:40
そうそう。あのオッサン、演算器演算器って言ってるが、
車で言えばエンジンが何リットルか拘ってるだけ。

強力なエンジンも貧弱な足回りやボディじゃ全く性能発揮できないどころか
ピーキーで乗りにくいだけ。

171 :名無しさん@5周年:2006/12/11(月) 23:33:59
結局はヒトモノカネを大いに投入して作り続けるしかないのだ。これからもずっと・・・
悲しいけどこれ(ry

172 :名無しさん@5周年:2007/01/28(日) 22:54:03
保守

173 :名無しさん@5周年:2007/01/31(水) 01:18:38
>>170
牧野先生に対する反論になってるのは>>84だね。
これはこれでそれなりに説得力がある書き込みだけど、牧野先生は用途限定と
ソフトウェアの最適化でピーク値を追求する方向に見えるから、
「これじゃ実効性能がでない」という反論には
「ならば出るような用途に限定使え」と言ってきそうな気がする。

174 :名無しさん@5周年:2007/01/31(水) 07:59:17
>>169
あの人の専門分野で性能を出そうとすると、必ずしもベクトルはいらないんだろう。
その辺はやってる人の分野それぞれによって最適な方法は違うだろうし、
流体屋さんとかに言わせればまた違う答えになるんだろうが

175 :名無しさん@5周年:2007/01/31(水) 23:10:54
>>174
あの人は自分の分野しか見えてないんじゃないの?
それだけならいいが、それをすべてに適用して語ってるからなぁ。

重油を効率よく運搬したいのに、スピードと価格が桁違いに優れているからって
水上バイクを薦められてもなあ・・・

176 :名無しさん@5周年:2007/02/02(金) 00:10:43
流れをぶったぎるようだが、詳しい方、アドバイスをください。

64bitで2GB位メモリを使う非並列のCFD計算が主なのだけど、Xeonの
2.33Hzクアッドコア×2基でいくか、Opetronの2.6GHzデュアルコア×2基
でいくか迷っている(どちらもデル)。
メモリは予算の関係で2GB×8枚までしか買えない。
1コア当りのCPUやメモリ周りの性能はOpteronのほうが断然上だろうが、コア数が
半分になってしまう。計算スピードにかなり差がないと、Xeonのほうが無難な気が
するが、実際全てのコアで並列化せずCFD計算を走らせた場合の、両者の性能差は
どれくらいかな?

177 :名無しさん@5周年:2007/02/02(金) 02:51:41
>>176
断然Xeon

コア数のメリットを逆転できるほどOpteronが速いわけない。

178 :176:2007/02/02(金) 11:49:14
>>177
同予算クラスだと、Xeonは2.33GHz、Opetronだと2.6GHzになる。
その上、クアッドコアのXeon(5300)だと、メモリへのアクセス競合の影響で
かなり遅くなるだろうから、メモリアクセスの多いCFD計算だと、半分近く迄遅く
なるということはありえない?どこかで、両者のHimenoベンチ載ってないかな?


179 :名無しさん@5周年:2007/02/02(金) 13:13:06
Xeonで4本、Opetronで2本同時に走らせれば、全ての計算が終わる時間
は当然、Xeonの方が遅くなる。

どちらも4本同時に走らせるなら、メモリが不足してスワップを起こさない
限り、クアッドコアであるXeonの方が速い。



180 :名無しさん@5周年:2007/02/03(土) 19:18:11
Xeonまるで速くない、
Pentium4と比べて同じクロックの速さだけの速度しかないみたい。
Pentium4の安いPC並べた方が速いと思う。


181 :名無しさん@5周年:2007/02/03(土) 23:50:26
>>178
Himenoベンチは
http://www.v-t.co.jp/jp/benchmarks/bench_test/himeno.php
ではopteron 2218 dual core (2.6GHz)に軍配
Limpackベンチは
http://www.v-t.co.jp/jp/benchmarks/bench_test/hpl.php
ではclovertown 2.66GHzに軍配

applicationに依存するということでは?

182 :名無しさん@5周年:2007/02/04(日) 02:41:52
同価格のXeonとOpteronの両方で構造解析したけど、断然Opteron方が早かった

183 :名無しさん@5周年:2007/02/04(日) 11:44:54
>>176
Dellでopteron搭載機ってのに興味をひかれたんだが、機種名教えてくれない?
(ちょっとだけ探してみたけどathlonしかひっかからなかったんで)

184 :名無しさん@5周年:2007/02/04(日) 11:46:47
あ、探しなおしたらでてきた。PowerEdge SC1435 てやつ?

185 :176:2007/02/04(日) 14:53:59
>>179
もちろん、CPU 1基における最大ジョブ数=コア数という条件での、全てのジョ
ブの計算が終わるまでの実時間が問題。

>>180
まあ、XeonとP4だったら、ほぼクロック数に比例するだろうね。
ただし、4GBバイトを超える64bit計算走らせるのならXeonになるのでは?

>>181
ああ、VTが出してましたか。ありがとう。
流体計算が主なので、Himenoベンチの結果だけを見れば良いのだけど、
Parallel計算よりSerial計算が主なんだよね。

Serial計算でのOpteron 22xxシリーズとXeon Clovertownのベンチがあったら
良かったのだが。

あと、Front Flow RedやOpenFOAMでのベンチがあればもっと良い。

>>183,184 そう、それ。
ちなみに、XeonのはPowerEdge 1950。


186 :名無しさん@5周年:2007/02/04(日) 15:12:22
>>185
V社からは
opteron 2218 dual core (2.6GHz)
を勧められ
H・S社からは
clovertown 2.66GHz
ともにチップ数,メモリ同じを勧められています。
並列計算(量子化学,バンド計算etc)をすることが多いので
Barcelonaが出る前は下の記事からClovertownが有利かなと思っていたのですが,
ttp://japan.cnet.com/news/ent/story/0,2000056022,20341458,00.htm

>>181などを観るとopteronの方がまだ良い気がして,
実際どうなんでしょう?


187 :名無しさん@5周年:2007/02/05(月) 18:32:46
こっちの姫野ベンチだと、Opeteron は良くないね。
http://www.otb-japan.co.jp/linuxbench/himeBMT.htm

188 :黒幕:2007/02/06(火) 12:10:47
奇跡のトリックスター、黒幕である。
…。
変態ヤシよ…。
我がスレに来るがよい…http://same.u.la/test/r.so/pie.bbspink.com/feti/1162548223/l10

189 :名無しさん@5周年:2007/02/06(火) 19:19:19
姫野ベンチのSサイズ、Core2Duo 2.4G PC2-6400 2GB Win実行形式だと1500Mflopsぐらいだった
LinuxのIntelCompilerとかでカリカリにチューニングしたらどのくらい出るんだろ?
理論性能は19.2GFlopsなわけだが。。。

190 :名無しさん@5周年:2007/02/07(水) 12:32:39
インテルのCPUは、64bitで走らせると32bitの場合より遅くなるから注意した方がいい。

「64bitは苦手なCore Microarchitecture」
http://pc.watch.impress.co.jp/docs/2006/0718/kaigai288.htm

191 :名無しさん@5周年:2007/02/16(金) 03:39:45
Coreアーキチップは64ビットが苦手か?
http://www.geocities.jp/andosprocinfo/wadai06/20060729.htm
Sandra 2007 Dhrystone ALUベンチマークでは,64ビットにするとx6800の性能は21%低下し,一方,Athlon 64 FX62では64ビット化で2%の性能向上,
同じIntelのPentium XE 965では11%性能が向上しているのに比べると,Coreアーキは64ビットは苦手という形容が当てはまるのですが,
Xbitが実施した17種のベンチマークを総合すると,64ビットで上がるのもあれば下がるものあり,全体としては64ビットの方が多少性能が高い感じです。
また,32ビット,64ビットの性能比はAthlon 64の傾向と大差なく,x6800が特に64ビットが苦手という感じではありません。

192 :名無しさん@5周年:2007/02/16(金) 15:11:37
xeonとopteronはumaとnumaというアーキテクチャ上の根本的な違いがあるから
CFDみたいにメモリ帯域バカ食いな用途では気をつけたほうがいいよ
つまりプロセス間通信量がどれくらいかが重要

193 :名無しさん@5周年:2007/02/17(土) 16:30:16
インテルの寺風呂伏州チップ

53 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)