2030年のコンピュータ

f:id:qpci32siekqd:20161221225556p:plain

引用元：http://arch2030.cs.washington.edu/slides/arch2030_tom_conte.pdf

スマフォの性能が毎年のように上がっていることから、もう性能向上は限界だと数年前から言われているけど結局上がるんでしょ、という人は多いかと思う。

GPUのようにマルチコアをたくさん使えばなんとかなるんでしょ、というのもすぐに限界がくる。シングルスレッドだと既に性能向上は終わっている。

f:id:qpci32siekqd:20161221230242p:plain

これを見ればトランジスタ数は無理やり増やせるかもしれないが、トランジスタ数にスケールしていない。上のグラフではコア数は増やせるように見えるかもしれないが、コア数はこれ以上増やしてもキャッシュのコヒーレンシを取るコストが馬鹿にならない。

f:id:qpci32siekqd:20161222000433p:plain

プロセス世代を進めた場合、今のFinFETから変えていく必要があり、ナノワイヤFET、カーボンナノチューブFETなどが言われているが、どうなるかは不明である。
そもそもリソグラフィどうするんだ問題もある。

f:id:qpci32siekqd:20161222001322p:plain

f:id:qpci32siekqd:20161222001534p:plain

3D構造では、シリコン貫通ビアを使わないとしている。
3D構造しかないという話だが、歩留まりが落ちるなどがあり、コストが高くなってしまうのと、放熱の問題で、超えるのは難しいようである。
貫通ビアの代わりのビアが検討されている。

f:id:qpci32siekqd:20161222002028p:plain

放熱に関しては中を通してやって放熱する方法が検討されている。
IBMのelectric bloodのようなものも有用かもしれない。

f:id:qpci32siekqd:20161222002505j:plain

液浸だとか、沸騰冷却なども使われるかもしれないが、当然だが家庭では使いようがない。図は以下から引用している。

news.mynavi.jp

下記はHPのYouTubeの動画から引っ張ってきたものである。22:00から紹介されている。右が下がっているが横ばい、もしくは緩い右肩上がりかと思う。

f:id:qpci32siekqd:20161221230940p:plain

f:id:qpci32siekqd:20161221231345p:plain 性能を上げるためには、根本的に変えないといけないが、そこまでのコストをかけられる企業はどれくらいいるのか、というのが暗雲となっている。

f:id:qpci32siekqd:20161221232224p:plain

HPのThe Machineは今までのメモリ構造を置き換えたものである。
やりたいことはメモリのデータ移動が馬鹿にならないコストを払っているので、じゃあメモリを中心において汎用CPUではなく、用途に応じた専用アクセレーターをメモリの近くに多種多様におけばいいじゃないかということである。

http://www.pdl.cmu.edu/SDI/2016/slides/keeton-2016-10-19-memory-driven-computing.pdf

f:id:qpci32siekqd:20161222000600p:plain

http://arch2030.cs.washington.edu/slides/arch2030_wong.pdf

こちらは演算をしているよりもメモリアクセスしているのが大半であるという指摘がされている。

f:id:qpci32siekqd:20161222000716p:plain

現状だとメモリが階層構造になっているため、メモリ管理コストが高くなってるのと、階層が離れたメモリへのアクセスが性能を上げるためのネックになっている。

f:id:qpci32siekqd:20161221232907p:plain

http://www.mcs.anl.gov/events/workshops/ross/2015/slides/ross2015-keeton.pdf

The Machineというとこの図がニュースサイトなどで出てくるが、これだけ見てもなんだこれとなる。

f:id:qpci32siekqd:20161221233040p:plain

こちらの図になるとわかりやすくなるのだが、逆に今までと何が違うのかがわかりにくくなる。不揮発性メモリを持っているわけだが、こちらだとSSDと何が違うんだということになる。

f:id:qpci32siekqd:20161221233536p:plain

SSDは口にDRAMを持っており、Flashの転送速度が遅いのを隠蔽しているに過ぎない。DRAMへのアクセスなのだから、どれだけ高速で大容量のDRAMを使うか、通信帯域をどうするかになる。

f:id:qpci32siekqd:20161221231904p:plain

The Machineの話に戻す。実際のものはあり、上のようなブレードになっている。

f:id:qpci32siekqd:20161221231824p:plain

フォトニクスによってメモリにアクセスするようになっている点が違う。

f:id:qpci32siekqd:20161221235524p:plain

フォトニクスの処理はFPGAで行っているようである。
フォトニクスを使っているのは離れた場所へメモリを置くことができるようにするためだそうで、高速になるわけではないと言っている。
家庭用の光ファイバの10G-EPONのようにことをやり始めると、発熱や光と電気の変換ロスが無視できないのかもしれない。

f:id:qpci32siekqd:20161221235809p:plain

またHPはGen-Zを推進している。インターコネクトはやはり重要でデータをいかにやり取りするかなのかと思われる。

f:id:qpci32siekqd:20161222000844p:plain

メモリの種類としてはこんなことが言われているが、速く扱いやすいメモリが欲しい。
とはいえDRAMが無理だ無理だといわれつつも、結局DRAMにしかないという道もあるわけだが…。

f:id:qpci32siekqd:20161222002649p:plain

機械学習ようのハードも出てきており、消費電力は小さいのが売りではあるが、いかんせんスケールしにくい。

IT系メモ

興味のあったことや、勉強したことなどをメモしていきます。

2030年のコンピュータ