查看完整版本: 实战PCI-Exprss总线速度对CUDA PhysX的影响

我就爱你 2008-6-27 15:18

实战PCI-Exprss总线速度对CUDA PhysX的影响

去PCI看了  爱迪生的文章
,M,Kt8\.Z3G G)i -p%SHA6W
深入浅出谈CUDA"I(X{8nO
[url=http://www.pcinlife.com/article/graphics/2008-06-04/1212575164d532.html][color=#800080]http://www.pcinlife.com/article/graphics/2008-06-04/1212575164d532.html[/color][/url]
&XL@%H1JB`_f
gz2NMTdN 不错的介绍性文章,大家可以看看$dOk#Zb e y9[z$m

pD#DP+O~x0T6C O 其中有一段:
nz#M$XU#vTZ
|oJM0B.V%Q 在 CUDA 中,GPU 不能直接存取主内存,只能存取显卡上的显示内存。因此,会需要将数据从主内存先复制到显卡内存中,进行运算后,再将结果从显卡内存中复制到主内存中。这些复制的动作会限于 PCI Express 的速度。使用 PCI Express x16 时,PCI Express 1.0 可以提供双向各 4GB/s 的带宽,而 PCI Express 2.0 则可提供 8GB/s 的带宽。当然这都是理论值。
/@ W I"i7Yb#m0Ya0[G uT [(l6Q
从一般的内存复制数据到显卡内存的时候,由于一般的内存可能随时会被操作系统搬动,因此 CUDA 会先将数据复制到一块内部的内存中,才能利用 DMA 将数据复制到显卡内存中。如果想要避免这个重复的复制动作,可以使用 cudaMallocHost 函式,在主内存中取得一块 page locked 的内存。不过,如果要求太大量的 page locked 的内存,将会影响到操作系统对内存的管理,可能会减低系统的效率。
hm+rP4oCx-h \_JD8s#u8}5oc
=============_'p0Y'ML`U
CBv8y^5rli
我就实战了这一段
9m-S%jn^h
(y.|hmJ
@V3Wnlj:\A GALAXY 790I ULTRA SLI
o|*p#TC OCZ DDR3 1600 1GX2
I"]8R!W t t+xx C Q9450 OC 450X8=3.6G
O.xK1|:` J2n GALAXY GTX280 STD
$A7P K!HTx\A(Em Dell  2707RlpK\

W9nHBJ8XE_} 一个PCIE总线 默认的100%R_#l-m b!s
一个是从BIOS超频到120#[ tUTZ)^Q+P:KM
[attach]1699646728[/attach]c+Y,]"n+\!ni9En

-rF(`3T D!A3M [attach]1699646729[/attach]
vi9Wkg G2V.C8H8Y
[attach]1699646730[/attach]3k._0k"Iq.B k
_#P3z1A P%c5j(k|8j@
[[i] 本帖最后由 我就爱你 于 2008-6-27 15:57 编辑 [/i]]

ikinari 2008-6-29 17:23

这个要顶EZ WrhW\&j+A
1E]3Z:lZ8Tqs;f
cho大确实NB

j001432 2008-6-30 13:21

测试结果是什么?
页: [1]
查看完整版本: 实战PCI-Exprss总线速度对CUDA PhysX的影响