ubnt解决方案
查看: 39116|回复: 133

砸钱配的独显,为何跑字典还这么慢!新手来看:跑EWSA挑选显卡分析挖掘

  [复制链接]

1786

回帖

1万

积分

941 小时

在线时间

上校

灌水天才

注册时间
2010-2-3
金币
14122 个
威望
3 个
荣誉
0 个
累计签到:973 天
连续签到:0 天
[LV.1095]铁杆粉丝
发表于 2011-12-30 02:35 |显示全部楼层
本帖最后由 方便面 于 2012-2-5 17:18 编辑

ewsa支持的nv显卡的型号

N卡:一般是GeForce 8系列、9系列和100、200、400、500系列GPU,并且最小配备256MB显存的nv显卡才具备cuda设备,

A卡:一般是HD3XXX系列以上

a卡的5D框架决定了amd的gpu数据吞吐量大,但是效率低,线程调度,分支预测都比n卡差。而密码学不存在线程调度,分支预测的问题,几乎就是单纯的浮点运算。

A卡运算快 ,N卡打游戏快,XP下跑比WIN7下快

同价位 AMD GPU 比N卡有大约3倍到5倍的性能优势


以EWSAPJ速度为例

只CPU

E6400         1880

E5300         1000

E5405         1300

AMD3000+      200


I3  +  HD5650 12000左右

i5双核   +  ATI Radeon HD5470    12000


6核1055T  + 显卡6850   速度4万


Q9550、HD5850--->45000


amd4核,HD4850跑16000-17000


AMD5000+   gts250    8300左右


双核2.8 +HD5750      ,23000.


四核2.3G,仅CPU 2200左右;加上HD5670,41000左右。


i5 $2 cpu  gt240  显卡  跑6100


8800GTS G80  每秒6000

Q6600+9800GT 1W出头

酷睿2 Q6600   gtx295    2W3

酷睿I7 920+GTX570 49000

I7 920+HD5870 PJ速度 62000

扣肉I5 HD5970 6970 6990 的速度10W3K


一个典型的CPU核心可以在一个时钟周期内执行4个32位的指令(使用128位的SSE指令),而类似于AMD Radeo HD5970 这样的GPU可以每周期执行3200个32位指令(使用它的3200个算术逻辑单元或称流处

理器)。这就是800倍于CPU的指令执行速度。截至2011年,最快的CPU拥有6核、8核或12核,以及多少高一点的时钟频率(2000-3000MHz ,而 Radeon HD 5970是725MHz),但是这远远不足以弥补速度上

的巨大差异。



CPU如同执行长官,它被设计为通过软件的操控作出决定,CPU能进行所有种类的数学运算在每一个CPU里都有一个或多个算术逻辑单元(ALU),CPU同样非常适于快速的任务切换与逻辑判断。CPU也要处

理其他的复杂事务,诸如不同程序间的优先级设定,向后兼容旧有代码等等。


GPU类似于劳工,GPU虽然也能做数学运算,但是它最主要的设计用途是进行视觉图形处理而不是执行者的角色。图形处理是大量的重复任务,因为它被安排对屏幕上大量的像素进行处理,为了更有效率

的运算,图形处理器的巨大优势在于执行大量重复劳动,而不是快速的任务切换。GPU拥有大量的算术逻辑单元,数量远远超过CPU,这使得它在执行大批量的重复算术运算时远远胜于CPU。


一个形象的比喻是CPU如同一小组快速执行任务的精兵良将,GPU如同一大群相对迟缓的笨人,他们单个看上去并不那么精干快捷,但是被训练去做大量的重复劳动,而在整体的角度上可能就会更有效率




GPU的算术逻辑单元ALU被分区为多组,每一组算术逻辑单元共享管理,这样组内成员就完成进行不同的任务,他们彼此协作集群完成那些单一环节变化很小的任务。比特币挖掘的背后是重复尝试Hash(

散列)运算,这就是非常适合GPU的重复劳动,每一次运算尝试只改变被散列数据的一个数字。


AMD ATI Radeon 5970 是热门显卡,也是到目前为止干这活儿最出色的显卡。


5970有3200个流处理器,这可以理解成是3200个很笨的处理单元被训练用于大量重复劳动而不用做决策工作来打断工作流。这些处理单元构建于群组内,5970使用VLIW-5架构,也就相当于这3200个流处

理器事实上是640个核,每个核能在一个时钟周期内处理5条指令。Nvidia把这些核称为Cuba Cores,但他们不是VLIW,这意味着他们单位周期内的运算能力低些。这也是为什么仅仅比较显卡的核数来判

定性能是不准确的原因,也是为什么nVidia在做SHA-256 hash的时候落后ATI这么多的原因。


算术逻辑单元ALU决定了比特币挖掘的效率,可用的ALU数目对最终的散列输出结果有直接影响。这就是为什么GPU在挖掘比特币的时候会比CPU高效很多的原因,因为比特币挖掘不需要CPU那样的决策任务

,而只是重复的数学运算,比特币挖掘中唯一的决策任务是求证“我是否拥有一个有效的区块?”因此这样的任务很适合GPU完成。


起初,AMD为GPU设计了很多在相对低的时钟频率上(通常是1120-3200个算术逻辑单元运行于626-900MHz)运行的简单ALU填充器(VLIW架构),而Nvidia的微处理器架构包含相对少一些更复杂的算术逻

辑单元,通过在更高的染时钟频率上(通常是448-1024个算术逻辑单元运行于1150-1544MHz)运行来补偿总体效率。因为VLIW和非VLIW架构的差异,Nvidia每个ALU多占用更多面积的空间,这样每个芯片

里的ALU数量就更低,比AMD更早地触及频率上的性能瓶颈。这在AMD那里就体现为单个ALU的运行优势:


AMD Radeon HD 6990: 3072 ALUs x 830 MHz = 2550 billion 32位指令/秒

Nvidia GTX 590: 1024 ALUs x 1214 MHz = 1243 billion 32位指令/秒


这大致表现AMD和Nvidia的GPU在全线产品上存在的2倍-3倍性能差异,这在跟ALU相关的GPU运算中表现明显,例如比特币挖掘、密码暴力PJ等等。


此外,推荐使用AMD GPU的另一个原因在于挖掘算法基于SHA-256,这大量进行32位整数循环右移运算,这易操作在AMD GPU那里可以通过单一硬件指令实现,而在Nvidia GPU那里需要三步硬件指令来模拟

(2移+1加),仅这一条就为AMD带来额外的1.7倍运算效率优势(大约1900指令来执行SHA-256压缩操作,而不是Nvidia的大约3250指令)。


综合以上两点因素,AMD GPU有大约3倍到5倍的性能优势。


HD3000------HD3450 ,4200                  40个流处理器

HD3650                                    120个流处理器

HD3850 4650,5550                          320个流处理器

hD6570,6670                               480个流处理器

HD5750,6750                               720个流处理器

HD6550                                    400个流处理器

HD4830,4870,5770 ,6770                    800个流处理器


HD4850,5850,6850                          900个流处理器
HD5970,6970                              3200个流处理器







再借用几张图片给大家参考:





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x

评分

2

查看全部评分

2299

回帖

7035

积分

1865 小时

在线时间

中校

灌水天才鲁班小弟推广先锋

注册时间
2011-7-29
金币
4428 个
威望
1 个
荣誉
1 个
累计签到:80 天
连续签到:0 天
[LV.100]试剑无线
发表于 2011-12-30 03:52 |显示全部楼层
LZ也猫子!!!!我先买个看看!
回复

使用道具 举报

390

回帖

1801

积分

368 小时

在线时间

上尉

注册时间
2011-4-15
金币
1315 个
威望
8 个
荣誉
0 个
累计签到:3 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2011-12-30 06:49 |显示全部楼层
我也买一个!!
回复

使用道具 举报

363

回帖

5924

积分

507 小时

在线时间

中校

注册时间
2009-7-6
金币
5482 个
威望
5 个
荣誉
0 个
累计签到:549 天
连续签到:0 天
[LV.730]常住居民
发表于 2011-12-30 07:52 |显示全部楼层
我也买一个!!
回复

使用道具 举报

702

回帖

5745

积分

407 小时

在线时间

中校

注册时间
2011-9-23
金币
4978 个
威望
0 个
荣誉
1 个
累计签到:318 天
连续签到:0 天
[LV.365]无线熟人
发表于 2011-12-30 08:23 |显示全部楼层
好象我也有三张这样的表。。。
回复

使用道具 举报

259

回帖

573

积分

106 小时

在线时间

中尉

注册时间
2011-5-3
金币
278 个
威望
3 个
荣誉
0 个
累计签到:1 天
连续签到:0 天
[LV.20]漫游旅程
发表于 2011-12-30 08:34 |显示全部楼层
我也买一个看看,学习一下~~~
回复

使用道具 举报

3916

回帖

1万

积分

2577 小时

在线时间

上校

杰出会员鲁班小弟

注册时间
2009-8-28
金币
11409 个
威望
10 个
荣誉
5 个
累计签到:11 天
连续签到:1 天
[LV.20]漫游旅程
发表于 2011-12-30 08:38 |显示全部楼层
我也买一个!!
回复

使用道具 举报

1740

回帖

5512

积分

621 小时

在线时间

中校

注册时间
2010-10-13
金币
3641 个
威望
13 个
荣誉
0 个
累计签到:243 天
连续签到:0 天
[LV.365]无线熟人
发表于 2011-12-30 08:42 |显示全部楼层
学习学习学习
回复

使用道具 举报

702

回帖

5745

积分

407 小时

在线时间

中校

注册时间
2011-9-23
金币
4978 个
威望
0 个
荣誉
1 个
累计签到:318 天
连续签到:0 天
[LV.365]无线熟人
发表于 2011-12-30 08:51 |显示全部楼层
楼主啊,发表的好啊,这两元超值啊,HD4870*2在速龙四核+880主板上才2万左右,最近卖了裤子来个I7+P67+8G内存也是2万多,这钱投错地方了
回复

使用道具 举报

891

回帖

3069

积分

73 小时

在线时间

少校

注册时间
2011-9-13
金币
2161 个
威望
2 个
荣誉
0 个
累计签到:28 天
连续签到:0 天
[LV.50]初入江湖
发表于 2011-12-30 09:09 |显示全部楼层
好贵啊!!!
回复

使用道具 举报

107

回帖

1164

积分

67 小时

在线时间

上尉

注册时间
2011-10-24
金币
1026 个
威望
4 个
荣誉
0 个

尚未签到

发表于 2011-12-30 09:56 |显示全部楼层
回复了就便宜1元
回复

使用道具 举报

243

回帖

361

积分

99 小时

在线时间

少尉

注册时间
2010-11-15
金币
108 个
威望
0 个
荣誉
0 个

尚未签到

发表于 2011-12-30 10:02 |显示全部楼层
我也买一个看看,学习一下~~~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

站点统计 | Archiver | 手机版 | 无线门户 ( 粤ICP备11076993号|粤公网安备44010602008359号 ) |网站地图

GMT+8, 2024-9-21 19:02

返回顶部 返回列表