腾讯数码数码 > 滚动新闻 > 正文

异构计算当道 APU异构百核实战解析

2011年09月20日19:32PConline我要评论(0)
字号:T|T

  异构计算在PC行业里得到了更多关注,主要原因来自于AMD发布的AMD Fusion系列APU,通过CPU与GPU的完美融合,APU的一个重大特点就是支持“异构计算”, 首次让用户感受到了传统PC在性能与应用上的巨大提升。AMD为“异构计算”这个特色功能起了个通俗名称——“百核加速”;意思是可以利用APU内置的数百个GPU处理核心和CPU的四个核心进行协同加速计算,从而达到性能大幅提升的目的。

  异构计算受关注还有一个重要因素是原来的CPU+GPU平台组合由于没有合理利用而存在一些功率浪费:通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗的瓶颈;与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能-芯片面积比和性能-功耗比都很高,却远远没有得到充分利用。因此,人们希望找寻到一种更加高效工作的技术,异构计算也就孕育而生。

  异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等处理器,也包括、DSP、ASIC、FPGA等。广义上,不同计算平台的各个层次上都存在异构现象,除硬件层的指令集、互联方式、内存层次之外,软件层中应用二进制接口、API、语言特性底层实现等的不同,对于上层应用和服务而言,也都是异构的。回到我们今天讨论的话题,正因为由上述这些特点,异构计算所蕴含着巨大的优点,对于融合芯片而言,异构计算帮助芯片内部的各个组件提高对话效率,帮助基于此芯片构建的系统实现性能提升。在此评测文章中我们非常期待来自AMD APU A6-3400M的异构计算性能表现。 以下是我们选取的两款平台配置:

  

硬件测试环境
品牌 AMD(支持DX11)INTEL
处理器A6-3400M 1.4GHz/2.3GHzi5-2410M 2.30GHz/2.90GHz
内存4GB DDR3 1333MHz
显卡AMD Radeon HD(6520G+6650M)Intel Graphics HD3000
NVIDIA Geforce GT540M
硬盘5400rpm S-ATA HDD
显示器14英寸LED宽屏 1366x768分辨率
系统Windows 7 Ultimate 64bit

  HC Benchmark测试APU异构系统综合性能

  由中国计量科学院近期开发完成的HC Benchmark,是全球第一款真正的异构计算基准测试工具,能够真正同时调用CPU、GPU资源。这个工具的测试有办公应用、视频体验、上网体验、游戏体验四部分,可自由选择进行测试,完成后给出四个子分数和一个总分数。如果系统中有APU这种异构系统,程序就会自动为CPU、GPU分配计算任务。如果说GPU不支持加速计算,就会全部交给CPU执行。 换句话说,HC Benchmark最终的得分,取决于异构芯片内部的CPU和GPU计算任务分配是否合理、芯片内建的GPU是否支持加速计算。

异构计算当道 APU异构百核实战解析

  HC Benchmark测试结果所体现出的正是AMD APU独有的异构系统优越性。从这两个不同平台的对比结果看,正是由于Intel不支持异构计算,没有办法判断或者不能合理分配处理任务,导致CPU与GPU在协同工作的效能大打折扣,从而降低整机综合处理能力,同时在运行繁重任务时增加整机功耗与散热,而这两处缺点却正好是AMD APU这次革新所带来的巨大优势。

异构计算当道 APU异构百核实战解析

IE9测试APU硬件加速性能

  为提高性能,Internet Explorer9使用计算机的图形处理器来处理侧重图形的任务,比如视频流或在线游戏内容。通过利用GPU,Internet Explorer9提供了更快更逼真的Web体验及前所未有的交互性。这一切完美性能的表现均来自于AMD APU所支持的硬件加速技术,在说到硬件加速技术之前,我们不得不提到Open CL,事实上也正是对Open CL的支持,给予了AMD APU这种卓越性能。

异构计算当道 APU异构百核实战解析

  首先作为一个专为异构平台编写程序的框架,Open CL能够调用系统内的全部计算资源(CPU与GPU),在将电脑中的一个或多个运行程序按运算量,平衡分配给系统中的各个运算部分。也就是说用户在使用基于OpenCL标准编写的程序时,再也不会出现处理器占用率100%,显卡占用率几乎没有的现象了。同样也是基于此基础,AMD APU的硬件加速技术在用户有需要使用CPU来完成的工作时(如转换视频),GPU就会帮助CPU进行运算,以提高转换速度。

异构计算当道 APU异构百核实战解析

  IE9鱼缸测试成绩,在300条鱼的条件下,APU平台取得30帧/秒的成绩,而相应i5平台只有22帧,APU完全领先。

推荐微博:

  • 绿恐龙哥哥

  • 数码莫莫

  • 影像仓库

  • 莫言

  • 腾讯应用中心

注册微博
[责任编辑:yangzhao]
登录 (请登录发言,并遵守相关规定) 分享至: 腾讯微博
如果你对数码频道有任何意见或建议,请到交流平台反馈。到微博反馈

企业服务

热点推荐

推广信息