我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019香港正版挂牌彩图 > 海蛞蝓 >

测试采用的数据是AES加密/解密组合

归档日期:06-03       文本归类:海蛞蝓      文章编辑:爱尚语录

  (注:本文实质源自Anandtech,雷锋网翻译) 对前沿半导体感兴致的人都领会,Intel最新的制!

  对前沿半导体感兴致的人都领会,Intel最新的创设工艺仍旧跳票许久了。10nm工艺初次发外是正在2014年,最初定于2016年量产,但却平素延期至今。固然首批利用10nm工艺的转移管制器正在2017岁暮出货,却是以“特供”条记本电脑的事势与邦内少许大学合营推出。

  Intel的10nm管制器属于第8代酷睿系列,型号是i3 8121U。该管制器的ARK页面(Intel的正在线数据库)仍旧公然,其焦点代号为Cannon Lake,属于14nm Skylake焦点的革新版,于2018年第二季度正式发外。

  i3 8121U的TDP为15W,双核四线nm Kaby Lake管制器以至还要更低少许。最为新鲜的是,固然这是一颗转移管制器,却维持任职器和高端桌面平台管制器才有的AVX-512指令集,可能像企业级硬件相通管制向量运算。

  i3 8121U的频率不进反退,让人们对Intel 10nm工艺的实践机能外示形成了丝丝疑虑。雷锋网从外媒SemiAccurate的一篇钻探作品中获悉,目前(指i3 8121U推出时)Intel的10nm工艺还存正在良众题目和贫苦,其收益唯有10%,远低于估计中的60%,个中SAQP、COAG、Cobalt和调甲等症结远远落伍于策划和预期。

  其后的几个月,坊间风闻Intel 10nm工艺紧要受阻,以至将要放弃10nm的研发办事,也有风闻称Intel将低落准绳以达成这一制程,但都被Intel逐一辟谣。好正在本年的CES上,Intel映现了10nm工艺的全新Sunny Cove架构Ice Lake管制器,算是让合心新制程的人们吃了一颗定心丸。

  固然Ice Lake暂且还未落地,但是外媒Anandtech却通过各样渠道,弄到了利用Cannon Lake管制器的“特供”条记本电脑,并对其举行了注意的测试。

  2017年9月,Intel正在工夫与创设日上映现了一个10nm Cannon Lake芯片的完全300mm晶圆,外媒Techinsights测得该芯片的芯局部积约为70.5mm²,也便是说,i3 8121U是Intel迄今为止最小的双核管制器,但与当时的Skylake管制器(六代酷睿)比拟,i3 8121U采用了CPU和GPU散开的计划,集成度更低。

  业内量度半导体工艺瑕瑜的常用准绳之一,是芯片中每平方毫米集成度晶体管数目相合。CPU中并不都是运算晶体管,再有SRAM单位,以及少许被计划成区域间热缓冲区的“死”硅。晶体管的计数也有分歧的举措,一个2输入的NAND逻辑单位比一个繁杂的扫描触发器逻辑单位要小得众。

  Intel将单元面积上的晶体管数目划分为2输入NAND单位和扫描触发器单位,个中2输入NAND单位的晶体管密度是90.78MTr/mm²(百万晶体管每平方毫米),扫描触发器单位的密度为115.74 MTr/mm²,正在为其授予60/40的权重后推算出10nm工艺的晶体管密度为100.8MTr/mm²,是14nm工艺37.5MTr/mm²的2.7倍。

  Intel还正在邦际电子器件聚会上披露,整体取决于所需的效力,10nm工艺的逻辑库有10品种型,网罗短库(高密度库),中高库(高机能库)和高库(超高机能库)等。库越短,电途功耗越低,晶体管密度越高,但峰值机能也越低。以是Intel的10nm工艺本来有众种分歧的密度,实践上唯有密度最高的短库可能到达100.8MTr/mm²。

  正在实践芯片创设中,经常会同化利用众种库,较短的库合用于I/O和非焦点区等对机能不敏锐的部位以撙节本钱,较高的库通过较低的密度和较高的驱动电流,经常利用正在对机能敏锐的焦点区域。

  为了更好的剖判Intel 10nm工艺,起初要接头Fin(鳍)、Gate(栅极)、单位机制,以及界说与晶体管和FinFET合联的少许术语。

  晶体管的源极-漏极由鳍(灰色)供应,该鳍穿过栅极(绿色)并嵌入氧化物中,这里的症结目标是鳍的高度、宽度和栅长,半导体工艺的倾向是使每一个都尽或者小、单位机能尽或者高。

  Intel正在其22nm工艺中,利用了包括众个鳍片的三栅极晶体管来增众总驱动电流,以得回更好的机能。这就引入了一个新的器度:“鳍间距”,即鳍之间的隔断。假设一个鳍通过了众个栅极,栅极之间的隔断称为“栅极距”。

  鳍和栅极之间接触的越众,鳍间距越小,揭发就越低,机能也就越好,这可能增众驱动电流,也能驾驭寄生电容和栅电容。其后的14nm工艺中,鳍的高度、宽度和栅长都变得更短,每个鳍穿过的栅极也更众,所以得回了更好的机能。

  而到了10nm工艺,Intel也正在踊跃计划鳍构造,鳍间距从42nm缩减到34nm,鳍宽度从8nm缩减至7nm以避免寄生电容。改动看起来并不众,但正在这个标准上每nm都特别主要。Intel还通过增添共形钛层来改正源极和漏极扩散区域,鳍和沟槽之间的接触区域(栅极下方的灰色尖头)也须要让接触电阻最小化。正在10nm工艺中,Intel将其从钨接触改为钴接触,使接触线%,各种这些更正,让工夫变得极其具有离间性。

  鳍与栅极组合起来便是根基的电途单位,从22nm制程的扫描电子显微镜的图像来看,单位有6片鳍的和2片鳍的(当然也有其他规格的),栅极长度不尽不异,每个单位内都有灵活的鳍通报电流和非灵活的鳍行为间隔。

  正在10nm工艺上,利用高密度库的单位总共有8个鳍,个中5个是举止鳍,这些单位可用于I/O等不须要很高机能或对本钱敏锐的电途局限。高机能库和超高机能库则别离有10个和12个鳍,各自比拟前者众出一个异常的P鳍和N鳍,有助于供应异常的驱动电流,以合意的服从仙游来换取峰值机能的晋升。

  正在单位之间,经常会有很众行为间隔物的伪栅极。正在Intel 14nm工艺中,每个单位的两头都有一个伪栅极,这意味着两个单位之间会有两个伪栅极。而正在10nm工艺中,两个相邻的单位可能共享一个伪栅极,这将带来更大的密度上风,Intel流露最众可撙节20%芯局部积。

  晶体管内部,栅极经常靠两支长度略微越过单位尺寸的触点给源极和漏极加电,这弗成避免的要吞噬异常的平面尺寸。正在10nm工艺中,起码正在目前Cannon Lake管制器利用的版本中,Intel通过一种被称为“有源栅极接触”(COAG)的计划,将栅极触点笔直安顿正在单位上。这一计划为创设进程增众了好几个程序(一次蚀刻、一次浸积和一次扔光),但可认为芯片供应大约10%的面积缩放。

  前文仍旧言道,外媒SemiAccurate上的一篇钻探作品曾流露,COAG是一种危机较高的施行计划,固然Intel仍旧把它制出来而且寻常办事了,但它并不像预期的那样牢靠。用于Cannon Lake焦点的COAG犹如只可运转正在低机能&低功率,或高机能&高功率的工况下,希冀异日Intel能正在新一代10nm Ice Lake管制器正式发售时注意证明合于COAG的更正情景。

  回到晶体管密度上,量度晶体管密度的另一种举措是CPP*MMP,即将栅间距(接触众晶硅间距Contact Poly Pitch)乘以鳍间距(最小金属间距)。各种这些更正加正在沿途,使Intel的CPP*MMP尺寸唯有54nm*44nm,比拟台积电和三星的7nm也只是略输一点点,这也是Intel平素夸大前两者只是贸易定名的理由。

  固然i3 8121U的Cannon Lake焦点仍处于NDA中,但通过科技圈繁众同仁一年以还夜以继日的钻探,究竟照样根基揭开了其架构的面纱。

  具体而言,Cannon Lake焦点的计划很像是PC端Skylake焦点与任职器端Skylake-SP焦点的同化体。固然它利用了PC端准绳的4+1解码单位、8个实施单位以及L1+L2+L3缓存构造,但也从任职器端引入了一个AVX-512单位,而且L1数据缓存的读写速率别离到达了每周期2*512Byte和1*512Byte。

  除此以外,固然目前不太清爽Cannon Lake焦点的架构前端计划转化,但照样可能看出重排序缓冲区的巨细是与Skylake焦点不异的224条微指令,而Sunny Cove架构的大局限性子更正(存储带宽加倍、实施端口更众以及实施端口效力更正)都没有展示正在Cannon Lake焦点上。

  个中,IFMA是52位整数交融乘法加法(FMA),其活动与AVX512浮点FMA不异,延迟为4个时钟周期,每个时钟周期的模糊量为2(对付xmm/ymm/zmm为4和1)。该指令经常被用于辅助加密效力,但也意味着可能实施纵情精度的算术运算。

  而硬件加快SHA则纯粹是为加密算法加快而计划的,但是测试注明,Cannon Lake焦点有了它后速率依旧比Goldmont(下代Atom管制器的焦点)和AMD的Zen都慢,这意味着最少基于硬件的SHA正在i3 8121U上并不是希奇有效。

  除了增众新指令,Intel经常还会正在新焦点上更正现有的指令,用于增众模糊量或裁汰延迟(或两者兼而有之)。Cannon Lake焦点还维持Vector-AES性子,它许诺AES指令一次利用更众的AVX-512单位从而使模糊量倍增。

  正在Cannon Lake焦点上,最大的转化是可能硬件维持64位整数除法,不再须要割裂成几条指令,18个时钟周期内就可能实现64bit的IDIV。比拟之下,Zen实施同样的运算须要45个时钟周期,Skylake焦点则须要97时钟周期。

  对付全字整数矢量,AVX512BW下令VPERMW的等候时刻从6个时钟周期减小到4个,而且每个时钟的模糊量增众一倍。与向量相像,利用VMOVSS和VMOVSD下令转移或统一单/双精度标量的向量现正在与其他MOV下令的活动不异。

  对指令集的其他有益调度网罗使ZMM划分安宁方根更速一个时钟,并将少许GATHER函数的模糊量从每四个时钟一个增众到每三个时钟一个;回归则以旧x87指令的事势展示,个中x87 DIV、SQRT、REP CMPS、LFENCE和MFENCE都变慢一了个时钟,其他指令则慢的更众,方针是让人们弃用这些老旧的指令。

  Cannon Lake焦点相对缺乏的地方网罗:VPCONFLICT*下令具有3个时钟周期的延迟,模糊量为每时钟周期一条,速率依旧很慢;DWORD ZMM外单的延迟为26个时钟,模糊量为每20个时钟1个;不维持Skylake-SP焦点的缓存行写回效力CLWB;不维持SGX(软件珍惜扩展)。

  正在i3 8121U的测试中,利用i3 8130U转移管制器行为比照,这是一款Kaby Lake焦点的双核四线nm工艺创设,TDP同样为15W,底子频率与i3 8121U不异,睿再三率则反而要稍高少许。

  对付这种15W TDP的转移管制器,会很容易撞上温度墙导致降频。测试中i3 8121U降频特别一再,正在AVX2行使中舒服是运转正在2.2GHz的基准频率状况,AVX-512行使中以至会降频至基准线GHz。

  比拟之下,利用14nm成熟工艺的i3 8130U正在AVX2行使中仍能坚持2.8GHz的频率,例如正在POV-Ray测试项中,i3 8130U可能更速的实现测试,机能比拟i3 8121U突出26%。

  正在缓存/内存延迟测试中,i3 8121U和i3 8130U管制器都禁用了睿频,迫使它们以不异的2.2 GHz频率运转,以便举行奇偶性和直接的架构对比。Cannon Lake焦点的缓存/内存子编制与Skylake焦点不异的,没有任何其他更正,外面上外示出的机能也应当根基不异。

  正在这项测试中,两颗管制器的缓存拜候延迟险些不异,但Cannon Lake焦点的i3 8121U的内存拜候延迟要突出Kaby Lake焦点的i3 8130U众达50%,一上来就恐惧了四座(当然这不是啥好事)。

  假使为i3 8121U配套的DDR4 2400内存时序17-17-17,略输于i3 8130U的16-16-16 -16,但这一丢丢时序分歧远缺乏以有这样大的影响,能思到的独一理由是,Cannon Lake焦点拜候内存驾驭器有特别大的异常开销,这恐怕便是封堵了阴魂和熔断缺陷的副感化。

  而功耗方面对比眼花缭乱,咱们领会,Intel正在管制器硬件中成立了两个症结的功耗限定——PL1和PL2,前者驾驭稳态功耗,后者驾驭短时刻睿频功耗。

  正在大无数情景下,管制器的稳态功耗和TDP不异,如i3 8130U便是云云,管制器的稳态功耗为15W,然而同为15W TDP的i3 8121U的稳态功耗仅为12.6W。由PL2驾驭的峰值功耗也是同样,i3 8130U的峰值功耗可能到达24.2 W,而i3 8121U最高只可冲到18.7W,且睿频的赓续时刻也要比i3 8130U短良众。

  糟心的是,固然i3 8121U的功耗墙更低,但因为其频率更低机能更差,实践实施运算所消磨的能量反而更众。正在POV-Ray测试项中,Kaby Lake焦点的i3 8130U的总耗能唯有768 mWh,而Cannon Lake焦点的i3 8121U的总耗能为867mWh,足足高了12.9%。

  除了功耗,合于Cannon Lake焦点的另一个题目正在于它是否是一个高效的架构计划。为了举行直接的IPC对比,咱们将两颗管制器固定住2.2 GHz同频率上运转SPEC2006 测试。

  SPEC2006是一个主要的基准测试软件,它与其他测试软件的区别正在于所管制的数据集更大更繁杂。行为基准测试更有代外性,它可能饱满映现架构的更众细节。

  从测试结果来看,两款分歧焦点的管制器机能相差无几,Kaby Lake焦点的i3 8130U正在与SIMD合联的462.libquantum和470.lbm测试项中犹如比Cannon Lake焦点的i3 8121U更有上风,这也许与二者内存延迟机能相合。

  编制测试局限中心合心实践用户体验,将网罗行使加载时刻、图像管制、浅易科学物理、仿真、神经仿线D模子开荒等测试项。

  编制相应速率是最合乎用户体验的目标,一个很好的测试用例是看行使加载须要众长时刻。正在这一测试中,Cannon Lake焦点的i3 8121U外示的希奇好。

  FCAT软件采用录制的视频,并将颜色数据管制成帧时刻数据,以便编制可能绘制可视化的帧率。

  3DPM测试是一个定制的基准测试,旨正在模仿3D空间中六个点的分歧粒子运动算法。算法的一个症结局限是利用了相对急速的随机数天生,最终正在代码中达成依赖链。正在这一测试中,咱们正在六种算法上运转一个原子粒子集,每次20秒,暂停10秒,并陈诉粒子转移的总速度,以每秒数百万次运动为单元。

  Dolphin 5.0是一款GameCube/Wii主机模仿器,可能正在PC上玩到这些老款逛戏主机的独吞盛行。但是,模仿这两台利用Power架构管制器的主机经常须要一颗不弱的管制器才行。

  DigiCortex基准测试最初计划用于神经元和突触举止的模仿和可视化,该软件具有众种基准形式,本次利用小基准测试,模仿32000个神经元和18亿个突触,界限相当于海蛞蝓的大脑。

  模仿类型分为“非胀舞”和“胀舞”两种形式,前者受内存影响更大,后者更依赖纯粹的管制器机能。测试中利用了后者,两款管制器的同频机能大致不异。

  y-Cruncher是一款助助推算各样数学常数的用具,软件维持通过二进制、单线程和众线程等分歧优化体例运转,以至网罗AVX-512优化的二进制文献。本次测试基于单线亿位圆周率。

  测试结果不出不测是 Cannon Lake焦点的i3 8121U获胜,到目前为止,一起可能应用AVX-512指令集的软件都是i3 8121U获胜。

  PhotoScan可能将很众2D图像转换为3D模子,这是模子开荒和归档中的一个主要用具,依赖于很众单线程和众线程算法。

  测试利用了PhotoScan v1.3.3版本,个中包括了84 x 1800万像素的大数据集,通过一个相当急速的算法变体,终末比照转换进程总时刻。

  烘托机能经常是管制器正在专业处境下的症结目标,从3D烘托到光栅化,涵盖网格、纹理、碰撞、锯齿、物理等方面。大无数烘托器都维持CPU烘托,少数可能维持GPU或FPGA和ASIC等专用芯片。对付大型办事室来说,CPU依旧是首选的硬件。

  Corona是3DS Max和Cinema 4D等软件的高级机能烘托器,基准测试的GUI可显示正正在构修的场景,并将烘托时刻反应给用户。

  本次测试利用了直接输出结果的下令行版本,输出的结果也不是陈诉时刻,而是陈诉六次运转中每秒的均匀光芒数,由于单元时刻内的机能比例经常更容易剖判。

  Blender是一个开源的高级烘托用具,维持大方可设备项,被宇宙上很众着名的动画办事室所利用。该软件的开荒小组比来发外了一个基准测试包,本次测试通过下令行运转该套件中的“bmw27”场景子测试,并丈量实现烘托的时刻。

  Blender同样只维持到AVX2指令集,正在这一测试中,两款管制器的同频机能大致不异,Cannon Lake 焦点的i3 8121U有衰弱上风。

  利用LuxRender引擎开荒的基准测试供应了几个分歧的场景和API,本次测试采用正在C ++和OpenCL代码途途上运转浅易的“Ball”场景,以大略烘托入手下手,并正在两分钟内迟缓降低质料,最终结果以每秒烘托的光芒数映现。

  Persistence of Vision光芒追踪引擎是另一个一目了然的基准测试用具,正在AMD发外Ryzen管制器之前平素藉藉无名,尔后Intel和AMD都入手下手向开源项方针重要分支提交卸码。

  Office测试套件旨正在埋头于更众行业准绳,如办工流程和编制聚会等,不过咱们也将编译器机能系缚正在本节中。对付务必对硬件举行总体评估的用户来说,这些经常是最须要推敲的基准测试。

  GeekBench 4是常用的跨平台测试用具,中心寻求峰值模糊量的一系列算法,网罗加密、压缩、急速傅里叶变换、存储器操作、n体物理、矩阵运算、直方图管制和HTML解析等,常用于转移修筑测试。

  跟着流媒体和短视频实质的振起,越来越众的家庭用户和逛戏玩家须要将视频文献举行转换,管制器的编码和转码机能变得越来越主要,本次编码测试也重要环绕这些主要的场景举行。

  Handbrake是一种时髦的开源视频转换软件,最新的版本可应用AVX-512和OpenCL来加快某些类型的转码和算法。本次测试利用的CPU转码。

  正在压缩/解压行使中,开源的7-Zip是很迎接的用具之一。本次料想是利用最新的v18.05版本,它内置有基准测试,从下令行运转基准测试,陈诉压缩、解压缩和归纳得分。

  正在大无数人的编制中经常都有WinRAR,它是20众年前的第一批压缩解压用具之一。它没有内置基准测试,本次利用一个包括超出30个60秒视频文献和2000个琐屑小文献的文献夹,以寻常压缩率运转压缩。

  WinRAR是可变线程的,但也容易受到缓存的影响,以是测试需运转它10次并取终末五次的均匀值,使结果可能映现CPU纯粹的原始推算机能。

  很众转移修筑默认利用的文献编制都供应了加密效力以珍惜实质,PC上的Windows也有,经常由BitLocker或第三方软件行使。本次利用已停产的TrueCrypt行为其内置基准测试,可直接正在内存中测试众种加密算法,维持AES指令集但不维持AVX-512。测试采用的数据是AES加密/解密组合,以每秒千兆字节为单元。

  Intel正在10nm工艺上确实举行了良众更正,假设每一步都能圆满运转,那么10nm应当正在客岁就成了。可题目是正在半导体计划中,有几百个分歧的性子,改动任何一个都或者会导致其他几个以至几十脾气子变差,这恰是Intel正在10nm工艺方面遭遇的最大题目。

  仍记得2018年的CES上,Intel对10nm工艺合联的题目闭口不言,从这好景不常的Cannon Lake焦点来看,独一称得上亮眼的外示唯有AVX-512机能,很彰着第一代10nm还远远没有盘算好迈入黄金时段,Intel是正在试图冷管制这一代管制器,也决定不会正式公然荒售它们。

  正在Intel给出的这张图中,右侧显示10nm工艺及其改型可依赖较低的动态电容具有较低的功率,然而数轴的左侧则显示10nm和10nm+工艺的单个晶体管机能本来还要低于此刻的14nm++工艺,要到下下下一代的10nm++工艺才气真正达成周到领先,而从i3 8121U的外示来看,很大体率上也意味着正在第三代10nm++工艺施行之前,业界很或者都无法看到线nm管制器(一竿子支到三零零零年了……)。

  估计将正在本年下半年问世的Ice Lake管制器会利用第二代10nm+工艺,电气机能将特别亲切14nm++工艺,恐怕那时Intel正在10nm工艺上打响真正的第一炮吧。

  标签:管制器 晶体管 10nm工艺 意大利 数据库 半导体 条记本电脑 双核管制器 触发器 雷锋网!

本文链接:http://beesochic.com/haikuoyu/73.html