通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  列兵

注册:2020-1-6
发表于 2020-1-15 10:15:20 |显示全部楼层


01、微处理器简介
CPU(Central Processing Unit )
CPU是计算机核心部件,主要包括控制器和运算器。
按照应用分为三个主要分支:
● 微处理器(Micro Processor Unit, MPU):功能和性能完备的CPU,用于各种类型的计算机系统;
● 数字信号处理器(Digital Signal Processor,DSP):专门用于处理数字语音、图像的CPU,用于实时数字信号处理的专门场合;
● 微控制器(MicroController Unit,MCU):一般是单片机,集成存储器、AD和DA变换、专用接口等,用于实现设备的专用控制。
图形处理器(Graphics Processing Unit,GPU)是协助微处理器完成图形处理和显示的专用处理器。
主要的微处理器系列
微处理器产品按照其指令系统区分不同的系列,同一系列的微处理器的指令系统相同或具有兼容性。
● 同一个厂商会在一个处理器产品的基础上不断研发下一代兼容产品,新一代的处理器与其前一代实现指令兼容,即新处理器的指令包含前一代处理器的全部指令,同时可能增加新指令。
例如
Intel的8086→80286→80386→80486→Pentium…


● 不同厂商可能生产指令兼容的处理器产品。
例如:AMD生产部分的处理器属于Intel x86指令兼容产品。
MIPS处理器
MIPS微处理器是由MIPS公司设计的RISC处理器,最早期产品是1985年发布的R2000。早期的MIPS处理器为32位字长,之后发展为64位。
主要用于游戏机、数码相机、数字电视等设备作为嵌入处理器。
MIPS指令为RISC结构,全部指令32位,其中操作码部分6位,其余26位是地址码(操作数)部分。


ARM处理器
ARM(Advanced RISC Machines,早期称为Acorn RISC Machine )微处理器是一类微处理器的通称,采用32位RISC结构。


ARM是一种具有知识产权的处理器核心(Intellectual Property core,IP core ),处理器或电子产品厂商可以购买IP core构成自己的定制ARM处理器。


ARM技术自80年代末期开始,经历了ARM2、ARM3、ARM6、ARM7、ARM9、ARM10、ARM11等多代内核系列。
ARM核心处理器的特点是低成本、低功耗,所以广泛应用于各种消费类电子产品,在目前32位嵌入处理器中占75%。
PowerPC处理器
PowerPC是一种高性能的RISC通用处理器,于90年代初由Apple、IBM和Motorola组成的联盟(AIM alliance)研制。包括32位和后推出的64位产品。


02、微处理器的基本技术参数
字长
● 处理器字长:处理器一次能处理的二进制数的位数。是处理器中ALU的处理位数,也是处理器中通用寄存器的位数。目前有8位、16位、32位和64位几种字长微处理器。
● 某一字长的微处理器通常兼有低字长处理指令。如32位的微处理器的指令系统中包含32位、16位和8位的运算和传送指令;
● 处理器中可以嵌入特殊运算部件,可以处理超过处理器字长的数据。
如32位intel x86处理器中的 浮点处理单元(Floating-Point Unit,FPU)可以完成最长80位的数据运算。
● Intel x86系列处理器字长


时钟频率
● 处理器主频:驱动处理器工作的周期性时钟脉冲信号的频率,又称为时钟频率或内核时钟频率,是处理器内核电路的实际工作频率。时钟频率的倒数是时钟周期。
● 机器周期:由多个时钟周期组成,是一个处理器基本操作需要的时间,如取指令、取存储器操作数等。
● 指令周期:处理器完成一条指令的时间,由一个或多个机器周期组成。是在RISC处理器中,大多数指令的指令周期只包含1个机器周期(单周期指令)。CISC处理器中只有很少指令是单周期指令。


● 处理器外频:处理器总线(Intel称Front Side Bus,FSB,前端总线)时钟频率,一般低于处理器主频,是处理器与外部(存储器、接口电路)信息传输的时钟频率。
● 倍频系数:多数处理器主频是由外频经过倍频(由倍频电路完成)获得,倍频的倍数即倍频系数。主频、外频的关系:
主频=外频×倍频系数
●超频:超频就是在实际使用中让处理器工作在高于额定处理器主频的工作频率上。一般是通过调整倍频系数实现。超频工作可能使得处理器过热而造成不稳定,甚至烧毁。
● Turbo Boost:Intel处理器采用的动态超频机制,在温度和其他特性允许的范围内根据需求提高核心时钟频率。
● SpeedStep:Intel处理器中采用的一种节能技术,根据处理器的使用率动态改变倍频系数降低主频。目前用于大多数Intel处理器。AMD处理器的类似技术是PowerNow。
● 时钟频率测试:


处理器总线
● 处理器总线主要参数:时钟频率、数据位宽和地址位宽。
● 数据位宽:数据总线的位宽。处理器数据总线位宽与处理器位宽可能不一致。
● 地址位宽:地址总线位度决定了处理器可以访问存储器的物理地址空间,即寻址空间。是处理器能使用的最大存储器容量。N位地址位宽的寻址空间是2的N次方。


供电电压
处理器的工作电压呈现逐步下降的趋势,低电压供电可以大幅度降低处理器功耗。在相同的时钟频率下,CMOS工艺的处理器功耗与供电电压的平方成正比。


制造工艺
● 半导体技术:目前采用的半导体集成技术全部为硅材料CMOS(Complementary Metal Oxide Simeconductor,互补型金属氧化物半导体)技术。
● 线宽:指硅芯片上的最基本功能单元——门电路的宽度。集成度的不断提高依靠线宽的不断减小。


03、提高处理器性能的先进技术
流水线
● 非流水线指令的执行过程:每一条指令必须顺序完成该指令的各种基本操作,每一个操作需要一个机器周期。只有当前一条指令的最后一个基本操作完成后才开始下一条指令的取指令操作。


● 流水线(Pipeline):如果处理器的各个功能部件可以同时工作,就可以实现指令的基本操作的流水线操作。Intel在80486中首次采用流水线结构。理想情况下每一机器周期执行一条指令。


● 流水线冲突:流水线执行过程中可能需要等待,主要包括:
◢ 数据冲突:一条指令需要的数据还没有被前面的指令计算出来,或一条指令需要的寄存器数据还没有装入;
◢ 资源冲突:一条指令需要的硬件资源被另一指令占用;
◢ 控制流冲突:一条转移指令的转移条件还没有生成。
● 流水线机制改进
◢ 增加功能单元:通过集成多个相同的硬件功能单元,可以避免资源冲突;
◢ 分支预测:通过分支预测机制可以减少控制冲突;
◢ 长流水线:执行一条指令的基本操作越细化,流水线长度越长,流水线效率越高。如Intel Pentium 4采用20~31级超长流水线结构,但过长的流水线可能会使得发生冲突的代价增加。
超标量
● 超标量(Superscalar): 在处理器内核中采用指令级并行机制。通过集成两个或更多相同的基本功能部件,构成两条流水线同时执行的机制即超标量。


超线程
● 线程(Thread):是操作系统进行调度程序的最小单位,包含在进程中,一个进程中可以存在多个并发(同时在执行)线程。
● 超线程(Hyper Threading,HT):在超标量基础上发展而来的新的程序执行技术,通过动态调度处理器的多个基本功能部件,可以在一个处理器核心同时执行两个线程,相当于将一个处理器核心作为两个逻辑处理器来使用。


Cache
● Cache:高速缓冲存储器,提高存储器读写速度的机制。根据目前的半导体集成技术,CPU的核心速度很高,时钟频率可以达到几GHz,而主存储器(由动态存储器构成)的速度远远达不到CPU的速度,时钟频率只有几十MHz。


● 使用Cache的原因:
◢ 主存储器由动态存储器构成(千兆级容量,集成度高、价格低),Cache存储器由静态存储器构成(兆级容量,集成度低,价格高)。采用Cache机制是性能价格比很高的方案;
◢ 存储器访问的时间局部性规律:如果一个存储项被访问,则可能该项会很快被再次访问。
◢ 存储器访问的空间局部性规律:如果一个存储项被访问,则该项邻近的项也可能很快被访问。


● Cache块(Cache Line Size):Cache存储器是分块操作的,即将Cache存储器分为大小相等的很多个存储块。Cache块是Cache与主存储器之间的交换单位。
● Cache组相联(Set Associative):一般情况下,一个存储器块并不是可以实现与任意Cache块的映射,一个存储器块可以映射到Cache块的数目称为组相联路数(Way)。路数越多Cache机制越复杂,Cache效率越高。


● Cache命中:处理器访问存储器时,如果数据已存在于某一个Cache块中,则称为“命中”,否则为“失效”。命中的概率称为命中率。
● Cache失效:如果Cache“失效”,则要将被访问数据所在的存储器块复制到一个Cache块中,再访问Cache。
● Cache容量:Cache容量越大,命中率也越高,成本也越高;容量太小会使命中率过低,降低Cache系统的效率。Cache容量的确定是性能和价格的权衡。一般Cache容量为主存储器容量的几百~几千分之一。64MB的存储器采用256KB的Cache可以达到90%以上的命中率。
● Cache性能:Cache的性能取决于Cache访问速度与存储器访问速度的比值和命中率。
● 数据Cache和指令Cache
根据存储器访问的局部性规律,将Cache分为数据和指令分开的Cache会提高Cache的效率。Intel在Pentium中首先使用数据和指令分立的Cache。
● 多级Cache:为了提高Cache的性能价格比,目前的处理器都采用2级或3级Cache,其中最接近处理器核心的一级称为Level 1 Cache(简称L1 Cache),向外层是L2 Cache。


● CPUZ测试Cache参数:
CPUZ的CPU和Caches选项卡可以显示计算机的Cache参数。
例如Intel Core 2 Duo E7200处理器的Cache参数:


扩展指令集
● 处理器的运算类指令:主要分为三大类
◢ 整型数运算指令,由ALU实现;
◢ 浮点数运算指令,由FPU实现;
◢ 扩展指令,以SIMD(Single Instruction, Multiple Data )指令为主,由专用运算部件实现。


● MMX(MultiMedia eXtensions):在Pentium MMX处理器开始使用,MMX指令集的特点是64位整型运算,目的是提高多媒体数据处理速度。MMX以SIMD指令为主,也包括积和运算、饱和运算等指令,共57条新指令。
◢ SIMD:一次可以实现8个字节、4个字(16位)、2个双字(32位)和1个四字(64位)数据的运算。




◢ 积和运算:能对加法和乘法同时进行运算。
例如:
∑(Xi×Yi) = X0×Y0 + X1×Y1 + X2×Y2 + …
在向量运算、矩阵运算公式中包含大量的积和运算。
◢ 饱和运算:保证当运算结果超出最大值时锁定在最大值,低于最小值时锁定在最小值。


● 3D Now! :是由AMD在其处理器上首次使用的扩展指令集,主要面向浮点的三维图形加速,共有21条指令。在3D Now!之后,AMD在其Athlon系列处理器再扩展了Enhanced 3D Now!指令集。

● SSE(Streaming SIMD Extension):是Intel在Pentium III扩展的第二套指令集。和基于64位整型运算的MMX 指令集不同,SSE是基于128位的浮点运算指令,主要用于加速处理器的三维图形运算能力 。
SSE共包含70条新指令。实际运行效果比3D Now!更好。和Intel CPU本身的FPU运算速度的比较,使用SSE指令集的速度是x87指令(FPU的浮点指令集)速度的2倍。
● Intel的后续扩展指令集包括:
SSE2(P4 ,双精度浮点)、SSE3(P4)、
SSSE3(Core2)、SSE4(Core 2)。
● Intel扩展指令集简表


多核心
● 多核心:在一个CPU物理封装中封装多个处理器核心。是多CPU技术在PC中的普及。
● 由于频率的继续提高存在技术上的困难,未来提高CPU速度的主要途径将是多核心方式。


● CPUZ检测核心和超线程支持


64位技术
64位技术名词IA-64、 x86-64、AMD64、EM64T、Intel 64
●IA-64(Intel Architecture - 64)是由Intel开发的64位技术,2001年用于Intel Itanium(安腾,服务器CPU),其指令集与Intel的x86不兼容。
● x86-64:AMD开发的用于x86处理器的64位技术,与x86的32位指令兼容,后命名为AMD64。于2003年用于AMD的x86系列处理器,是第一个实用于x86处理器的64位技术标准。
●EM64T(Extended Memory 64 Technology )是Intel开发的用于x86处理器的64位技术,于2004年正式公布,之后更名为Intel 64。
● 64位扩展包括64位指令、64位寄存器、和64位寻址方式等方面的扩展。AMD64与Intel 64有微小的差别,一般编译程序将代码编译成AMD、Intel通用指令。
04、微处理器封装
DIP (Dual In-line Package):
双列直插式封装,用于8086时代


QFP(Plastic Quad Flat Package):
方型扁平式封装,用于286时代


PFP (Plastic Flat Package)
塑料扁平组件式封装:装的芯片与主板焊接起来,80386时代CPU采用


PGA(Ceramic Pin Grid Array Package)
陶瓷插针网格阵列封装
封装的芯片内外有多个方阵形的插针
安装时,将芯片插入专门的PGA插座
从80486开始的CPU采用PGA封装形式


LGA (Land Grid Array)
平面网格阵列
其特征是没有了以往的针脚,取而代之的是整齐排列的金属圆点,CPU不再靠针脚接触来固定,而是使用一个金属扣架将CPU压在露出来的弹性触须上 。


LGA系列
Intel的处理器从Pentium 4 F系列开始采用LGA系列封装。
主要包括LGA775、LGA1366和LGA1156三种。


05、典型微处理器介绍
Intel处理器分类


● 处理器品牌、核心和型号的关系
◢ 一个品牌可能包含多个核心下的产品
如桌面系列的Core i7包括Bloomfield、Lynnfield和Gulftown三种核心的产品。这些处理器的定位不同、性能指标不同、甚至封装也不同。

◢ 一个核心可能包含多种品牌产品
如Bloomfield核心的处理器包括Intel Xeon(志强)、Core i7、Core i7 Extreme名下的多个型号的产品。
◢ 同属于一个核心和品牌的处理器,有多个型号
如Lynnfield核心的Core i5处理器包括750、750S和760三个型号,这三款处理器结构相同,性能指标有差别,价格接近。
● 处理器品牌与核心的关系例


● Intel桌面系列处理器构架演变过程(从Pentium开始)


● 目前Intel处理器的系列和核心
通常CPU产品分为面向台式机(Desktop)、笔记本(Mobile)和服务器(Server)应用的三个系列。


Intel系列
● Intel在用的早期处理器P5→P6→NetBurst


● NetBurst微构架技术特点
◢ 180~65nm线宽核心:Pentium 4 / 4 HT / D / EE
◢ 400MHz前端总线:通过每个脉冲传送4组数据的×4技术,得到4倍于外频的FSB,100MHz的外频时FSB达到400MHz,使得在P4 处理器和内存之间提供了3.2 GB/s的传输带宽。
◢ SSE2指令集:128位宽的双精度浮点SIMD指令集大幅度提高了浮点运算的速度。
◢ Trace Cache:将L1指令Cache改进为译码之后的微码缓存,可以存放12K条微码,访问命中可以直接执行。
◢ 20/31级超长流水线:将指令执行的级数增大,可以减小指令执行的平均时间。
● Intel NetBurst构架桌面系列处理器:Pentium 4 / 4 HT / 4 EE


Pentium D/EE
Intel NetBurst构架桌面系列处理器:Pentium D/EE




Core
● Core微构架的主要技术特点
◢ 采用65/45nm线宽集成技术,主要包括双核/四核(少部分单核)处理器,不支持HT;
◢ 采用32KB+32KB的L1 Cache,双核心两个核心共享的2/4/6MB L2 Cache,四核心下2×1~6MB L2 Cache;
◢ SSSE3(Supplemental Streaming SIMD Extensions 3 )指令集,增加16条指令;
◢ Intel 64,Intel的64位扩展,AMD的64位扩展为AMD64,两种64位扩展稍有不同;
◢ 加强分支预测能力,缩短流水线长度,由NetBurst后期的31级缩短为14级。
● Core 2 Duo/Quad/EE主要产品


● Pentium Dual Core / Celeron主要产品


Nehalem
● Nehalem微构架的主要特点
◢ 45/32nm线宽工艺,集成2~8个核心(部分支持HT);
◢ 集成2~3通道存储器控制器,支持DDR3。
◢ 采用QPI(QuickPath Interconnect)替代上一代的FSB处理器总线。或集成PCI Express和DMI通道,替代北桥芯片(部分型号);
◢ 三级Cache,64KB L1/核心(32KB Data + 32KB Code),256KB L2/核心,4~12MB L3 共享Cache;
◢ 支持Intel Turbo Boost技术,动态超频机制,在温度和其他特性允许的范围内根据需求提高核心时钟频率;
◢ 集成GPU(部分型号)。
● Core i7/i5/i3桌面系列主要产品


● Core i7/i5/i3移动系列主要产品



06、处理器性能测试
测试软件
PC Wizard,www.cpuid.com 免费下载
AIDA64,www.Lavalys.com 免费下载试用版


AIDA64测试比较Pentium D 820和Core 2 Duo E7200


● Pentium D 820和Core 2 Duo E7200测试结果分析
Core 2 Duo E7200综合性能比Pentium D 820高出约28%,可能的原因:
◢ 微结构不同,Core比Netburst更先进;
◢ Cache方面,E7200的L1 Cache为64KB,而820只有其一半。E7200采用共享的L2 Cache,并且容量更大。820核心采用各自的L1 Cache;
◢ E7200支持的指令集更多,支持SSSE3和SSE4.1扩展指令集,CPU Queen测试算法具备开展指令优化;
◢ Core核心比Netburst核心具备更优秀的分支预测能力;
●性能价格比:可以在Intel官网(www.intel.com)和中关村在线(www.zol.com.cn)查阅CPU价格。
● CPU-Z(官网:www.cpuid.com,免费下载)
◢ CPU(类型、核心、封装、工艺、电压、时钟、倍频系数等),Cache,主机板,存储器等权威测试软件。
◢ 2012年10月的最高版本1.61,建议使用32bit英文zip板
● AIDA64(官网:www.Lavalys.com,免费下载试用版)
◢ 计算机硬件综合参数检测和性能测试软件,早期版本名称是EVEREST;
◢ 建议使用AIDA64 Extreme Edition ZIP版。
● PC Wizard (官网:www.cpuid.com,免费下载)
◢ 计算机硬件综合参数检测和性能测试软件;
◢ 最新版PC Wizard 2012,建议使用ZIP版。
● 鲁大师(官方网站:www.ludashi.com
07、往期回顾(关注微信公众号“传知学院”即可查看,还有其他更多干货资料分享)
1、边缘计算专题
2、云计算专题
3、2020年:月薪15K+,5G岗位虚位以待
















举报本楼

您需要登录后才可以回帖 登录 | 注册 |

Archiver|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-3-29 16:07 , Processed in 0.359494 second(s), 15 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部