作为DirectX发展史上寿命最长的版本,DirectX 9.0缔造了一个显卡的黄金时代,也成就了图形业双雄NVIDIA和ATI(现在已并入AMD)在业内无人可抗衡的地位。但消费需求永远是驱动技术进步的原动力,作为DirectX标准的制定者,微软并没有止步不前,目前DirectX 9.0的继任者DirectX 10已经走到了大众的面前。
新一代DX标准:DirectX 10(点击放大)
这个即将随同微软Windows Vista操作系统一同面世的DirectX API将再次撼动当今显示卡市场的格局,因为这又将是一个新时代的开始。当然和众多新标准一样,DirectX 10也将经历标准发布、规格修正、版本更新直到最终完善,但不管怎么说,它开启了又一个显卡的新纪元,其带来的市场经济价值和对图形工业的影响绝对不是几句话就能阐述清楚的。
GeForce 8800GTX
随着多核CPU的逐渐普及、以及Vista、DX10时代的到来,无论是3D游戏还是2D的视频回放,都对显示子系统提出了更高的要求。而如何将各方对于数字娱乐“视觉化”的努力呈现在消费者面前,正是NVIDIA关注的焦点。作为全球首款全面支持Vista、DX10的图形芯片,G80所代表的正是目前最先进的图形图像处理技术,它们将在即将到来的数字娱乐时代中成为划时代的桥梁,帮助消费者享受到顶级的视觉体验。
由G80实时渲染出来的人物皮肤
就在大家翘首企盼Vista的时候,NVIDIA在略带凉意的11月将其第八代显卡——G80带到了消费者的眼前,率先完成了硬件层面上的对DX10的良好支持。由于采用了符合DX10规范的统一渲染架构,G80的规格较之前的G7x系列产品有了根本的变化。Shader部分由128个向量处理单元组成,称作Steaming-Prozessoren,频率显著高于GPU的其余部分,G80的Gigathread架构可以支持上千个线程在Shader中运行,由于是彻底的Unified Shader架构并支持Stream Output,所以G80的Vertex Shader支持顶点纹理拾取,因此不会出现像ATI的R5xx系列那样支持HDR+FSAA却不支持顶点纹理拾取的现象。
G80可以模拟出几乎以假乱真的青蛙
G80的ROP(光栅处理器)每4个为一组,有6组,共24个ROP(对应384bit显存位宽),比G71多出50%,每个ROP每时钟周期可以进行8次Z-Buffer操作。而且,G80的ROP支持单周期8重Render Target,支持对FP16和FP32 Render Target的Frame Buffer Blending,每种Frame Buffer都可以同时进行FSAA和HDR。FSAA方面,G80支持MSAA、FSAA和TAA,单GPU模式支持8x、8xQ、16x和16xQ模式AA。
第2页:业界第一枚DX10图形芯片——G80
作为目前全球最大的桌面视觉芯片解决方案领导厂商 ,NVIDIA一直和微软保持着亲密的合作,回顾DirectX的发展史,NVIDIA的显卡产品一直保持着和DirectX标准同步发布的光荣传传统。无论是2000年DirectX 7时代首推GPU理念的GeForce 2,还是2004年支持SM3.0的GeForce 6800,乃至最新的支持DX10规范的G80,NVIDIA都在第一时间将新技术、新标准成功的转化为最终的产品。
GeForce 256是首款支持DirectX 7的显卡
GeForce 256给NVIDIA带来了两个业界的第一:第一个在业内引入了GPU的概念(Graphics Processing Unit),将显卡在PC系统中的作用上升到了和CPU一样的高度;第一款将硬件T&L功能带入游戏显卡当中,中文名叫“坐标转换和光源”的该技术将CPU从繁重的3D运算中解放出来,使GPU进行部分原本CPU的工作,尤其是在3D图形处理时,换句话说,拥有T&L显示卡,使用DirectX 7.0,即使没有高速的CPU,同样能流畅的跑3D游戏。
GeForce3 Ti显卡第一个敲开了DirectX 8的大门
虽然GeForce3 Ti的王者之位只保持了短短半年就被其后继者GeForce4 Ti,但其带来的深远意义却是后者所不能及的。GeForce3的推出引发了一场显卡革命,它首次引入了像素渲染引擎(Vertex Shader)与顶点渲染引擎(Pixel Shader)的概念。同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大,它使GPU真正成为了可编程的处理器。这意味着程序员可通过它们实现3D场景构建的难度大大降低。通过VS和PS的渲染,可以很容易的宁造出真实的水面动态波纹光影效果。
GeForce 6800 Ultra显卡率先将消费者带入DirectX 9.0c
尽管由于种种原因,NVIDIA没有成为第一个推出DirectX 9.0显卡的厂商,但在2004年的春季,NVIDIA拿出了震撼业界的首款完全支持DirectX 9.0c的产品——NV40,并凭此将竞争对手远远甩在了后头。随后推出的NV43/NV44更是将该优势扩大到了PCI-E领域,凭借着GeForce 6的先声夺人和GeForce 7的全面压制,NVIDIA最终取得了这场历时4年的DirectX 9.0标准之争最后,也是最关键的胜利。
G80揭开了DirectX 10的神秘面纱
上帝总是青睐有准备的人,毫无疑问,NVIDIA又一次站在了时代的前列,革命性的G80又将第一个为业界揭开了DirectX 10的神秘面纱。虽然现在我们还不能玩到真正意义上的DX10游戏,虽然支持WGF 2.0标准的Vista最终版还没有到来,但在2006年的冬天,NVIDIA的G80无疑引领显卡行业之趋势,成为业界之执牛耳者。
GeForce 8800GTX GeForce 8800GTS GeForce 7900GTX GeForce 7950GX2 Radeon X1950XTX 核心代号 G80 G80 G71 G71*2 R580+ 制造工艺 90m, 90nm 90nm 90nm 90nm Steaming-Prozessoren 128 96 N/A N/A N/A 像素管线 N/A N/A 24 24*2 16(48) 顶点单元 N/A N/A 8 8*2 8 核心频率 575MHz 500MHz 650MHz 500MHz 650MHz 显存频率 1800MHz 1600MHz 1600MHz 1200MHz 2000Mhz 显存位宽 384Bit 320Bit 256Bit 256Bit*2 256Bit 显存容量 768MB 640MB 512MB 512MB*2 512MB DX版本 DX 10.0 DX 10.0 DX 9.0c DX 9.0c DX 9.0c
G80和前几代顶级显卡规格对比
上图就是G80和前几代顶级显卡规格对比,除了在显存位宽和显存容量上继续攀登高峰外,最大的改变就是没有了传统意义上的渲染管线和VS/PS单元,取而代之的是效率更高,性能更强的Steaming-Prozessoren单元。这种改变应该归功于G80采用的是统一渲染架构。
第3页:让游戏更真实——G80的新特性
Shader Moder 4.0
相比DX9,DX10在各个技术层面有了长足的飞越
虽然我们在之前的DX10技术分析中提到了SM4.0,但SM4.0在规格方面都有哪些进步可能并不为多数人所熟悉。上图就是各个版本的SM标准的比较,相比原先的Shader Model 3.0,SM4.0支持的最大指令数从512条增加到了64000条;暂存器数量也从原先的32个增加到惊人的4096个。同时Texture由SM3.0的16个提升至128个,并硬件支持RGBE,令HDR不再需要特别的Decoding处理也能实现,HDR+AA将不再有这么多的麻烦。对于2D的纹理尺寸支持来看,DirectX 10也有惊人的提升,8192x8192的最高纹理分辩率比原先最高4096x4096的分辩率要高出许多。
支持128Bit的HDR+FSAA
G80支持128Bit的HDR+FSAA(点击放大)
GeForce 6/7虽然在性能上较竞争对手的产品来的强,但由于NVIDIA采用了OpenEXR做为HDR运算的缓存格式,使得GeForce 6/7系列显卡只提供了对OpenEXR的16位浮点(FP16)HDR的支持。然而在DirectX 9.0模式下运行FP16时,会占用到原本属于FSAA(全屏抗锯齿)的缓冲区域,使得在开启HDR效果后无法进行FSAA处理。这也就是为什么当前的GeForce 6/7系列显卡在大部分FP16游戏无法同时支持FSAA和HDR的主要缘故。
ATI X1K系列显卡则采取折中的办法,通过另外指定缓冲区来解决这个问题,不过由于是来自API的限制,程序设计者仍必须对游戏进行单独处理才能实现HDR+FSAA效果,因此目前能够同时支持这两种特效的游戏数量还十分有限。但不管怎么说,ATI在X1K上使用的这种变通的方式为其赢得了不少游戏玩家的拥戴。
HDR+FSAA效果图
在最新的GeForce 8800中,G7x系列的遗憾终于成为现实。G80不仅支持128Bit的HDR+FSAA,并且每通道的HDR效果都达到了FP32的完全浮点精度。此外在原有HDR的基础上,G80还将抗锯齿模式进行了优化和升级,支持独有的HDR+MSAA和HDR+CSAA,这一点在原来的G7x系列上,是几乎不可能实现的。
|