过去几十年里,人们几乎默认计算机会一年比一年更快、更小、更便宜。这个直觉并不是凭空来的。半导体、架构、制造、软件和市场在很长一段时间里确实一起推动了指数级进步。但如果把这段历史看得更仔细一点,就会发现,计算产业从来不是一条“技术自然进步”的直线,而是一条由工程、商业、能源、生态和预期共同塑造的曲线。
理解这条曲线,才能真正看懂摩尔定律的意义,也才能理解为什么今天的芯片越来越强,却也越来越贵、越来越难做。
计算越强,生产率为什么不一定立刻上升
很多人会下意识地认为,技术更先进,生产率就一定更高。现实没有这么简单。
自动化确实能放大效率,但前提是原本的流程已经高效。如果流程本身低效,自动化常常只是把低效更牢固地固化下来。信息技术历史上长期存在一个著名现象:企业在计算机和信息系统上投入越多,短期内员工生产率反而未必上升,甚至可能下降。计算机时代似乎无处不在,但它对生产率的提升并不会自动、即时地体现在统计数字里。
这并不意味着计算技术没价值,而是说明技术必须嵌入正确的组织方式、产品形态和使用场景,才能真正转化为经济收益。
摩尔定律真正说的,不只是“晶体管翻倍”
摩尔定律最初并不是一句模糊的口号,而是一个非常具体的工程观察:在最低单位成本附近,集成电路上可容纳的元件数量会持续快速增长。最早的估计接近每年 1.8 倍,后来调整为大约每年 1.5 倍。换句话说,不只是“能塞下更多晶体管”,而是“在合适的成本点上,能以越来越划算的方式塞下更多晶体管”。
这件事的厉害之处在于,它直接改变了芯片设计的方法。
假设一款处理器需要三年研发,再卖三年,中间还有一次改版机会,那么设计团队面对的就不是“今天能做什么”,而是“产品上市时世界会变成什么样”。预算该瞄准今天的工艺,还是三到五年后的工艺?设计该保守,还是激进?项目一旦延期,原本正确的产品定义会不会在市场上瞬间过时?
在摩尔定律有效的年代,这些问题不是边缘问题,而是芯片行业最核心的战略问题。晚两年,不只是晚两年,而是错过整整一代能力曲线。
一条观察,为什么会变成整个行业的“规律”
摩尔定律之所以影响深远,不只是因为它描述得准,更因为它改变了全行业的行为。
先是观察产生预测。预测给出了可衡量的目标。接着,产业参与者开始按照这些未来目标来做预算、做路线图、做投资、做分工。设备厂商、晶圆厂、EDA 工具、IP 供应商、芯片公司、系统公司都在朝着同一个方向推进。于是,预测反过来塑造现实,现实又强化了预测。
这形成了一种很强的反馈回路:
预期决定投资,投资创造能力,能力兑现预期,预期再进一步协调更多人行动。
所以摩尔定律在很长一段时间里既像技术趋势,也像产业共识,甚至像一种自我实现的预言。
计算产业的四次浪潮
如果把计算历史放长来看,会发现它并不是一步到位进入“人人都有智能手机”的,而是经历了几次非常清晰的浪潮转移。
第一波:科学与商业
最早的计算机属于国家、科研机构和大型企业。像 Harvard Mark I 这样的机电式计算设备,靠数千个继电器完成计算;ENIAC 则使用了 17,468 个真空管,体积巨大、功耗惊人;EDSAC 已经能达到每秒数百条指令,但仍然使用汞延迟线这类今天看起来相当原始的存储技术。
到了 IBM System/360,晶体管和模块化逻辑开始真正进入主流计算产业。同一个体系结构可以覆盖不同性能与成本档位,这意味着计算机第一次不只是“能不能造出来”,而是开始成为可以面向不同市场分层销售的工业产品。
第二波:走进家庭
微处理器把计算从机房带到了桌面。
Intel 4004 已经具备了“完整 CPU”的雏形:4 位数据、约 2300 个晶体管、可寻址 RAM 和 ROM,虽然性能今天看来微不足道,但它证明了中央处理器可以被压缩到一块芯片里。
真正点燃家用微机革命的是 MOS 6502。它便宜得惊人,价格只有同时代竞品的一小部分,却足够好用,成为 8 位微机时代的核心心脏。再往后,Intel 8086 则奠定了 PC 处理器体系的基础,个人计算机开始成为独立的大市场。
第三波:走向消费电子
当处理器、存储、I/O 能被进一步集成后,“一块芯片就是一台小电脑”的时代到来了。
TI TMS1000 这样的微控制器,把 CPU、ROM、RAM 和 I/O 线路塞进同一颗芯片,真正把“computer on a chip”变成现实。TI TMS5100 则说明,数字信号处理不再只是实验室里的高级概念,而是可以进入消费产品。
ARM1 的出现尤其关键。它是商业上可用的早期 RISC 处理器代表:晶体管数量不算夸张,却在功耗、面积和效率上展现出极强的方向性。后来 PDA 等产品证明,低功耗、高效率、够用而灵活的计算平台,正在孕育新的设备类别。
第四波:无线与融合
移动电话最早只是“能打电话的便携设备”。1984 年的 Motorola DynaTac 通话时间短、重量超过 1 公斤、价格高得离谱。到 1998 年,Nokia 6110 已经轻很多、续航更长,也具备了基础的嵌入式计算能力。到了 2007 年,iPhone 出现,转折点真正到来。
关键不在于它“是不是一台更好的电话”,而在于它本质上是一台带无线调制解调器的微型 PC。它让应用开发者面对的是更通用的计算平台,而不是一套封闭、别扭、只适合嵌入式专家的系统。相比之下,像 Nokia N95 这样当年的旗舰手机,在电话、拍照等很多单项指标上并不差,但它更像一台专用嵌入式设备:开发门槛高、处理器偏弱、用户体验受限。真正赢下时代转换的,不是谁把“手机功能”堆得更多,而是谁把手机变成了计算平台。
从稀缺到丰裕,再回到新的稀缺
技术进步经常会制造一种错觉:某种资源更高效了,于是问题就解决了。现实往往相反。
这就是杰文斯悖论。某种资源使用效率提高后,它的总消耗不一定下降,反而可能上升。处理器更强了,社会对处理器的需求变得更大;服务器更高效了,数据中心反而建得更多;AI 模型更强了,对算力、存储、电力和网络的需求又被整体拉高了一层。
从经济角度看,这往往是正和结果:更多公司赚钱,更多人受益,更多能力被释放。但从生态角度看,情况没有这么轻松。矿产、能源、土地、水资源都要被进一步消耗,污染和气候外部性也会随之扩大。技术让稀缺变成丰裕,丰裕又会催生更大规模的新稀缺。
半导体黄金时代,靠的是 Dennard 缩放的“三重红利”
摩尔定律能够长期成立,并不只是因为光刻越来越精细,还因为曾经存在一个几乎完美的物理配合者:Dennard 缩放。
它的核心意思是,晶体管尺寸按比例缩小后,电压、电流、电容都会一起缩小;单个晶体管功耗下降,延迟变短,频率还能提高。结果就是三个好处同时出现:
一是单位面积能放下更多晶体管。 二是晶体管能跑得更快。 三是在功率密度层面,大致还能维持平衡。
这几乎是半导体工业最幸福的时期。你缩小工艺,不只得到更高密度,还得到更高频率和更好能效。对系统设计者来说,这像是一种“自动奖励机制”。
从 ARM1 到 2012 年的 Cortex-M0,可以直观看到这种长期积累有多惊人。设计实现时间从 6 个月缩短到 32 分钟,缩短了 8192 倍;面积从大约 50 平方毫米降到 0.005 平方毫米,缩小了一万倍;频率从 6MHz 提升到 200MHz;工作电压从 5V 降到 900mV;单位频率功耗效率提升约 8000 倍。过去几十年的进步,并不只是“芯片多了一点晶体管”,而是设计、制造、面积、速度、功耗、工具链同时跃迁。
为什么 2005 年前后,游戏规则突然变了
问题在于,Dennard 缩放不是永恒的。
大约在 2005 年前后,电压不再能按理想比例继续下降。阈值电压、噪声裕量等基本限制越来越难突破,漏电也开始迅速恶化。晶体管即使处于“关闭”状态,也会因为量子效应等原因持续泄漏电流。于是,功率密度不再稳定,发热开始变成真正的墙。
这时候,几个历史上同步增长的指标开始分叉:
晶体管数量仍然继续增长,特征尺寸仍然继续缩小; 原始门级速度还在进步,但没有以前那么顺畅; 处理器频率不再持续飙升,逐渐进入平台期; 单位操作能耗的改进变得越来越难,尤其算上缓存泄漏以后,收益被进一步侵蚀。
这就是为什么后来的芯片明明晶体管越来越多,但大家体感中的“主频暴涨时代”却突然结束了。不是工程师不想把频率继续拉上去,而是热、功耗和能量效率不再允许这么做。
功耗,从次要约束变成头号约束
从那以后,体系结构设计的中心问题变了。
过去的默认思路是:把旧设计搬到新工艺,整体缩小,再顺手加上更多执行单元、缓存或专用硬件,性能通常就会上去。只要面积缩放和功耗缩放还保持同步,这套方法非常有效。
但当功耗不再跟着面积一起优雅下降时,问题立刻出现:你虽然能塞进更多晶体管,却不能同时点亮它们。为了守住固定功耗预算,芯片上越来越大的一部分晶体管只能在特定时刻、特定场景下工作。这就是“暗硅”问题。
暗硅并不意味着这些晶体管没用。它们可以拿来做存储,因为存储阵列平均活动率低;也可以拿来做专用加速器,只在某个负载出现时短暂启用。真正的变化在于,晶体管不再是“有了就能一直用”的自由资源,而是需要被精细调度的受限资源。
后来的 FinFET 的确带来过一轮暂时缓解,但它同时也让可达到的频率提高,而更高频率又会进一步吞掉功耗预算。结果是,问题被延后了一点,却没有被根治。
在摩尔定律时代,晚两年可能就是“做错产品”
MIPS R10K 是一个非常典型的案例。
如果它能按原计划在 1994 年推出,会是一款非常有竞争力的产品。但它最终拖到 1996 年才出货。这两年不是静止的两年。Intel 在这段时间里做出了集成二级缓存的 Pentium Pro,用更多晶体管换来了更强的系统级产品力。于是,原本“很先进”的设计,到真正上市时已经不再站在正确的位置上。
这说明在快速演进的产业里,延期不是简单地损失销售时间,而是会直接改变产品定义。原本合理的目标,可能因为行业能力曲线继续上升,而变成一个不够激进、结构上落后的产品。
技术预测为什么总是既容易错,又容易对
关于技术未来的预测,最常见的错误有两种。
第一种是低估。有人曾认为电话没有必要普及,有人觉得交流电不会被广泛采用,也有人断言原子能遥不可及。这类预测往往把现状当成了边界。
第二种是高估,而且高估得太快。比如把核动力想象成十年内就能进入家用吸尘器,这种预测方向也许不是完全荒谬,但节奏明显脱离了工程和经济现实。
真正高质量的预测,难点常常不在方向,而在时间。比如 20 世纪中期就有人设想过“随身的小型电话”,既能通话也能视频,每个人可能终生拥有一个号码。今天看来,这些想象并不离谱,甚至相当接近现实。但实现它们的并不是当时想象中的技术路径,时间尺度也远比口号式预测复杂得多。
所以,技术预测最难的不是说出一个未来画面,而是判断这个画面何时会变成商品、何时会变成平台、何时会真正进入大众生活。
为什么移动时代尤其残酷:别的东西都在飞,电池没有
从 1990 年代到 2000 年代,磁盘容量、CPU 速度、RAM 容量、无线传输速率都在以很快的速度改善,但电池能量密度几乎没有同步起飞。移动计算之所以难,不是因为处理器不够好,而是因为其他部分进步太快,唯独供能系统跟不上。
这带来一个非常现实的问题:用户期待的系统能力持续上升,但设备的能量预算却高度固定。于是,低功耗架构、动态电源管理、异构计算、专用加速、任务卸载、能量采集等思路,都不再是“锦上添花”,而是生存条件。
摩尔定律没有突然消失,它是变贵了、变窄了、也变得不均匀了
很多人反复宣布摩尔定律终结,连 Gordon Moore 自己都多次预言过它的尽头。但“终结”并不意味着芯片不会继续进步,而是意味着进步的机制变了。
以前的进步更像顺水推舟:更多晶体管、更低成本、更高频率、更好能效常常同时到来。现在的进步更像精打细算:要么从每个晶体管里榨出更多价值,要么付出更高成本,要么依赖更强的系统协同。
这也解释了一个行业里长期存在的“作弊方式”:大家经常用晶体管数量当作成本和领先性的代理指标,但实际上,任何公司都可以通过做更大的芯片、承担更低良率、投入更多资本,来维持一种表面上的“继续扩张”。这并不是摩尔定律最原始的含义,却成了现实竞争中的重要手段。某种意义上说,摩尔定律并不会在物理上突然停住,它更可能先在经济上变得越来越不自然。
而且,进步已经开始表现出明显的不均匀性。
逻辑晶体管仍在推进,但嵌入式存储,尤其是 SRAM,缩放越来越艰难。比特单元尺寸和工艺波动之间存在基础性的冲突,导致存储密度无法像逻辑那样顺畅前进。于是,新的先进工艺节点成本更高了,晶体管数量增加也许还不错,但可用的片上 SRAM 增长没有跟上,CPU 核心和缓存的布局空间反而变得更紧。某些节点上,付出 25% 的额外成本,也许只换来约 30% 的晶体管提升。这已经不是过去那种“更先进就一定更划算”的世界了。
所以,今天谈“一万亿晶体管芯片”之类的目标,并不只是比谁工艺更强,更是在比谁能承担资本开支、谁有足够强的应用场景、谁能把功耗、封装、存储、软件栈和商业模式一起拉通。
计算产业的下半场,拼的是协调能力
回头看这段历史,最值得记住的一点也许是:摩尔定律从来不是单纯的自然规律。它既有物理基础,也有产业组织;既有制造进步,也有资本意志;既关乎晶体管,也关乎产品定义、功耗预算、软件生态和市场时机。
在上半场,行业享受的是缩放带来的自动红利。 在下半场,行业面对的是红利变薄之后的主动设计。
未来的赢家,不一定是拥有最多晶体管的人,而更可能是能把晶体管、功耗、内存、封装、工具链、软件生态和真实需求协调得最好的人。计算不会停止前进,但它前进的方式,已经和过去完全不同了。