ThinkLab

过去几十年里，人们几乎默认计算机会一年比一年更快、更小、更便宜。这个直觉并不是凭空来的。半导体、架构、制造、软件和市场在很长一段时间里确实一起推动了指数级进步。但如果把这段历史看得更仔细一点，就会发现，计算产业从来不是一条“技术自然进步”的直线，而是一条由工程、商业、能源、生态和预期共同塑造的曲线。

理解这条曲线，才能真正看懂摩尔定律的意义，也才能理解为什么今天的芯片越来越强，却也越来越贵、越来越难做。

计算越强，生产率为什么不一定立刻上升

很多人会下意识地认为，技术更先进，生产率就一定更高。现实没有这么简单。

自动化确实能放大效率，但前提是原本的流程已经高效。如果流程本身低效，自动化常常只是把低效更牢固地固化下来。信息技术历史上长期存在一个著名现象：企业在计算机和信息系统上投入越多，短期内员工生产率反而未必上升，甚至可能下降。计算机时代似乎无处不在，但它对生产率的提升并不会自动、即时地体现在统计数字里。

这并不意味着计算技术没价值，而是说明技术必须嵌入正确的组织方式、产品形态和使用场景，才能真正转化为经济收益。

摩尔定律真正说的，不只是“晶体管翻倍”

摩尔定律最初并不是一句模糊的口号，而是一个非常具体的工程观察：在最低单位成本附近，集成电路上可容纳的元件数量会持续快速增长。最早的估计接近每年 1.8 倍，后来调整为大约每年 1.5 倍。换句话说，不只是“能塞下更多晶体管”，而是“在合适的成本点上，能以越来越划算的方式塞下更多晶体管”。

这件事的厉害之处在于，它直接改变了芯片设计的方法。

假设一款处理器需要三年研发，再卖三年，中间还有一次改版机会，那么设计团队面对的就不是“今天能做什么”，而是“产品上市时世界会变成什么样”。预算该瞄准今天的工艺，还是三到五年后的工艺？设计该保守，还是激进？项目一旦延期，原本正确的产品定义会不会在市场上瞬间过时？

在摩尔定律有效的年代，这些问题不是边缘问题，而是芯片行业最核心的战略问题。晚两年，不只是晚两年，而是错过整整一代能力曲线。

一条观察，为什么会变成整个行业的“规律”

摩尔定律之所以影响深远，不只是因为它描述得准，更因为它改变了全行业的行为。

先是观察产生预测。预测给出了可衡量的目标。接着，产业参与者开始按照这些未来目标来做预算、做路线图、做投资、做分工。设备厂商、晶圆厂、EDA 工具、IP 供应商、芯片公司、系统公司都在朝着同一个方向推进。于是，预测反过来塑造现实，现实又强化了预测。

这形成了一种很强的反馈回路：

预期决定投资，投资创造能力，能力兑现预期，预期再进一步协调更多人行动。

所以摩尔定律在很长一段时间里既像技术趋势，也像产业共识，甚至像一种自我实现的预言。

计算产业的四次浪潮

如果把计算历史放长来看，会发现它并不是一步到位进入“人人都有智能手机”的，而是经历了几次非常清晰的浪潮转移。

第一波：科学与商业

最早的计算机属于国家、科研机构和大型企业。像 Harvard Mark I 这样的机电式计算设备，靠数千个继电器完成计算；ENIAC 则使用了 17,468 个真空管，体积巨大、功耗惊人；EDSAC 已经能达到每秒数百条指令，但仍然使用汞延迟线这类今天看起来相当原始的存储技术。

到了 IBM System/360，晶体管和模块化逻辑开始真正进入主流计算产业。同一个体系结构可以覆盖不同性能与成本档位，这意味着计算机第一次不只是“能不能造出来”，而是开始成为可以面向不同市场分层销售的工业产品。

第二波：走进家庭

微处理器把计算从机房带到了桌面。

Intel 4004 已经具备了“完整 CPU”的雏形：4 位数据、约 2300 个晶体管、可寻址 RAM 和 ROM，虽然性能今天看来微不足道，但它证明了中央处理器可以被压缩到一块芯片里。

真正点燃家用微机革命的是 MOS 6502。它便宜得惊人，价格只有同时代竞品的一小部分，却足够好用，成为 8 位微机时代的核心心脏。再往后，Intel 8086 则奠定了 PC 处理器体系的基础，个人计算机开始成为独立的大市场。

第三波：走向消费电子

当处理器、存储、I/O 能被进一步集成后，“一块芯片就是一台小电脑”的时代到来了。

TI TMS1000 这样的微控制器，把 CPU、ROM、RAM 和 I/O 线路塞进同一颗芯片，真正把“computer on a chip”变成现实。TI TMS5100 则说明，数字信号处理不再只是实验室里的高级概念，而是可以进入消费产品。

ARM1 的出现尤其关键。它是商业上可用的早期 RISC 处理器代表：晶体管数量不算夸张，却在功耗、面积和效率上展现出极强的方向性。后来 PDA 等产品证明，低功耗、高效率、够用而灵活的计算平台，正在孕育新的设备类别。

第四波：无线与融合

移动电话最早只是“能打电话的便携设备”。1984 年的 Motorola DynaTac 通话时间短、重量超过 1 公斤、价格高得离谱。到 1998 年，Nokia 6110 已经轻很多、续航更长，也具备了基础的嵌入式计算能力。到了 2007 年，iPhone 出现，转折点真正到来。

关键不在于它“是不是一台更好的电话”，而在于它本质上是一台带无线调制解调器的微型 PC。它让应用开发者面对的是更通用的计算平台，而不是一套封闭、别扭、只适合嵌入式专家的系统。相比之下，像 Nokia N95 这样当年的旗舰手机，在电话、拍照等很多单项指标上并不差，但它更像一台专用嵌入式设备：开发门槛高、处理器偏弱、用户体验受限。真正赢下时代转换的，不是谁把“手机功能”堆得更多，而是谁把手机变成了计算平台。

从稀缺到丰裕，再回到新的稀缺

技术进步经常会制造一种错觉：某种资源更高效了，于是问题就解决了。现实往往相反。

这就是杰文斯悖论。某种资源使用效率提高后，它的总消耗不一定下降，反而可能上升。处理器更强了，社会对处理器的需求变得更大；服务器更高效了，数据中心反而建得更多；AI 模型更强了，对算力、存储、电力和网络的需求又被整体拉高了一层。

从经济角度看，这往往是正和结果：更多公司赚钱，更多人受益，更多能力被释放。但从生态角度看，情况没有这么轻松。矿产、能源、土地、水资源都要被进一步消耗，污染和气候外部性也会随之扩大。技术让稀缺变成丰裕，丰裕又会催生更大规模的新稀缺。

半导体黄金时代，靠的是 Dennard 缩放的“三重红利”

摩尔定律能够长期成立，并不只是因为光刻越来越精细，还因为曾经存在一个几乎完美的物理配合者：Dennard 缩放。

它的核心意思是，晶体管尺寸按比例缩小后，电压、电流、电容都会一起缩小；单个晶体管功耗下降，延迟变短，频率还能提高。结果就是三个好处同时出现：

一是单位面积能放下更多晶体管。二是晶体管能跑得更快。三是在功率密度层面，大致还能维持平衡。

这几乎是半导体工业最幸福的时期。你缩小工艺，不只得到更高密度，还得到更高频率和更好能效。对系统设计者来说，这像是一种“自动奖励机制”。

从 ARM1 到 2012 年的 Cortex-M0，可以直观看到这种长期积累有多惊人。设计实现时间从 6 个月缩短到 32 分钟，缩短了 8192 倍；面积从大约 50 平方毫米降到 0.005 平方毫米，缩小了一万倍；频率从 6MHz 提升到 200MHz；工作电压从 5V 降到 900mV；单位频率功耗效率提升约 8000 倍。过去几十年的进步，并不只是“芯片多了一点晶体管”，而是设计、制造、面积、速度、功耗、工具链同时跃迁。

为什么 2005 年前后，游戏规则突然变了

问题在于，Dennard 缩放不是永恒的。

大约在 2005 年前后，电压不再能按理想比例继续下降。阈值电压、噪声裕量等基本限制越来越难突破，漏电也开始迅速恶化。晶体管即使处于“关闭”状态，也会因为量子效应等原因持续泄漏电流。于是，功率密度不再稳定，发热开始变成真正的墙。

这时候，几个历史上同步增长的指标开始分叉：

晶体管数量仍然继续增长，特征尺寸仍然继续缩小；原始门级速度还在进步，但没有以前那么顺畅；处理器频率不再持续飙升，逐渐进入平台期；单位操作能耗的改进变得越来越难，尤其算上缓存泄漏以后，收益被进一步侵蚀。

这就是为什么后来的芯片明明晶体管越来越多，但大家体感中的“主频暴涨时代”却突然结束了。不是工程师不想把频率继续拉上去，而是热、功耗和能量效率不再允许这么做。

功耗，从次要约束变成头号约束

从那以后，体系结构设计的中心问题变了。

过去的默认思路是：把旧设计搬到新工艺，整体缩小，再顺手加上更多执行单元、缓存或专用硬件，性能通常就会上去。只要面积缩放和功耗缩放还保持同步，这套方法非常有效。

但当功耗不再跟着面积一起优雅下降时，问题立刻出现：你虽然能塞进更多晶体管，却不能同时点亮它们。为了守住固定功耗预算，芯片上越来越大的一部分晶体管只能在特定时刻、特定场景下工作。这就是“暗硅”问题。

暗硅并不意味着这些晶体管没用。它们可以拿来做存储，因为存储阵列平均活动率低；也可以拿来做专用加速器，只在某个负载出现时短暂启用。真正的变化在于，晶体管不再是“有了就能一直用”的自由资源，而是需要被精细调度的受限资源。

后来的 FinFET 的确带来过一轮暂时缓解，但它同时也让可达到的频率提高，而更高频率又会进一步吞掉功耗预算。结果是，问题被延后了一点，却没有被根治。

在摩尔定律时代，晚两年可能就是“做错产品”

MIPS R10K 是一个非常典型的案例。

如果它能按原计划在 1994 年推出，会是一款非常有竞争力的产品。但它最终拖到 1996 年才出货。这两年不是静止的两年。Intel 在这段时间里做出了集成二级缓存的 Pentium Pro，用更多晶体管换来了更强的系统级产品力。于是，原本“很先进”的设计，到真正上市时已经不再站在正确的位置上。

这说明在快速演进的产业里，延期不是简单地损失销售时间，而是会直接改变产品定义。原本合理的目标，可能因为行业能力曲线继续上升，而变成一个不够激进、结构上落后的产品。

技术预测为什么总是既容易错，又容易对

关于技术未来的预测，最常见的错误有两种。

第一种是低估。有人曾认为电话没有必要普及，有人觉得交流电不会被广泛采用，也有人断言原子能遥不可及。这类预测往往把现状当成了边界。

第二种是高估，而且高估得太快。比如把核动力想象成十年内就能进入家用吸尘器，这种预测方向也许不是完全荒谬，但节奏明显脱离了工程和经济现实。

真正高质量的预测，难点常常不在方向，而在时间。比如 20 世纪中期就有人设想过“随身的小型电话”，既能通话也能视频，每个人可能终生拥有一个号码。今天看来，这些想象并不离谱，甚至相当接近现实。但实现它们的并不是当时想象中的技术路径，时间尺度也远比口号式预测复杂得多。

所以，技术预测最难的不是说出一个未来画面，而是判断这个画面何时会变成商品、何时会变成平台、何时会真正进入大众生活。

为什么移动时代尤其残酷：别的东西都在飞，电池没有

从 1990 年代到 2000 年代，磁盘容量、CPU 速度、RAM 容量、无线传输速率都在以很快的速度改善，但电池能量密度几乎没有同步起飞。移动计算之所以难，不是因为处理器不够好，而是因为其他部分进步太快，唯独供能系统跟不上。

这带来一个非常现实的问题：用户期待的系统能力持续上升，但设备的能量预算却高度固定。于是，低功耗架构、动态电源管理、异构计算、专用加速、任务卸载、能量采集等思路，都不再是“锦上添花”，而是生存条件。

摩尔定律没有突然消失，它是变贵了、变窄了、也变得不均匀了

很多人反复宣布摩尔定律终结，连 Gordon Moore 自己都多次预言过它的尽头。但“终结”并不意味着芯片不会继续进步，而是意味着进步的机制变了。

以前的进步更像顺水推舟：更多晶体管、更低成本、更高频率、更好能效常常同时到来。现在的进步更像精打细算：要么从每个晶体管里榨出更多价值，要么付出更高成本，要么依赖更强的系统协同。

这也解释了一个行业里长期存在的“作弊方式”：大家经常用晶体管数量当作成本和领先性的代理指标，但实际上，任何公司都可以通过做更大的芯片、承担更低良率、投入更多资本，来维持一种表面上的“继续扩张”。这并不是摩尔定律最原始的含义，却成了现实竞争中的重要手段。某种意义上说，摩尔定律并不会在物理上突然停住，它更可能先在经济上变得越来越不自然。

而且，进步已经开始表现出明显的不均匀性。

逻辑晶体管仍在推进，但嵌入式存储，尤其是 SRAM，缩放越来越艰难。比特单元尺寸和工艺波动之间存在基础性的冲突，导致存储密度无法像逻辑那样顺畅前进。于是，新的先进工艺节点成本更高了，晶体管数量增加也许还不错，但可用的片上 SRAM 增长没有跟上，CPU 核心和缓存的布局空间反而变得更紧。某些节点上，付出 25% 的额外成本，也许只换来约 30% 的晶体管提升。这已经不是过去那种“更先进就一定更划算”的世界了。

所以，今天谈“一万亿晶体管芯片”之类的目标，并不只是比谁工艺更强，更是在比谁能承担资本开支、谁有足够强的应用场景、谁能把功耗、封装、存储、软件栈和商业模式一起拉通。

计算产业的下半场，拼的是协调能力

回头看这段历史，最值得记住的一点也许是：摩尔定律从来不是单纯的自然规律。它既有物理基础，也有产业组织；既有制造进步，也有资本意志；既关乎晶体管，也关乎产品定义、功耗预算、软件生态和市场时机。

在上半场，行业享受的是缩放带来的自动红利。在下半场，行业面对的是红利变薄之后的主动设计。

未来的赢家，不一定是拥有最多晶体管的人，而更可能是能把晶体管、功耗、内存、封装、工具链、软件生态和真实需求协调得最好的人。计算不会停止前进，但它前进的方式，已经和过去完全不同了。

高级计算机架构（一）：当摩尔定律不再“自动奏效”：计算产业如何从更快更便宜走到更贵更难