AppleSilicon的成本比OpenRouter更高

admin 2026-05-20 06:32:01 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文对比AppleSilicon设备本地运行大语言模型与OpenRouter云服务的成本效益,指出M5MaxMacBookPro硬件成本是主要开销,在最佳情况下本地推理每百万Token成本约0.40美元但仍高于云服务,且云服务推理速度可达本地3-7倍。结论显示对于多数场景云服务更具性价比,但肯定消费级设备运行高性能模型的技术意义。 综合评分: 70 文章分类: 解决方案,技术标准,云安全


cover_image

Apple Silicon 的成本比 OpenRouter 更高

原创

骨哥说事 骨哥说事

骨哥说事

2026年5月18日 17:09 上海

在小说阅读器读本章

去阅读

#

#

防走失:https://gugesay.com/

不想错过任何消息?设置星标↓ ↓ ↓

#

每秒处理的 Token 数和单位成本的表格,用以说明每百万 Token 的总成本。

在高负载下功耗约 50-100 瓦,以 每千瓦时 0.20 美元 的电费计算,M5 MacBook Pro 每小时的电费仅为几分钱。因缩短设备寿命而导致的加速折旧(如果有的话)会比电费更昂贵。以每秒几十个 Token 的速度计算,每百万 Token 的摊销成本约为 1.50 美元。而对于性能相当的模型,OpenRouter 的价格仅为本地运行的三分之一,速度却是其两倍左右。

电力成本

在北弗吉尼亚州,电费账单折合每千瓦时 0.18 美元。让我们四舍五入到 每千瓦时 0.20 美元

根据美国能源信息署(EIA)的数据,2025 年美国居民用电的平均成本约为 每千瓦时 0.1730 美元

当设备功耗在 50-100 瓦 之间且电价为 0.18 美元/千瓦时 时,每小时电费为 0.009 美元 到 0.018 美元,即 每小时 0.02 美元。这意味着每天以 100% 负载运行模型推理的电费仅为 0.48 美分

硬件成本

一台配备 M5 Max 芯片和 64GB 内存的 14 英寸 MacBook Pro,目前在苹果官网的标价为 4299 美元。虽然 128GB 内存版本价格更高,但 64GB 型号足以运行像 Gemma 4 31B 这样的模型,其性能已接近 Anthropic Sonnet 的水平。

从成本分摊的角度考虑,假设这台硬件的寿命为 3 年、5 年或 10 年。那么每年的硬件成本分别为 1433 美元860 美元 和 430 美元

因此,在整个寿命周期内每小时的硬件成本为:

  • 3 年:每小时 $0.16358
  • 5 年:每小时 $0.09815
  • 10 年:每小时 $0.04908

考虑到正常使用情况, 5 年 是一个合理的寿命估计。7 年或 10 年也很有可能。而在始终满载进行推理的极端场景下,3 年 也可能是一个合理的估计。

Token 产出与成本分析

核心问题在于,本地模型每小时能生成多少个 Token。根据 M5 Max 测试,对于像 Gemma4:31B 这样的大型模型,速度大约在 每秒 10 到 40 个 Token 之间。按 每秒 10 个 Token 计算,每小时可生成 36,000 个 Token

结合 3-10 年 的寿命周期和 0.18 美元/千瓦时 的电价,每百万 Token 的成本大约在 1.61 美元到 4.79 美元 之间(低速、短期寿命下的高成本端)。

如果按 每秒 40 个 Token 计算,每小时可生成 144,000 个 Token,这使得每百万 Token 的成本降至 0.40 美元到 1.20 美元 之间。

对于苹果设备而言,硬件成本是主要开销

与云服务对比:OpenRouter

OpenRouter 上 Gemma4 31b 模型的调用成本约为 每百万 Token 0.38-0.50 美元。这意味着在最乐观的情况下(功耗 50 瓦、每秒 40 个 Token、10 年寿命),M5 Max 的本地运行成本才与 OpenRouter 持平。而在最悲观的情况下(功耗 100 瓦、3 年寿命、每秒 10 个 Token),M5 Max 的成本要高出 10 倍。原作者认为,从财务核算角度来看,M5 Max 本地推理每百万 Token 的成本大约是云服务的 3 倍,这可能是一个比较准确的数字。

结论:速度与效率

对于大多数场景来说,推理速度是更关键的因素。本地推理的速度通常比云端推理慢。OpenRouter 上的一些 Gemma 4 服务提供商能提供每秒 60-70 个 Token 的速度,这比目前观察到的 Pro Max 本地速度(约每秒 10-20 个 Token)快了 3-7 倍

对于一个使用工作笔记本电脑的员工而言,其薪资成本将是他们本地生成的 Token 成本的约 1000 倍。在这种情况下,将资金投入到购买像 Anthropic 这样的高性能云服务上显然更有意义。

尽管如此,消费级设备能运行性能接近 Anthropic Sonnet 的模型,这本身仍然是一件非常惊人的事情。

原文:

https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

  • END –

感谢阅读,如果觉得还不错的话,动动手指给个三连吧~


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:骨哥说事 骨哥说事 骨哥说事《Apple Silicon 的成本比 OpenRouter 更高》

评论:0   参与:  0