文章总结: 戴国浩指出大模型时代核心在于提升推理效率,即单位能耗产出的Token智力水平。他强调需通过算法设计、优化、系统软件、硬件架构及芯片集成五层的软硬件协同突破瓶颈,而非单点优化。此外,推动产学研深度融合以打通模型与芯片闭环,是技术真正落地产业并转化为生产力的关键。 综合评分: 65 文章分类: AI安全,软文广告
T-Tech技术回放 | 戴国浩解读:大模型推理效率的核心博弈
Z计划支持大模型创业
2026年1月14日 22:58 陕西
以下文章来源于T-ONE创新中心 ,作者邀请你学习的
T-ONE创新中心 .
T-ONE,源自清华,链接星连。不止做孵化器,而是让科研、产业、资本真正闭环。专注早期投资与创业陪伴,欢迎投递商业计划书至[email protected]
T-Tech技术回放
上周四,T-Tech技术直播迎来了第一场重磅分享。
我们邀请了上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩老师,围绕 《大模型的软硬件协同与产学研协同》 这一主题,从推理效率、技术演进到创新如何真正走向产业落地,进行了系统而深入的分享。
本篇将对戴老师的核心观点与技术脉络进行整理与总结,帮助大家快速把握其中的关键逻辑。点击「阅读全文」,即可查看完整逐字稿并回看直播内容。
01 一个核心技术问题:
大模型时代,推理效率成为核心问题
过去,评价 AI 能力的标准,更多集中在“算得多快”“算得多准”;而在大模型时代,这一标准正在发生变化。Token 不只是文本单位,是如今通用基础模型、基座模型串联物理世界和数字世界的重要一环。
今天,我们真正关心的,是:如何提升一度电产生的Token质量,即它的智力水平。因此,推理不再是成本项,而是生产要素。
随着模型能力从对话走向推理、从解题走向 Agent,推理链条越来越长,消耗也越来越高。越复杂的任务,越考验推理效率。推理效率,直接决定 AI 是否“用得起、用得久、用得广”。
也正是在这个意义上,“软硬件协同”不再是工程优化,而成为决定大模型未来的核心技术命题。
02 一条技术演进主线:
推理效率是软硬件协同进化的路径
提升推理效率,绝不是某一个技术点的单点突破,而是一条贯穿模型、系统与硬件的协同演进路径。以DeepSeek为例,它改变了模型训练的方法,从传统的算法修改让硬件被动支持系统变为面向最大化硬件效率,由系统驱动模型修改得到最佳性能,这也是传统非软硬件协同和软硬件协同最大的区别。
这五个层次共同构成了软硬件协同的完整闭环,真正决定了大模型推理能否从“能跑”走向“高效可用”:
算法设计层:从模型诞生之初就面向真实硬件与资源约束进行结构设计,减少“先做大、再压缩”的无效成本。
算法优化层:在模型结构既定的前提下,通过减少冗余计算和引入早退出等机制,让推理过程更“聪明”而不是更“用力”。
系统软件层:通过调度、并行、通信与算子级优化,最大化释放已有算力,利用异步的方法减少等待和同步带来的隐性损耗。
硬件架构层:围绕基座模型的特定计算特征来进行推理上的硬件定制化加速(如稀疏计算),用更少的计算完成同样的任务。
芯片集成层:通过先进封装和高带宽集成,降低数据搬运成本,从物理层面提升整体能效上限。
03 一条产学研协同主线:
技术如何从论文,走向产业?
如果说软硬件协同解决的是“技术怎么跑得更快”,那么产学研协同解决的是“技术如何真正被用起来”。
无问芯穹始终关注如何通过软硬协同的方式去为大模型部署落地提供一个更高效的支撑,如何在大模型时代将模型与芯片之间的闭环打通。
真正有效的技术创新并不是单向的科研输出,而是一个从学术创新出发、沿创新链走向产业落地,并再由产业实践反向塑造科研方向的闭环过程。
软件与硬件的协同,本质上也是学术体系与产业体系的深度融合。在人工智能加速演进的背景下,希望能够支撑一类复合型人才的培养——既理解学术前沿,又熟悉产业约束,既能做软件系统,也能理解硬件逻辑,从而让创新真正转化为可持续的生产力。
扫描二维码
查看戴国浩分享的直播回放
你还想听谁来讲技术?
评论区告诉我们
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:Z计划支持大模型创业 《T-Tech技术回放 | 戴国浩解读:大模型推理效率的核心博弈》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论