文章总结: REDtech盘点2025年度12篇热门技术文章,涵盖自研BinlogServer实现MySQL零丢失、RLHF大模型训练、keylessHTTPS卸载、Rust七层网关ROFF、SOTA语音合成模型FireRedTTS-2、开源多语言OCR模型dots.ocr、通用推理智能体DeepAgent、百亿级向量检索图索引SOGAIC、视频时长预估EGMN、模型蒸馏容量差距法则、开源MoE大模型dots.llm1及数据中心设计实践,展示小红书在数据库、AI、音视频、云原生等方向的前沿落地与顶会成果。 综合评分: 82 文章分类: AI安全,数据安全,云安全,安全建设,安全开发
REDtech·2025 热门技术文章年度盘点|互动有礼
迎接2026的
小红书技术REDtech
2025年12月29日 18:05 北京
2025已接近尾声,REDtech在大家的陪伴下又走过了满载收获的一年。感谢所有技术人的持续深耕与突破探索,感谢你们始终向前,用技术力量塑造更好的世界。
我们整理了今年发表文章中的12篇热门技术分享(以下排名不分先后),期待能在这个承上启下的特别时刻,再次与大家交流碰撞出思想的火花!
【技术落地】
小红书自研Binlog Server守护MySQL数据0丢失
小红书数据库团队提出一种基于Binlog Server的数据一致性解决方案,通过提升半同步复制性能,加速日志传输,在故障时可无侵入现有数据库架构地实现自动补数据,保证数据一致性。
现推出的自研 Binlog Server 与 ORC 高可用方案,经过实践已证明可做到:
1)使用极少的资源(1C1G)即可将复制速度提升至300MB/s+,实现了复制性能翻倍;
2)优化了故障切换效率,按照一致性优先原则使用Binlog Server为新主库补数据,有效降低运维成本和业务风险,实现数据库快速数据恢复。目前该方案已经100%部署于小红书半同步复制集群,在多次切换中为新主库补数据,守护了核心数据库的安全。
阅读全文|小红书自研Binlog Server守护MySQL数据0丢失
从0到1构建RLHF系统–小红书大模型团队的探索与实践
在QCon上海2024大会上,小红书大模型团队分享了自研RLHF系统的设计和优化。
本文介绍了随着LLM的发展,超长文本、多模态、PPO(Proximal Policy Optimization)训练本身的复杂度等带来了巨大的技术挑战,AGI团队通过异构、同构组网架构以及一系列训推一体优化方案,全面超越开源框架,并展示了RLHF之后模型的效果提升。
阅读全文|从0到1构建RLHF系统——小红书大模型团队的探索与实践
小红书自研keyless支持HTTPs卸载
本文系统介绍了小红书基础技术团队自研的 keyless 架构实现,主要涵盖几个方面:Intel QAT 硬件选型与性能调优、Rustls 异步化支持,高性能 keyserver 实现等。
该方案已经承接了小红书自建 IDC 公网接入层流量,在大幅提升 HTTPs 处理能力的同时,降低了服务器资源成本。方案的整体思路和技术实现,对业界有类似 HTTPs 卸载需求的场景,也具备很大的参考意义。
阅读全文|小红书自研keyless支持HTTPs卸载
小红书混合云架构下自用数据中心设计实践与探索
近日,小红书首座自用数据中心,斩获中国数据中心权威协会 CDCC 颁发的 2025年度十大数据优秀项目奖,以及国外数据中心媒体 w.media 评选的Northeast Asia Cloud&Datacenter 年度卓越设计 & 建设奖(Excellence in Data Centre Design and Build)。
这是国内外目前两个影响力最大的数据中心奖项,既是对小红书首次交付自用数据中心的重大肯定,也是小红书基础技术部实用第一、性价比突出、业内领先技术路线理念的体现。
本文梳理了小红书数据中心获得两项行业奖项的实践历程,系统剖析其获得行业认可的核心设计方案与标准化运营体系。
阅读全文|小红书混合云架构下自用数据中心设计实践与探索
【创新突破】
小红书推出自研Rust高性能七层网关ROFF
本文介绍了小红书接入团队自研的高性能七层网关,基于 Rust 语言设计,实现了高性能的负载均衡、TLS卸载、QUIC/HTTP3 等能力。从系统架构、请求处理、模块拓展、TLS硬件卸载等方面介绍了所提出的 ROFF 的新特性,通过对比实验表明与 Nginx 的优势所在。
阅读全文|小红书推出自研Rust高性能七层网关ROFF
行业领先!小红书智创音频技术团队打造SOTA对话生成模型 FireRedTTS-2
小红书音频团队近日发布新一代对话合成模型 FireRedTTS-2。该模型聚焦现有方案的痛点:灵活性差、发音错误多、说话人切换不稳、韵律不自然等问题,通过升级离散语音编码器与文本语音合成模型全面优化合成效果。
在多项主客观测评中,FireRedTTS-2 均达到行业领先水平,为多说话人对话合成提供了更优解决方案。
阅读全文|行业领先!小红书智创音频技术团队打造SOTA对话生成模型 FireRedTTS-2
小红书hi lab开源多语言文档布局解析模型dots.ocr,
1.7B小模型实现SOTA性能
dots.ocr 是一款功能强大、支持多语言的文档解析模型,它在单一的视觉语言模型中统一了布局检测和内容识别,同时能保持良好的阅读顺序。尽管其基础模型是一个17亿参数的“小模型”,但它依然实现了业界领先(SOTA)的性能。
dots.ocr对多语言识别的良好性能弥补了开源社区的空白,不错的检测、识别能力也为多模态和大模型社区提供了宝贵的基础。
阅读全文|小红书hi lab开源多语言文档布局解析模型dots.ocr,1.7B小模型实现SOTA性能
小红书推出通用推理智能体 DeepAgent:工具&任务随心配!
在人工智能的浪潮之巅,大型推理模型已展现出解决复杂难题的非凡潜力。然而,当面对真实世界的挑战时,它们往往因无法灵活使用外部工具集和进行长程、连贯的交互而受限。为了突破这一瓶颈,小红书团队推出了 DeepAgent。这不仅是一个AI模型,更是一个全新的端到端深度推理智能体。它革命性地将自主思考、动态工具查找与任务执行融于一次连贯的推理流程中,为通用 Agentic AI 的实现迈出了坚实的一步。
阅读全文|小红书推出通用推理智能体 DeepAgent:工具&任务随心配!
【顶会成果】
WWW2025 | 小红书向量检索团队提出超大规模向量检索
图索引构建新方法
在 WWW2025 会议上,小红书提出了面向百亿级向量数据库的可扩展过载感知图索引构建系统 SOGAIC。该系统通过自适应重叠划分算法缓解数据不均带来的资源过载问题,并结合负载均衡的任务调度与聚合式分层子图合并策略,实现高效并行构建。实验显示,SOGAIC 在多个真实数据集上平均减少 47.3% 的构建时间,具备良好的扩展性,已部署于小红书在线向量检索引擎,支撑百亿级向量的日更新需求。
阅读全文|WWW2025 | 小红书向量检索团队提出超大规模向量检索图索引构建新方法
RecSys 2025 | 小红书推荐团队提出视频时长预估新方法:EGMN
小红书推荐算法团队提出基于指数-高斯先验分布的视频时长预估新方法EGMN,入选 RecSys 2025 Main Track,并获得Best Paper Nomination。
阅读全文|RecSys 2025 | 小红书推荐团队提出视频时长预估新方法:EGMN
ACL 2025 杰出论文 |小红书 AI 搜索和北理工提出“容量差距法则”
ACL 2025大会上,小红书 AI 搜索团队与北京理工大学宋大为教授团队的合作论文 《Towards the Law of Capacity Gap in Distilling Language Models》 荣获杰出论文奖(Outstanding Paper Award)。该研究首次提出“容量差距法则(Law of Capacity Gap)”,揭示了在语言模型蒸馏中,学生模型与教师模型的最优规模关系呈线性规律(约为 2.5 倍),大幅降低了寻找最佳教师模型的算力成本,并成功将蒸馏效率与性能推向帕累托前沿。
阅读全文|ACL 2025 杰出论文 | 小红书 AI 搜索和北理工提出“容量差距法则”
【开源协同】
小红书hi lab首次开源文本大模型
14个checkpoint覆盖Pretrain与Instruct阶段
dots.llm1 是一个大规模的 Mixture of Experts (MoE)语言模型,在总共 1420 亿参数中激活 140 亿参数,借助精心设计且高效的数据处理流程,dots.llm1 在训练 11.2T token 高质量数据后,达到了可与 Qwen2.5-72B 相媲美的性能。
为促进大模型社区的研究工作,hi lab团队开源了Pretrain阶段每经过1T token的中间训练检查点和Instruct模型,为研究大语言模型的学习动态提供了宝贵的基础。
阅读全文|小红书hi lab首次开源文本大模型,14个checkpoint覆盖Pretrain与Instruct阶段
【技术交流】
Hugging Face创始人 x 小红书技术副总裁:
关于开源、AI与技术人成长
今年的1024程序员节,小红书@REDacademy和@科技薯办了一场直播。小红书技术副总裁凯奇、小红书语音模型技术负责人风龙,携手Hugging Face联合创始人Thomas Wolf,以AMA(Ask Me Anything)的形式进行了一场关于技术、AI与未来的深度对谈。对话围绕三大核心观点展开:
- AI Coding正成为基础能力;
- 开源是技术加速发展的核心引擎;
- 实现有「活人感」的AGI路径清晰但仍需攻克诸多难题。
阅读全文|Hugging Face创始人 x 小红书技术副总裁:关于开源、AI与技术人成长
精彩未完待续
2026,REDtech将继续与你同行
即刻关注小红书REDtech,实时锁定小红书技术最新动态!
**
添加小助手,了解更多内容
微信号 / REDtech01
**
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:小红书技术REDtech 迎接2026的《REDtech·2025 热门技术文章年度盘点|互动有礼》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







评论