文章总结: 网易易盾出席AIIA智能体应用分级安全合规研讨会,分享了智能体内容安全从合规防御到主动免疫的实践经验。针对内容违规、算法偏见等风险,易盾参与制定相关技术规范,此前已参编生成式AI服务安全国标,致力于推动构建安全可信的AI生态。 综合评分: 62 文章分类: 软文广告,AI安全,技术标准,安全建设
网易易盾出席智能体应用分级安全要求研讨会,共筑AI安全新生态
网易易盾
2026年1月27日 18:26 浙江
智能体正从执行工具向自主决策系统跨越,成为AI规模化落地的核心载体,但内容违规、算法偏见、权限滥用、责任归属模糊等风险也随之凸显,规范其行为安全与合规边界,已是行业健康发展的必答题。
近日,中国人工智能产业发展联盟(AIIA)安全治理委员会组织的 “智能体应用行为分级安全合规要求” 技术规范研讨会顺利召开,汇聚了来自中国联通、中国电信、网易易盾、华为、阿里、浪潮、美团、OPPO、荣耀、vivo、小米等企业的众多专家与行业代表,共同探讨智能体应用的安全合规发展之路。
网易智企旗下业务-网易易盾作为数字内容风控行业的领军者,受邀出席本次研讨会,网易易盾国央企行业负责人朱文涛参会,并分享了网易易盾在智能体内容安全领域的实践经验与技术成果。
以技术创新,构建合规防线
随着智能体技术的迅猛发展,其应用场景不断拓展,但同时也带来了诸多安全与合规挑战,如隐私泄露、算法偏见、内容违规等问题,这些问题不仅影响用户体验,还可能引发法律风险和社会争议。
朱文涛在研讨会上,以“智能体内容安全:从合规防御到主动免疫”角度切入,介绍了网易易盾在智能体内容安全领域的实践经验与技术成果。他指出,智能体内容安全面临着诸多挑战,如隐晦红线对抗、审核标准尺度难把握、价值观内容检测复杂、多轮交互分析难等,这些挑战需要行业共同努力来解决。
参与标准制定,助力规范发展
网易易盾一直以来积极参与行业标准的制定工作,此前已参编国家标准:GB/T 45654-2025《网络安全技术 生成式人工智能服务安全基本要求》,为生成式人工智能服务安全提供了治理框架指引。本次研讨会,网易易盾再次为智能体应用行为分级安全合规要求的技术规范贡献力量,与业内专家共同探讨智能体应用的安全合规标准,推动行业规范发展。
智能体应用的安全合规发展是大模型技术发展与应用中的重要课题,需要政府、企业、科研机构等多方共同努力。网易易盾作为数字内容风控行业的领军者,将始终以技术创新为核心,以行业标准为引领,为智能体应用的安全合规发展贡献力量,共同构建安全、可信、可持续的AI生态。
关于我们
免费下载干货资料
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:网易易盾 《网易易盾出席智能体应用分级安全要求研讨会,共筑AI安全新生态》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论