科技
设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:科技 > 快讯 >

知道创宇发布“安全+内容”双维智能防护产品大模型盾,最快2分钟极速部署!

知道创宇发布“安全+内容”双维智能防护产品大模型盾,最快2分钟极速部署!
2025-03-16 09:09:01 来源:财讯网

生成式人工智能正加速赋能千行百业,成为培育和发展新质生产力的重要引擎,大模型应用的安全要求也随之提升,其潜在的敏感数据泄露、价值观偏差、错误信息泛滥等风险,正成为悬在行业头顶的“达摩克利斯之剑”。唯有构建与AI技术同频进化的防护体系,才能在创新与安全的平衡中赢得未来。

基于此,3月13日,知道创宇举行产品发布会,正式推出内容风险常态化实时监测与防护的SaaS产品——大模型盾,针对大模型输入输出进行智能监测与高效过滤,构建“风险识别、决策干预、合规增强”全流程内容安全防护体系,确保大模型在合规、安全的框架下运行。

作为国内较早布局大模型安全的企业,自2024年3月以来,知道创宇推出一系列先进大模型安全防护与内容风控方案,涵盖了模型训练、部署、上线、运营的各个阶段,专注于构建大模型内生安全体系。此次发布大模型盾,是筑牢大模型内容安全防护体系的核心组件,更是知道创宇构建大模型全生命周期风险管理机制的重要一环,为大模型的稳健发展提供了更为坚实的支撑。

大模型快速发展 传统防护模式失灵

随着生成式AI技术的迅猛发展,双向交互催生了海量内容,内容安全风险也随之指数级增长。数据泄露和隐私风险层出不穷,AI造谣、AI诈骗等模型滥用问题频频发生,给企业和用户带来了前所未有的挑战。在此背景之下,全球范围内对大模型监管的力度正在不断加强。

大模型内容风险已呈现出诸多新特点:其隐蔽性更强、扩散速度更快、合规与用户体验之间寻求平衡更难等,传统防护方案已显乏力。

一方面,由于大模型的交互特性,内容安全风险一部分来自于用户的恶意输入和诱导。面对AI内容投毒、违规诱导、提问越狱、无限循环漏洞等问题,传统审核系统往往难以有效应对,极易被绕过。且面对海量内容时,误判率随之高企。

另一方面,新型违规内容从出现到大规模扩散的速度空前加快,传统方案难以实时响应。

更为复杂的是,大模型作为新兴技术,过度拦截将导致用户流失,而漏判则可能引发更多风险,企业陷入两难。

为护航大模型安全发展,安全行业内积极探索多种解决方案。但一些方案仍存在局限性,难以全面应对大模型特有的复杂安全挑战。

部分厂商推出的大模型安全检测机制,为“漏洞扫描器+关键词匹配”的机械组合,缺乏对AI交互场景动态风险的深度理解。亦有厂商直接沿用传统硬件WAF,但并未做针对大模型的功能升级,难以捕捉大模型输入输出中的语义风险。此外,部分产品往往是事前或事后的周期性检测,无法做到实时动态检测与防护。

大模型的安全风险已超越传统网络安全范畴,涉及NLP语义理解、内容风控、价值观对齐等多领域能力,这对安全厂商提出了更高的跨领域融合要求。然而,一些传统安全厂商长期聚焦于代码漏洞、网络攻击等技术层防御,缺乏对内容安全领域的深入实践和数据积累,导致其产品在应对大模型内容安全防护时,往往难以达到理想效果。

大模型盾:内容风险实时监测与防护 最快2分钟一键接入

在此背景下,基于17年来在AI+安全大数据的超前投入与持续建设、并凭借12年丰富的互联网内容安全审核经验,以及公司长期奋战在对抗黑灰产的最前线的深厚技术沉淀,知道创宇已将人工智能技术与内容安全深度融合,构建起强大的内容风控能力,由此正式发布大模型内容风险常态化实时监测与防护服务——大模型盾。

大模型盾具备灵活部署、精准防护、立体覆盖、智能优化和风险可视等优势。无需本地硬件投入,最快2分钟一键接入即可使用;依托知道创宇的AI能力+情报大数据优势,大模型盾风险识别精度行业领先,能够帮助企业实时响应政策变化与舆情情况,规避合规风险。

1、海量词库及时更新,智能识别敏感信息

内置海量敏感词库,基于AI大模型构建语义特征图谱,实时监测输入输出内容,精准监测AI内容投毒、违规诱导、提问越狱、无限循环漏洞等风险内容,及时发现潜在风险。与违禁公库实时联动,词库动态同步,保障对新兴舆情与政策风险的敏捷响应。

2、安全策略灵活 智能分级处理

支持不同安全级别的过滤策略,具有监测、替换、拦截等多种处理方式,按业务场景配置差异化处置动作,满足金融、政务等高合规场景需求。支持域名白名单及豁免语义模板配置,降低业务误伤率。

3、智能替换与内容优化 避免过度拦截

对低风险敏感内容生成合规替代表达,保障信息可读性;结合上下文语境进行智能偏向,避免过度拦截。

4、实时掌握内容风险动态

7x24小时持续监控接入服务的网站,将监测的风险数据可视化展示在报表上,包括网站关键词的监测和替换趋势图、Top数据以及关键词详情等,多角度监测网站,做到安全风险看得见、控得住。

5、支持防黑、抗DDos攻击 对恶意攻击进行智能防御

大模型盾接入知道创宇云防御平台,支持针对大模型的常见Web应用威胁防护与DDoS/CC攻击防护等,依托自研的威胁感知智慧引擎,根据攻击特征动态调整防护规则,最大化提升防御效率与响应速度。

目前,知道创宇大模型盾支持常见自研大模型平台、开源大模型私有部署的平台、RAG AI智能体、大模型衍生应用,支持SSE等大模型主流协议,支持标准 OpenAI API 调用形态或其它调用形态。

强化全生命周期防护体系  实现技术联动与安全能力持续升级

大模型盾的发布,标志着公司大模型全生命周期安全防护体系全面升级,通过“内生安全+边界防护”双核驱动的防护理念,形成覆盖大模型开发、训练、应用、运维全流程的闭环安全解决方案,为行业提供智能化解决方案。

凭借多年对AI工具包和开源模型的研究经验,知道创宇已建立权威的大模型内生安全评测基准,知道创宇现已积累100万大模型问答数据集库,1000余人组建的人工智能评测团队,为近百家监管单位提供重要保障支持,同时自2013年起为腾讯、京东、今日头条等领军企业提供内容安全服务,实战经验丰富。

以此为基础,知道创宇此前已推出专业的数据标注与大模型安全评测能力等服务。

最初的训练阶段,知道创宇数据标注服务确保数据合规可用,公司已建立多个数据标注基地,自主研发了多模态AI标注平台,通过高精度数据标注,清洗训练数据中的有害、偏见及隐私内容,从源头减少模型内容安全风险,提升基础安全性能。

知道创宇安全评测服务囊括了内容安全评测与应用安全测试服务,贯穿于模型部署、上线、运营阶段,通过深度剖析模型性能,可以对大模型的准确性、鲁棒性、安全性等多个维度进行全面评估。通过模拟高风险场景,多维度检视模型性能与安全表现,精准定位潜在风险,为模型优化提供关键指引。

在网络边界安全领域,公司同样提前布局,已集成Web应用攻击防护、DDoS防御、云端智能加速等能力,形成大模型应用网络防护矩阵。

由此形成的全生命周期方案并非单一产品的简单叠加,而是通过技术联动,实现安全能力的持续进化。

一方面,与大模型安全评测服务的全面、深度、系统性相互补,大模型盾具有快速与灵活性特征,能够实时阻断恶意指令、有害内容,二者形成动态反馈与能力升级闭环。

基于安全评测发现的模型脆弱性,可反馈至大模型盾,动态更新其规则和策略,增强实时防御能力。同时,大模型盾在运行中积累的数据,如通过监测发现某些输入模式容易导致模型生成有害内容,评测系统可以在后续的测试中加入针对性的测试用例。这种双向闭环机制不仅提升了系统的安全性,还实现了性能的持续迭代优化。

另一方面,大模型盾实时监测与网络边界安全防护方案协同发力,全方位保障模型在实际应用中的安全性与稳定性,为模型的诞生、成长、成熟、应用直至更新迭代的每一个环节,都披上坚不可摧的“安全铠甲”。

关键词:

责任编辑:kj005

文章投诉热线:157 3889 8464  投诉邮箱:7983347 16@qq.com

关键词:

美国普佐特PUZOT心肝宝:为心肝健康加油的全能护卫

2025-03-15 19:40:14美国普佐特PUZOT心肝宝:为心肝健康加油的全能护卫

“星闪——联接智能世界”研讨会顺利召开 听听TA们怎么说

2025-03-15 19:37:24“星闪——联接智能世界”研讨会顺利召开 听听TA们怎么说

浙江团圆口腔医院引领品质315:打造专业种植牙新标杆

2025-03-15 16:14:01浙江团圆口腔医院引领品质315:打造专业种植牙新标杆

315品质见证——台乌品牌:匠心传承,非凡品质

2025-03-15 12:04:40315品质见证——台乌品牌:匠心传承,非凡品质

2025年相亲软件大起底,哪款助你成功脱单?

2025-03-14 18:09:432025年相亲软件大起底,哪款助你成功脱单?

文化产品,出海澳洲投资机会

2025-03-14 17:09:18文化产品,出海澳洲投资机会

相关新闻

最新资讯