英伟达推出NeMo Guardrails AI安全套件,防范大模型“越狱”

fjmyhfvclm2025-01-19  6

英伟达近日宣布推出名为“NIM”的AI护栏服务,现已以NeMo Guardrails套件的形式提供。该服务旨在为大语言模型(LLM)添加一系列护栏规则,防止用户通过提示词“越狱”大模型,从而避免生成不符合预期的内容。

NeMo Guardrails基于英伟达的Aegis内容安全数据集训练而成,该数据集包含3.5万个标注样本,并已在Hugging Face上公开。这套AI护栏服务不仅体积小、效率高,还能在多种场合中流畅运行。企业可以直接将其嵌入AI模型开发中,提升医疗、汽车、制造业等领域AI部署的安全性。

此外,英伟达还发布了Garak漏洞扫描工具,用于检测模型安全性,防止输出幻觉内容或泄露企业内部机密信息。这一系列举措将有效改善AI应用的安全性和可靠性。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

转载请注明原文地址:https://www.gamev918.cn/tech/1301335.html