作家:赵雨荷
起首:硬AI
英伟达周四推出用于加快生成式AI模子的部署的容器化微就业Nvidia Inference Microservices(NIM),但愿匡助企业提妙手工智能代理的信任、安全和可靠性。
英伟达在一篇博客中暗示,东说念主工智能代理是一项正在速即发展的期间,正缓缓改变东说念主们与狡计机互动的花样,但也伴跟着诸多要害问题。智能化 AI(Agentic AI)有望窜改常识责任者的任求实行花样,以及客户与品牌“对话”的花样,但其背后的大型谈话模子仍可能出现不良反应,以至在坏心用户试图恣虐督察时激发安全问题。
英伟达暗示,周四发布的本体是基于其为建造者提供的保护框架NeMo Guardrails的彭胀,旨在提高生成式东说念主工智能应用的安全性、精准性和可彭胀性。NeMo Guardrails是英伟达NeMo平台的一部分,用于照顾、定制和保护东说念主工智能,匡助建造者在大型谈话模子(LLM)应用中集成并照顾AI督察模范。咫尺Amdocs、Cerence AI和Lowe’s正在使用NeMo Guardrails来保护 AI 应用。
英伟达发布的NIM共有三种,差别涵盖主题适度、本体安全和逃狱保护。该公司暗示,这些微就业是进程高度优化的袖珍轻量级AI模子,可通过调控大型模子的反应普及应用性能。
英伟达企业AI模子、软件与就业副总裁Kari Briski暗示。
“其中一项用于调控本体安全的新微就业,是基于Aegis本体安全数据集锤真金不怕火的。这是同类数据谋划质料最高、由东说念主工标注的数据源之一。”
Aegis本体安全数据集由英伟达推出,包括跳跃35,000个由东说念主工标注的样本,用于检测AI安全问题和试图绕过系统铁心的逃狱行径。该数据集将在本年晚些时候于Hugging Face上公建造布。
举例,用于主题适度的NIM可注目AI代理“过于健谈”或偏离其正本的任务谋划,确保其保握在既定主题内。英伟达暗示,与AI聊天机器东说念主进行的对话时辰越长,它越容易健忘对话的初志,从而让话题偏离轨说念,近似于东说念主类对话可能的闲谈。天然东说念主类不错罗致这种情况,但关于聊天机器东说念主,尤其是品牌AI代理,偏离主题可能导致评论到名东说念主或竞争居品,这对品牌不利。
Briski暗示,
“像NeMo Guardrails系列中的袖珍谈话模子,具有较低的延长,专为资源受限或散布式环境中的高效运行而遐想,这使它们畸形得当在医疗、汽车、制造等行业的病院或仓库等场景中彭胀AI应用。”
此外,NIM允许建造者以最小的附加延长沟通多个督察模范。英伟达暗示,这对大无数生成式AI应用至关穷苦,因为用户不可爱永劫辰恭候,举例看到三点能干或转圈加载动画后才出现文本或语音。
英伟达暗示,NIM微就业以及用于轨说念编排的NeMo Guardrails和NVIDIA Garak用具包,咫尺照旧面向建造者和企业灵通使用。建造者不错通过关联教程初始将AI督察模范集成到客户就业的AI代理中,欺诈NeMo Guardrails构建安全的AI应用。
风险教唆及免责条件 市集有风险,投资需严慎。本文不组成个东说念主投资提议,也未计划到个别用户独特的投资谋划、财务气象或需要。用户应试虑本文中的任何看法、不雅点或论断是否得当其特定气象。据此投资,包袱自夸。