研究:用诗歌就能让AI说违禁内容,成功率达62%
[焦点] 时间:2026-01-02 15:28:31 来源:白山市某某食品机械售后客服中心 作者:热点 点击:130次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容潜江市某某环保机械设备业务部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功潜江市某某环保机械设备业务部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:探索)
相关内容
- 泽连斯基:乌克兰不会放弃加入北约
- 66岁麦当娜怒怼好莱坞,为梦想传记片而战,拒绝被“小制作”
- 中国男篮合影号码公布:队长胡明轩3号杨瀚森51号 剑指两战全胜
- 字母哥:我觉得利拉德是有史以来最出色的比赛终结者之一
- “涨到可怕了!”有人一觉醒来赚了18万
- 李子柒回归火遍全球:聪明人,都在低谷期改运
- WTT福冈总决赛男单1/8决赛 王楚钦晋级8强
- 库里遭到3人包夹,勇士在最后13秒内两记三分均未投中
- 国台办:反对美国为“台独”分子提供表演舞台
- 窦靖童:妈妈钱多到用不完,但穷苦潦倒的爸爸,却成她如今的心病
- 全队19次失误自己独占6次!追梦:我今天表现得很烂
- 继续因伤缺阵,米体:道格拉斯
- 东部战区演习第2天:将在目标海域空域组织实弹射击
- 厦门这晚:赵丽颖又嫩了,关晓彤又壮了,却不及肉乎乎的陈红吸睛
精彩推荐
- 国家安全机关提示:年终收官,安全红线须警惕
- 远藤航:之前我们利用了主场优势,这次在开局必须格外小心
- 这一夜,王骁保全了金鸡奖的体面,这才是“最难拿的奖”该有水准
- 国内马拉松大争议:夫妻共同参赛,拿大量官方补给,“负重”奔跑
- 委内瑞拉:摧毁8架飞机、4个营地
- 科尔:我们上半场浪费了很多回合 下半场才真正开始比赛
热门点击
- “医”线直击丨肺炎高发期来临 如何远离“会呼吸的痛”? views+
- 中新真探:糖尿病都是吃糖太多导致的吗? views+
- 考研英语长难句|Day124 views+
- 率先登场!空军“八一”飞行表演队上演空中大片 views+
- 售31.58万起 福特烈马墨钻/墨钻大脚越野版12月上旬可提车 views+
- 放假办法修改及2025年部分节假日安排六问 views+
- 卡尔伯格:肩负瑞典乒乓的荣光 views+
- 午评:沪指缩量震荡 全市场超4100只个股下跌 views+
- 天舟八号进行垂直转运,“月壤砖”将首次上天 views+
- 上海XSC波涛汹涌,这些事要提前规划 views+
