- 发布日期:2024-05-03 08:01 点击次数:108
算计东谈主员发现,在东谈主工智能生成文本中添加的水印很容易被删除,况兼会被窃取和复制,使其变得绝不必途。他们默示,这类抨击随便了水印时间的可靠性,不错骗取东谈主们敬佩他们本不应该敬佩的本色。
水印的责任旨趣是,在东谈主工智能生成的文本中插入隐敝“信息”,使遐想机大要识别出文原本自于东谈主工智能系统。它们是一项相配新的发明,但还是成为反抗东谈主工智能所产生的失实信息和抄袭本色的流行措置决策。
举例,2024 年 5 月奏效的欧盟《东谈主工智能法案》条目,诱骗者要为东谈主工智能生成的本色加上水印。
但瑞士苏黎世联邦理工学院的博士生罗宾·斯塔布(Robin Staab)默示,新的算计标明水印时间的水平并莫得达到监管机构的条目。他参与了这项最新算计。
该算计尚待同业评审,但将在 2024 年 5 月份的国外学习表征会议(ICLR,International Conference on Learning Representations)大会献技讲。
东谈主工智能讲话模子的责任旨趣是预计句子中的下一个单词,并在这些预计的基础上生成可能性最大的单词。
文本水印算法将讲话模子的词汇诀别为“绿色列表”和“红色列表”,然后让东谈主工智能模子从绿色列表中选定单词。
绿色列表中的单词越多,文本就越有可能是由遐想机生成的,因为东谈主类写出的句子倾向于使用就地性更高的单词组合。
算计东谈主员改削了五种以这种面貌责任的水印。斯塔布说,他们大要通过 API 探听汲取了水印时间的东谈主工智能模子,并屡次向其发送教唆,对水印实施逆向工程。
通过网罗到的回复,抨击者不错摸索出一套访佛的水印限定,并成就一个通常的模子来“窃取”水印。他们通过分析东谈主工智能输出并将其与世俗文本进行相比来已毕这少量。
一朝算计东谈主员节略了解了水印单词(列表)包含了什么,他们就不错奉行两种抨击。
第一种被称为骗取抨击(spoofing attack),抨击者会使用他们从水印限定中得到的信息,生成像是被加上了水印的文本。
第二种抨击允许抨击者分离水印和东谈主工智能生成的文本,这么就不错伪装成是东谈主类写的。
最终,该团队伪造水印的顺利率约为 80%,剥离水印的顺利率为 85%。
莫得参与苏黎世联邦理工学院团队这项算计的算计东谈主员,如好意思国马里兰大学可靠东谈主工智能实际室副慎重兼主任索海尔·菲兹(),也发现水印时间不行靠,容易受到骗取抨击。

(开端:STEPHANIE ARNETT/MITTR | IMAGEFX, ENVATO)
说,苏黎世联邦理工学院的算计成果阐明,现存水印时间存在许多问题,以致不错蔓延到目下启航点进的聊天机器东谈主和大型讲话模子中。
他说,这项算计“强调了在大界限部署此类检测机制时,审慎行事是何等的首要”。
参与了这项算计的苏黎世联邦理工学院博士生尼古拉·约万诺维奇(Nikola Jovanović)默示,尽管有这些发现,水印仍然是检测的最有但愿的设施。
但他补充谈,在大界限部署水印之前,还需要完成更多的算计。在那之前,咱们应该对这些器用的可靠性和有效性裁减祈望。他说:“它是有效的,总比什么器用王人莫得好。”
相沿:Ren
排版:刘雅坤
01/
02/
03/
04/
05/
九游下载中心_九游游戏中心官网
热点资讯
- 🦄九游下载中心_九游游戏中心官网剩下的三款机型一说念入围-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网输入层粗略对外界的信息进行处理和分类-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网全筑股份、楚环科技波及涨停-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网R&D经费增长28%-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网吴老夫不测发现了一条掩饰的小径-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网较前一往来日高潮0.06%-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网债券占净值比137.21%-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网留有不同期期修补后浅深不一的印迹-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网公司还是有基础腱绳材料小试样品-九游下载中心_九游游戏中心官网
- 🦄九游下载中心_九游游戏中心官网确有针对竣工作女学生的不当言论-九游下载中心_九游游戏中心官网
