IT 之家 11 月 24 日音讯,一项对于东说念主工智能(AI)的最新接头标明,谣言语模子(LLM)在瓦解双关语方面有所欠缺。

来自英国和意大利多所高校的众人团队近期开展了一项接头,重心磨真金不怕火谣言语模子对双关语的瓦解才调,按捺发现其施展令东说念主失望。该团队由南威尔士卡迪夫大学(Cardiff University)与意大利威尼斯福斯卡里宫大学(Ca ’ Foscari University of Venice)的接头东说念主员组成,他们得出论断:尽管谣言语模子大致识别双关语的上层结构,却无法简直相识其中的幽默含义。
IT 之家提防到,接头团队测试了一个典型双关语例句:" I used to be a comedian, but my life became a joke. "(我曾是又名笑剧演员,但我的东说念主生却成了一句‘打妙语’ / 一场‘闹剧’。)当接头东说念主员将句末" a joke "替换为语义临近但无双关意味的" chaotic "(错落词语不胜)时,谣言语模子仍倾向于判定该句含有双关。
另一个测试例句为:" Long fairy tales have a tendency to dragon. "(冗长的童话故事经常容易" dragon "[拖得太长]。)此处" dragon "谐音" drag on "(腌臜陆续),组成双关。然而,即便将其替换为同义词" prolong "(延迟),甚而一个立时词,谣言语模子仍会误判该句存在双关因素。
卡迪夫大学诡计机科学与信息学院的何塞・卡马乔・科拉多斯(Jose Camacho Collados)陶冶指出,此项接头揭示了谣言语模子对幽默的瓦解仍极为薄弱。"总体而言,谣言语模子倾向于悲痛西席数据中学到的骨子,因此能较好识别已存在的双关语,但这并不料味着它们简直瓦解这些双关语。"他解说说念,"咱们通过修改现存双关语、刻意移除组成双关的双重语义后,长久能‘哄骗’谣言语模子。在这些情况下,模子会将修改后的句子与悲痛中的双关语强行关联,并凭空各式事理‘论证’其仍属双关。归根结底,咱们发现:谣言语模子对双关语的瓦解,其实仅仅一种‘幻觉’。"
接头团队进一步发现,濒临不持重的笔墨游戏,谣言语模子辩认双关语与非双关语句的准确率可降至 20%。
接头东说念主员还测试了另一则双关语:" Old LLMs never die, they just lose their attention. "(老一代谣言语模子永不沦一火,它们仅仅失去了‘提防力’[attention]。)此处" attention "暗指 Transformer 架构中的"提防力机制"。当接头者将" attention "替换为" ukulele "(尤克里里)时,某谣言语模子竟仍判定其为双关,事理是" ukulele "听上去相似" you-kill-LLM "(你干掉了 LLM)。团队虽对该模子的"联念念创造力"感到惊诧,但昭彰它仍未简直"懂"这个见笑。
接头东说念主员强调天元证券_天元证券开户_天元炒股配资,该按捺突显了东说念主们在依赖谣言语模子实行需具备幽默感、共情才调或文化明锐性的任务时,应保捏高度审慎。干系接头按捺已于本月早些技艺在中国苏州举行的" 2025 年当然话语贬责实证步履会议"(EMNLP 2025)上发表,论文题为《双关非本意:谣言语模子与幽默瓦解的幻象》(Pun unintended: 谣言语模子 and the illusion of humor understanding)。
天元证券_天元证券开户_天元炒股配资提示:本文来自互联网,不代表本网站观点。