关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01171人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"网红罗大美遇害案"新进展:三名被告人均提出上诉

扬子晚报 浏览 91 10-31

丈夫因妻子"买肉价格低"疑其出轨 捅刺结婚30多年妻子

红星新闻 浏览 122 10-13

迪亚斯生涯前6场德甲直接参与9球,追平哈兰德&仅次于凯恩

懂球帝 浏览 95 10-17

E句话|福原爱,再婚怀孕

仙女事件簿 浏览 2 12-23

尚水智能三度试水A股终迎曙光 比亚迪十亿关联交易护航IPO闯关

叩叩财讯 浏览 15 12-16

特朗普:若俄乌冲突无法解决 可能会供乌“战斧”

界面新闻 浏览 100 10-14

夏天少穿裤子吧,不试试这些“裙子”,你都不知道自己有多美

静儿时尚达人 浏览 2543 07-09

以军缩小在拉法以东部队规模

新华社 浏览 2406 06-03

特朗普称批准韩国建造核潜艇

澎湃新闻 浏览 82 10-31

解密福建舰电磁弹射背后的硬核支撑

上观新闻 浏览 66 11-15

主流纯电颠覆者!吉利银河E8上市,抢占主流新能源车定价权

车市红点 浏览 2558 01-08

利昂-贝利替补出场20分钟后被换下,赛季未过半已经受伤三次

懂球帝 浏览 2 12-21

潮人新知·前沿发现|Apple Vision Pro已在美国上市,激光技术“打印”出人工微血管网络

金羊网 浏览 16142 02-19

这几件配饰太火了,今年流行的风格都离不开它

LinkFashion 浏览 2450 07-03

奥沙利文:75三杰各自欣赏会相互问候,希望年轻人能超越我们

懂球帝 浏览 105 10-13

美国以天气原因拆除2.3亿美元加沙码头 暂未做出重建决定

澎湃新闻 浏览 2467 07-03

宗馥莉几乎搞砸了一切

功夫财经 浏览 103 10-14

亚马逊与OpenAI签署380亿美元算力大单!AWS将供应英伟达芯片

华尔街见闻官方 浏览 73 11-05

斯通斯长传成功率64.9%,本届欧洲杯所有后卫中最高

懂球帝 浏览 2508 07-09

3月11日外媒科学网站摘要:室温超导欺诈丑闻曝光

网易科技报道 浏览 16444 04-29

剑指关键矿产,美牵头多国签署《硅和平宣言》

环球网资讯 浏览 13 12-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2