关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01356人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡里克三天激活曼联新帝星,提醒其仍需成长!拉爵或省钱少买中场

罗米的曼联博客 浏览 177 01-18

波兰逆转首夺联合杯,本西奇送蛋丝袜仍难救主,瓦林卡被批拖油瓶

网球之家 浏览 165 01-12

业主私挖300平地下室 同楼住户:家里没一面墙是完整的

新民周刊 浏览 276 10-15

亚马逊AWS将部署英伟达Groq LPU与超百万块GPU

IT之家 浏览 263 03-17

为什么山系火锅不排队了?

互联网那些事 浏览 170 01-11

开扒女明星穿了5年以上的外套,原来都有一个共同点

黎贝卡的异想世界 浏览 226 12-02

媒体:特朗普一口气狂退66个群 还有更多在"排队"审查

上观新闻 浏览 173 01-09

90%的名酒在跌价,2026年酒企怎么活?

首席商业评论 浏览 198 01-15

美媒:俄方正在阿夫杰耶夫卡附近部署前瓦格纳雇佣兵

参考消息 浏览 2595 04-29

72岁唐僧迟重瑞卖房,580亿财产成了笑话?

胡一舸南游y 浏览 261 10-24

比亚迪固态电池要来!有望明年试生产

优视汽车 浏览 146 02-21

Model Y也没那么香!4.73米合资电车15万多,700km续航3.57秒破百

小李车评李建红 浏览 2632 07-09

企业在自然保护区建研学机构烂尾7年 致百亩农田荒废

封面新闻 浏览 258 11-11

真不配看啊?小罗开赛前采访:美洲杯一场也不看,放弃巴西

直播吧 浏览 2641 06-25

加沙停火协议生效后的48小时:人质释放、民众返乡

澎湃新闻 浏览 283 10-14

"老钱风"搭配火起来了!时髦显贵气

静儿时尚达人 浏览 2756 01-08

雷克萨斯终于醒悟了,但国产不是万能解药

汽车公社 浏览 2491 07-03

摩尔线程:股票价格可能存在短期上涨过快出现的下跌风险

网易财经 浏览 185 12-12

韩综镜头下,中国南极站vs韩国世宗王站,差距大到韩网友集体破防

时评人李文君 浏览 184 01-18

媒体:马克龙戴墨镜出席达沃斯 说的话不给特朗普面子

新民周刊 浏览 204 01-23

车市“龙头”,会易主吗?

盖世汽车 浏览 2564 06-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2