关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01435人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉降价?网友:没!但"5年0息"变相优惠2.64万

Nice好车 浏览 2673 07-03

泽连斯基:新一轮乌美俄会谈或于2月1日举行

财联社 浏览 243 01-28

小鹏汽车正式登陆卡塔尔 多款产品亮相

网易汽车 浏览 272 12-29

TA:维尼修斯认为自己在球队整体表现不佳的情况下被区别对待

懂球帝 浏览 288 12-23

知名男演员景区打工两个月成"顶流NPC" 本人回应

极目新闻 浏览 395 10-27

瞄准机器人“全身体检”:集智股份控股谱麦科技,能否构筑产业闭环?

时代周报 浏览 261 01-08

或为增程形式 上汽大众ID.ERA轿车谍照曝光

车质网 浏览 141 04-20

皇马巴萨决裂:佛爷&拉波尔塔取消午餐会 卡瓦哈尔愤怒约谈亚马尔

风过乡 浏览 346 10-25

9小时破562万,《默杀》首日票房受挫,暑期档等70岁成龙救场?

靠谱电影君 浏览 2736 07-03

非足联官方:强烈谴责决赛期间不当行为,目前正审查相关画面

懂球帝 浏览 230 01-20

今年最好的大银幕电影,没有之一

电影最TOP 浏览 472 10-28

美媒披露:美国司法部长邦迪被解雇内幕

参考消息 浏览 157 04-10

独立研究者破解扩散模型的最佳预测目标之谜

科技行者 浏览 255 02-04

"不要国王"抗议席卷全美 特朗普发布AI视频回应

看看新闻Knews 浏览 322 10-20

博时资本红利增强策略&波动增利策略:一边收息一边薅波动

私募排排网 浏览 340 10-17

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 337 10-05

美拉德之后,格雷系穿搭突然火了!

LinkFashion 浏览 2826 01-08

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 349 12-11

新能源车双税新政发布,郑州消费者该“下手”还是“等等”?

大象新闻 浏览 399 10-13

何超莲窦骁合体撒糖,赴澳洲旅游被偶遇,有说有笑力破婚变传闻

扒虾侃娱 浏览 301 11-10

张志杰姐姐回应世界羽联公告:追究到底 请对生命负责

界面新闻 浏览 2702 07-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2