关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01182人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50+女性秋日别瞎打扮,这3招让你告别油腻感,优雅好气质

静儿时尚达人 浏览 83 11-01

续航最高 710 公里,上汽飞凡 RC7 纯电 SUV 电池及续航信息公布

IT之家 浏览 15678 06-03

新增120城 蔚来城区NOP+覆盖中国大陆99%城市

网易汽车 浏览 2556 04-25

姚明将在今年开始正式领取NBA退休金,每月可领约1.3万人民币

懂球帝 浏览 116 10-13

都灵主帅:我很尊重斯帕莱蒂,我们必须带着创造历史的信念比赛

懂球帝 浏览 84 11-08

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 117 10-09

菲非法“坐滩”军舰严重破坏仁爱礁珊瑚礁生态系统

环球网资讯 浏览 2495 07-09

硅谷银行风波未平:美国银行业仍存在大量未实现亏损

边际财经实验室 浏览 2587 06-25

外资公募绩优产品持仓曝光!

券商中国 浏览 109 11-03

被67岁的她惊艳了!白发不染衣品优雅,老了也时髦

LinkFashion 浏览 2709 01-08

女子出差遭客户强制猥亵致精神创伤:逃卫生间逃过一劫

大风新闻 浏览 90 10-29

干细胞功能性治愈糖尿病新进展:90天,让体内胰岛素“重生”

澎湃新闻 浏览 16853 06-25

罗晋婚变疑云再升级,任素汐也遭殃

可乐谈情感 浏览 56 12-21

五十多岁的女性秋季别瞎打扮,这3个技巧实用还时髦,快收藏

静儿时尚达人 浏览 75 11-08

推15款新车,鸿蒙智行的野心,是2026年正式超过奔驰?

路咖汽车 浏览 43 12-10

以军称已按加沙地带停火协议完成撤军

极目新闻 浏览 116 10-12

英伟达“跌倒”,寒武纪“吃饱”?

经济观察报 浏览 253 10-20

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 111 10-24

47岁刘烨老来俏,让儿子诺一尴尬了?

草莓解说体育 浏览 45 12-02

马斯克拿万亿美元薪酬,特斯拉核心高管为何集体离职?

功夫AUTO 浏览 67 11-15

男子驾车撞死闯国道野猪被判全责 特斯拉修车费超2万

红星新闻 浏览 76 11-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2