关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01377人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“WPS”上热搜!雷军为金山办公实控人,员工平均年薪约38万,金山此前发文:雷军任名誉董事长,不领薪酬

大象新闻 浏览 389 10-14

特朗普被指一边喊一边咒骂 让乌方把顿巴斯地区给俄方

红星新闻 浏览 277 10-21

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 302 10-11

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 263 01-02

入春后发现:上海满大街都是“奶奶西装、奶奶鞋”,洋气又时髦

潮人志Fashion 浏览 2803 04-29

特朗普:对委军事行动使用了空中、陆地和海上力量

极目新闻 浏览 195 01-04

“不及格”的《绝区零》,与被割裂的米哈游

虎嗅APP 浏览 2690 07-09

春节档对决张艺谋吴京,成龙能不能救港片?

娱乐圈笔娱君 浏览 185 01-29

吉利雷达地平线新车型上市 售价15.18万元

车质网 浏览 207 01-04

媒体:特朗普2.0亚洲"首秀" 重中之重还是与中国有关

上观新闻 浏览 294 10-27

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 246 12-11

做品牌,从抬高消费者剩余开始

虎嗅APP 浏览 2682 02-19

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超 浏览 196 01-29

皱着眉头在看《诉讼女王》......

时尚COSMO 浏览 244 12-18

捷豹6月停产燃油车 国内暂不受影响|汽势国际

汽势传媒 浏览 2723 04-25

MRAM,台积电重大突破

半导体行业观察 浏览 324 10-18

洛杉矶高层:签下孙兴慜是一次冒险,他展现出梅西般的影响力

懂球帝 浏览 289 10-31

事实证明,女人到了五六十岁别再去扮嫩!这样穿又优雅又显贵

静儿时尚达人 浏览 278 10-14

内饰迎巨变 新款奥迪Q4 E-Tron最新消息曝光

乐选爱车 浏览 27 05-06

足坛四大1.8亿先生:哈兰德度假、姆巴佩伤,维尼修斯贝林表现糟

直播吧 浏览 2656 06-25

女人年过50岁又如何?冬季这样打扮自己,你仍然可以美到老

静儿时尚达人 浏览 2816 02-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2