关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:0171人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中药老字号提价策略失灵?片仔癀股价大跌,提前2个月公布一季度业绩预告救场

时代财经 浏览 2530 02-02

媒体:理想合并零售与交付两大部门 全力卖车

网易财经 浏览 2416 06-03

B级车杀入八万元区间,汽车的价格战到底路在何方?

江瀚视野 浏览 46 10-14

大S带具俊晔新年露面,夫妻同框恩爱十足,大S瘦了很多

素素娱乐 浏览 2597 02-02

神舟二十号飞船推迟返回 疑似遭空间微小碎片撞击

极目新闻 浏览 19 11-05

詹姆斯坐骨神经痛进展:湖人计划让他11月中旬复出 将耐心康复

醉卧浮生 浏览 50 10-16

奇瑞集团10月份销售汽车281161辆 同比增长3.3%

网易汽车 浏览 23 11-03

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 26 11-02

难怪连央媒都发文悼念,许绍雄竟“藏”得这么深

凡知 浏览 34 10-31

奥特曼零食之父,要去IPO了

投资家 浏览 38 10-28

一加 15 / Ace6“双舰齐发”,新机发布定档 10 月 17 日

IT之家 浏览 118 10-16

日本神奈川县“打工人”平均每天路上花100分钟

环球时报国际 浏览 2579 01-08

中国排名前五的储能企业未来三年有望占据全球50%以上市场份额

澎湃新闻 浏览 123 10-31

拟剥离银座商管 福瑞达继续瘦身

北京商报 浏览 51 10-13

“第一美男”变胖变丑变油腻,原来是命中注定?

Yuki女人故事 浏览 2393 06-25

开年关键词「柔和桃」,唐嫣已经上身了!

创作者_WCD3 浏览 2651 01-08

埃弗顿vs富勒姆:格拉利什、皮克福德首发,劳尔-希门尼斯、莱诺出战

懂球帝 浏览 3 11-09

热度破5000!李行亮麦琳刚走,又来2大活宝,芒果台又出王炸综艺

娱乐圈笔娱君 浏览 50 10-17

孙兴慜两连杀!争四大战独造3球,21场造21球,维拉真克星

奥拜尔 浏览 2523 04-25

女子买房遇"非正常死亡"事件 卖家:死者自愿离开世界

环球网资讯 浏览 11 11-08

在美流浪博士老家镇政府:若其是美国国籍 无法介入

极目新闻 浏览 2533 01-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2