关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:0136人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

老二次元了!科纳特社媒庆祝赢球,包含一张看龙珠的照片

直播吧 浏览 2624 02-02

2023国产剧:放下爆款情结,尊重观众审判

刺猬公社 浏览 2490 02-02

黄奕和女儿开心出游,11岁铛铛颜值变化大,获赞高级脸

好丹 浏览 2732 02-02

今日热点:时代峰峻否认张峻豪恋情;汤唯孔刘片场跳舞......

伊周潮流 浏览 2492 06-03

江一燕8年前与赵汉唐因戏结缘 最后同框在今年4月

萌神木木 浏览 39 10-31

浙江:确保2024年全省固定资产投资增长6%左右

经济观察报 浏览 2636 02-19

存储芯片需求强劲,佰维存储业绩有望迎来“戴维斯双击”

览富财经网 浏览 2297 06-03

也门胡塞武装称袭击以色列重要目标并击中红海一货轮

极目新闻 浏览 2425 07-03

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 45 10-24

以AI治AI 推动智能向善 巨量引擎商业安全开放日在京举办

一点财经 浏览 41 10-26

4S店冰火两重天,汽车经销商历经生死洗礼

百姓评车 浏览 2364 07-03

E句话 | 《奥本海默》横扫奥斯卡!

仙女事件簿 浏览 2573 04-25

谋求第四家IPO, 同仁堂医养依靠并购“增肥” 造血能力待考

Daily每日财报 浏览 2520 07-09

卡德罗夫发布"阅兵"视频:展示缴获的西方武器

环球网 浏览 2570 01-08

放弃“模仿”,小米汽车的价值才能显现

盖世汽车 浏览 2473 06-03

南特科技:加工服务业务收入核算方法存“两个版本” 称客户未指定供应商或现信披疑云

金证研 浏览 47 10-17

她才是中年女性的穿衣榜样!不装嫩、不沉闷,显瘦又显气质

静儿时尚达人 浏览 2408 07-09

奥恰洛夫谈击败张本智和:我打出了顶级水准,自己也有些意外

懂球帝 浏览 1 11-08

唐嫣分居风波后首露面,穿西装出席女性对话会,男方IP显示北京

萌神木木 浏览 37 10-27

realme 真我 12 Pro 系列手机 2 月 27 日国内发布

IT之家 浏览 16000 02-19

硅谷的「十万大裁员」:Meta按代码量裁员

新智元 浏览 119 10-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2