关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01181人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

年薪300万请来LV高管!泡泡玛特“奢侈品化”的生死赌局

杠杆游戏 浏览 48 12-12

年薪180万!众泰汽车副总裁被罢免

经理人杂志 浏览 112 10-13

恭喜!37岁知名男星新年结婚,"0713"集体送祝福

不八卦会死星人 浏览 2767 01-08

浦发银行业绩掉队合规压力凸显,新帅张为忠如何破局?

拾盐士 浏览 2576 04-25

皇马TV显示,贝林厄姆将在国家德比中担任首发右边锋

懂球帝 浏览 100 10-27

男子下车救人被网友误会成是"肇事逃逸" 警方出面澄清

封面新闻 浏览 10 12-29

何赛飞用肥皂卸妆 网友:张晚意找到“同皂中人”

台州交通广播 浏览 204 10-26

《王牌对王牌》:玩不到一起真尴尬

洲洲影视娱评 浏览 107 11-09

再见了卡梅隆,再见了《阿凡达3》,中国观众别再被骗了

娱乐圈笔娱君 浏览 15 12-24

智己LS9上市32.28万起 两个Ultra都是高配

网易汽车 浏览 85 11-14

小米米家空气净化器连续十年中国线上销量第一,出货量破2500万

IT之家 浏览 17 12-29

同比增长89.61% 鸿蒙智行11月交付新车81864台

网易汽车 浏览 44 12-02

媒体:高市内阁就"雷达照射"贼喊捉贼 遭批国家的耻辱

新民晚报 浏览 50 12-12

赛力斯闯关港股 但故事才刚刚开始

道哥说车 浏览 116 10-14

荷兰被中美欧同时施压急疯 高官致电北京恳请解决问题

南权先生 浏览 108 10-24

京东造车!刘强东有新玩法?

百姓评车 浏览 112 10-15

山西多地连续阴雨致农作物发霉 当地要求"抢收抢种"

极目新闻 浏览 125 10-11

不顾警告与刘涛传出绯闻的杨烁,到底谁在给他撑腰?

二妹扯娱 浏览 81 11-10

下半场7中0背锅?威少8+10+7吞三连败 美记:本有机会染指最佳PG

颜小白的篮球梦 浏览 30 12-15

私处粉嫩整形,春节挤爆美容院

她刊 浏览 2680 02-19

赵心童:要学会带着压力享受比赛;特别爱吃陕西面食和葫芦鸡

懂球帝 浏览 114 10-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2