关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01270人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李刚仁:很高兴代表巴黎出战100场比赛,希望继续保持状态

懂球帝 浏览 152 11-10

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 90 01-10

技能养宠人,好麻烦,好费钱!

时尚COSMO 浏览 176 10-18

32岁程序员猝死 公司谈判录音公布:我们非常器重他

澎湃新闻 浏览 77 01-27

天冷了,“彩色毛衣”这么穿美翻了!

LinkFashion 浏览 171 11-01

E句话 | 没了于正的大饼,祝绪丹也有好饼

仙女事件簿 浏览 2748 02-02

金种子酒1.26亿卖掉金太阳药业,能否“轻装上阵”突围亏损困局?

征探财经 浏览 148 11-11

湾芯展顶流新凯来:当“隐形基建”浮出水面

北京商报 浏览 296 10-17

“渣女美甲”火出圈了!高级巨显白,谁做都好看!

Yuki女人故事 浏览 2726 04-29

钟睒睒加码智能化,宗馥莉砍掉机器人公司到底损失有多大?

BT财经 浏览 21 03-17

欧摩威展示单雷达AEB方案!已获国内头部主机厂定点,明年将量产

车东西 浏览 399 10-29

董宇辉帮刘德华卖掉60万张票,宁浩说妈妈让他多向小董学习

澎湃新闻 浏览 2705 02-02

联合国机构雇员被以屈打成招 被迫谎称与哈马斯有联系

环球网资讯 浏览 2657 04-29

为什么骑手的保障,“普惠”更重要?

财经无忌 浏览 155 10-31

张朝阳怀念杨振宁:他在物理学家中排第一,高过费曼和霍金

三言科技 浏览 263 10-19

许利民:争取让赵睿在窗口期前打两场,曾凡博腰伤因训练不系统

懂球帝 浏览 87 01-21

钱天一国乒第1美女,见男友家长好事将近

二疯说球 浏览 204 10-12

以高官不满拜登“没全力”支持以军:换成特朗普会更好

环球时报国际 浏览 2794 02-19

特斯拉回应停产4680电池:生产正顺利进行中

IT之家 浏览 19263 07-03

瑞典拉普兰:凛冽北境的万物平衡之道

时尚COSMO 浏览 115 12-28

冲刺双重上市,潮宏基还有多少隐忧待解

铑财 浏览 186 10-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2