关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01228人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

41岁张靓颖的现状,给所有中年女性提了个醒

科学发掘 浏览 108 11-25

乌国家科学院人口研究所:乌人口规模或将下降三成

红星新闻 浏览 110 12-10

记者:维拉和埃弗顿也有意路易斯-恩里克,伯恩茅斯的报价最具体

懂球帝 浏览 21 01-29

演员黄璐将惊喜现身明日艺术影院映后❤️

幕味儿 浏览 160 11-11

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 201 10-13

美媒:大批美军机突然飞往欧洲

环球时报国际 浏览 58 01-07

台学者:台当局不办光复节活动 人民无法接受

环球时报新闻 浏览 121 10-28

火力全开!杰伦-布朗23中15&三分12中6 砍全队第二高36分另8板3助

直播吧 浏览 2632 02-19

李平康:贺一然加盟泰山基本差不多了,玄智健基本不可能了

懂球帝 浏览 24 01-28

美媒:美军强化防空和濒海作战能力

参考消息 浏览 2687 01-08

特朗普要求日本停止进口俄罗斯能源 高市早苗当面拒绝

鲁中晨报 浏览 134 10-31

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 162 10-04

E句话| 爱马仕继承人被曝坐廉航,150亿美元下落不明?

仙女事件簿 浏览 92 12-02

华尔街主流投行也要参与!高盛CEO称正在探索预测市场机会

华尔街见闻官方 浏览 48 01-16

SemiAnalysis深度报告:美国电网跟不上,AI数据中心“自建电厂”跟时间赛跑

华尔街见闻官方 浏览 89 01-02

今日热点:曾艳芬提醒丝芭传媒有聊天记录;边伯贤恶评者被罚款……

伊周潮流 浏览 78 12-20

终于找到了中年女人的榜样,穿衣不花也不朴素,美得刚刚好

静儿时尚达人 浏览 2644 07-03

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 262 10-21

媒体:美军在中东遇袭3人阵亡却没动静 表现有点怂

上观新闻 浏览 2747 02-02

Jacob Elordi 最新电影造型,好像鬼!

下水道男孩 浏览 144 10-26

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 155 10-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2