关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01459人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

齐溪晒二胎宝宝正脸!身材发福明显

松林侃世界 浏览 260 01-09

拒绝被逆转,曼联本赛季英超领先后保持不败

懂球帝 浏览 318 11-09

5年内在英国推出10款新车 吉利EX5伦敦上市售3.199万英镑起

网易汽车 浏览 448 10-24

牛弹琴:乌军总司令和泽连斯基争吵 不排除政变的可能

北京日报客户端 浏览 2815 02-02

官方披露:正厅级崔建平被查当月还在捞钱

扬子晚报 浏览 431 11-09

夏联-乔治30分&罚球绝杀 埃迪14+15 爵士加时力克灰熊

直播吧 浏览 2746 07-09

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 276 01-08

阿里正把自己装进赛博分身

虎嗅APP 浏览 297 01-16

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 317 11-25

布里斯班新科亚军科斯秋克:我的关于萨巴伦卡的话被断章取义

网球之家 浏览 265 01-12

俄代表:美国侵略委内瑞拉意味着"无法无天时代的回归"

环球网 浏览 272 01-06

利空突袭!美联储,突然动手!

券商中国 浏览 2559 06-25

TA:弗兰-加西亚本预计将外租樱桃,对皇马放弃交易感到失望

懂球帝 浏览 284 02-03

以军称被扣押人员全部返还前不会停止打击哈马斯

新京报 浏览 353 10-29

特朗普:“国际部队”将进驻加沙地带

每日经济新闻 浏览 313 10-26

世上没有免费的豆包

光子星球 浏览 213 05-09

U17世界杯吉祥物灵感来自前国足主帅米卢,米卢:感谢这个创意

懂球帝 浏览 351 10-31

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 369 10-23

兴业消费金融:筑梦美好生活 扎实推进高质量发展

财经众议院 浏览 336 01-05

剑南春|米兰1-0恩波利取3连胜,普利希奇制胜,奥卡福尔助攻

懂球帝 浏览 3041 04-25

2架美军机在南海相继坠毁 原因正在调查中

界面新闻 浏览 384 10-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2