关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01243人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高迪预测英超天王山之战:看好蓝月亮客场不败

直播吧 浏览 2677 04-25

德国央行行长:与中企的竞争 该让所有欧企彻底醒醒了

澎湃新闻 浏览 175 10-11

新能源车主自驾海南回不去重庆 无奈"抢"走老爸的油车

上游新闻 浏览 2671 02-19

百年同仁堂,怎么成了中药界的“南极人”?

花朵财经 浏览 98 12-23

特斯拉在欧洲加速推广FSD!新增试驾体验,产品进入全新国家

车东西 浏览 90 01-27

活塞121-90狂胜送尼克斯四连败,坎宁安29分13助,布伦森25分

懂球帝 浏览 78 01-06

大衣哥女儿又胖了,穿睡衣上街买烤串,头发油腻没有打理

素素娱乐 浏览 2760 02-19

重要信号,楼市将变!

博闻财经 浏览 107 12-12

百年老字号的资本挑战:携创收单品安宫牛黄丸,同仁堂医养四冲港股|港E声

时代周报 浏览 53 01-28

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 166 10-11

纯电续航超400公里,上汽大众全新大型增程式SUV ID.ERA 9X申报

IT之家 浏览 96 01-09

人到中年服装更要重品质!冬天就这样穿

静儿时尚达人 浏览 2717 01-08

A股总市值接近109万亿元,2026年开启全面牛市需要具备哪些条件?

郭施亮 浏览 35 02-02

伊姐周六热推:电视剧《寻雪迷踪》;电视剧《秋雪漫过的冬天》......

伊周潮流 浏览 60 01-18

陈妍希这婚,离晚了

她刊 浏览 126 12-19

网恋1个月怀孕 45岁女子被61岁男友拉黑:他出轨别人

极目新闻 浏览 158 10-25

自曝落后25年!福特CEO称绝不会再错过中国,能兑现吗?

车宇世界 浏览 105 12-04

首款轻商量产钠电池 宁德时代发布天行Ⅱ轻商系列动力电池

网易汽车 浏览 63 01-23

本田宣布将终止与通用汽车合资公司的燃料电池生产

IT之家 浏览 101 01-21

亚历山大:我当然想超越科比,能否做到让我们拭目以待吧

懂球帝 浏览 172 10-14

道指重挫800点,IBM跌超13%,白银期货涨超7%,加密货币超16万人爆仓

21世纪经济报道 浏览 10 02-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2