关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家2025-10-13 12:00:02132人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:詹姆斯复出后将湖人的快攻水平从倒数后5提升到正数前5

懂球帝 浏览 68 11-27

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 77 11-25

今年冬天最火的靴子,越“皱”越时髦!

LinkFashion 浏览 69 12-03

汕头火灾致12人遇难 幸存家属讲述逃生细节

红星新闻 浏览 100 12-12

在进博会上,重新认识海尔生物

财经无忌 浏览 92 11-12

纽约州签署《RAISE法案》,推动人工智能安全监管

IT之家 浏览 73 12-21

小米公布团队接触相关KOL事件正式调查结果

IT之家 浏览 11 01-07

姚晨回应即将到期“赎身”!真是弹指一挥间...

犀利辣椒 浏览 52 12-15

官方:因看台有医疗紧急情况,富勒姆vs利物浦推迟15分钟开球

懂球帝 浏览 17 01-05

今日热点:文淇工作室已取证;碧梨又破纪录了……

伊周潮流 浏览 2 01-10

财经早餐:多地明确取消35岁考编限制;商务部回应美方威胁加征100%关税

网易财经 浏览 114 10-13

不是谁弱谁有理,何美延只是说的好听

小椰的奶奶 浏览 67 12-11

官方:阿根廷U20主力中卫皮耶拉尼左膝扭伤;据悉无法出战半决赛

懂球帝 浏览 124 10-13

拒绝悬浮!6部扎心又治愈的“都市家庭剧”

木木汐影视剪辑 浏览 1 01-12

76岁著名演员许绍雄被指病危 多位圈中好友已赶到医院

极目新闻 浏览 112 10-28

力破76人金身,杰伦-布朗19中13砍32分3板6助,三分7中4

懂球帝 浏览 104 11-01

乌克兰全境频遭空袭 中使馆发布重要提醒

每日经济新闻 浏览 6 01-11

浙江男子全款买车合同签完提不了车 4S店:经理进去了

FM93浙江交通之声 浏览 143 10-16

郭晶晶也没想到 霍启刚香港火灾后 实现口碑暴增

桑葚爱动画 浏览 61 12-02

再超3.2万亿美元 外汇储备创两年新高

南方都市报 浏览 2611 01-08

媒体:34岁印度穆斯林后裔拿下纽约 令特朗普感到畏惧

南风窗 浏览 108 11-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2