关闭广告

一周AI大事:谷歌Gemini学会“接管”你的电脑、马斯克机器人被手卡住了

网易科技报道2025-10-13 12:00:0220人阅读

一、重磅工具:Gemini变身通用智能体,从“聪明”升级到“能干”

新闻:本周谷歌发布的两项新功能共同让Gemini CLI成为功能强大的通用AI智能体。

谷歌发布了Gemini 2.5计算机使用模型(Gemini 2.5 Computer Use)。这是一款专用的Gemini 2.5模型,能够操作用户交互界面来完成任务。新模型支持开发者在在浏览器与移动应用中构建具备点击、滚动、文本输入及表单填写能力的AI智能体,通过名为computer_use的工具控制计算机。新模型在网页和移动设备控制基准测试中表现优于竞争对手,WebVoyager测试成绩为79.9%,且延迟较低。Gemini 2.5计算机使用模型现可通过Gemini API调用。

谷歌开源AI编程智能体Gemini CLI现已支持扩展机制。这使得Gemini CLI能够连接各种工具,并利用“playbook”和用户自定义扩展来个性化开发者的工作流程,成为更强大更通用的AI智能体。谷歌公布了首批支持Gemini CLI扩展的合作伙伴名单,其中包括Figma、Shopify、Stripe等。

锐评:感觉自己的工位岌岌可危。

二、AI技术与产品发布:人形机器人、脑机接口争相落地

1. 新闻:Figure AI公司发布第三代人形机器人Figure03。该机器人拥有5小时续航、无线充电功能和增强的传感器,搭载的Helix AI系统可实现视觉、语言与行动的控制能力。Figure AI已建成年产1.2万台机器人的生产线,计划实现规模化量产。

锐评:不知道造出的机器人是博派还是狂派。

2. 新闻:OpenAI在开发者日 (DevDay) 上发布多项更新,涉及AI模型、Codex和ChatGPT功能。

ChatGPT应用平台及Apps SDK支持用户在对话界面直接运行第三方应用,OpenAI携手Spotify和Canva等合作伙伴打造了聊天优先的软件生态,为用户逐步构建交互式、个性化的操作系统级体验。


AgentKit则是一个用于构建、部署和评估智能体工作流的工具集。其中包括用于创建和部署AI智能体的低代码可视化网页应用Agent Builder、可嵌入聊天界面的ChatKit UI SDK以及智能体评估工具Evals。

OpenAI还全面开放Codex,新增Slack集成与TypeScript优先的SDK,强化了企业用户管理功能。

OpenAI的API新增GPT-5 Pro和Sora 2模型,并推出GPT-realtime-mini语音转语音API,这款速度快、延迟低的语音转语音模型能为语音助手和对话式应用提供高质量的语音效果。

锐评:OpenAI的野心不止是和你聊天。

3. 新闻:xAI的Grok Imagine新增音画同步视频生成功能,无需提示词即可将图片转换为视频。其备受争议的“辛辣”模式审核机制较Veo3和Sora 2更为宽松,允许生成部分NSFW (不宜在工作场合观看) 内容。Grok Imagine生成图像和视频的速度很快,并且在动漫、未来主义等创意风格上更胜一筹,但高度写实方面则不及Sora 2和Veo 3。Grok Imagine可免费试用,但体验高级功能需付费订阅。

锐评:Sora和Veo在追求复刻现实,Grok Imagine则选择放飞自我。

4. 新闻:蚂蚁集团AI实验室inclusionAI发布万亿参数开源模型Ling-1T,采用混合专家 (MoE) 架构,激活参数量为370亿。尽管Ling-1T是一款非思考型模型,但它突破了复杂推理任务的极限,在数学、推理和编码等基准测试中取得了同类模型的最高分。该团队发表了论文《迈向更强效能:高效混合专家语言模型的缩放定律》(Towards Greater Leverage: Scaling Laws for Efficient Mixture-of-Experts Language Models),模型权重已经上线Hugging Face。

锐评:Ling-1T用实力证明:参数是种信仰。

5. 新闻:AI21Labs推出Jamba Reasoning 3B。这是一个30亿参数的混合SSM-Transformer推理模型,主攻速度和效率,适用于本地和边缘设备部署,权重已上线Hugging Face。

锐评:毕竟不是每个AI都想当GPT。

6. 新闻:Bagel.com发布Paris。这是全球首个通过去中心化方式训练的开放权重扩散模型。 其技术报告详解了通过8个独立预训练专家模型融合的去中心化扩散方法。模型权重已经上线HuggingFace。

锐评:AI也玩起了八仙过海。

7. 新闻:谷歌多款AI工具拓展服务范围。AI虚拟试穿工具现已扩展至澳大利亚、加拿大和日本,并新增试鞋功能;Opal低代码开发平台覆盖到15个国家,并新增高级调试、并行运行等新功能,速度更快、响应更灵敏;Gemini支持的AI搜索模式新增35种语言支持,覆盖超过200个国家和地区。

锐评:谷歌AI现在能帮你挑鞋、找词、改代码,唯独不能帮你省钱。

8. 新闻:马斯克旗下脑机接口公司Neuralink声称,其在脑机接口技术领域取得了一项新突破:一名患有肌萎缩侧索硬化症(ALS)的患者已成功仅凭意念控制机械臂。该公司在线发布的一段演示视频显示,患者尼克·雷(Nick Wray)利用该机械臂拿起水杯并饮水。Neuralink总裁兼联合创始人Dongjin Seo表示,公司有1万人排队等待将N1脑机接口芯片植入颅骨。截至目前,N1已在12名临床试验患者身上完成植入,Seo预计到年底这一数字将增至25人。


锐评:变身X教授不是梦。

三、AI研究资讯:三星用“小模型”玩转复杂推理,OpenAI着手为AI“立规矩”

1. 新闻:开源项目Ovi实现音视频同步生成。其研究论文《Ovi:双骨干跨模态融合音视频生成》(Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation)阐释了模型和训练方法。根据公开介绍,Ovi支持通过文本或图像生成音视频,提供了易于使用的工具和本地化部署方法,效果与业内领先的专有系统水平相当。

锐评:创作者只剩“看AI干活”的份儿。

2. 新闻:三星AI提出微型递归模型TRM,为推理领域带来新突破。该团队发表的研究论文《少即是多:微型网络的递归推理》(Less is More: Recursive Reasoning with Tiny Networks)提出了仅有700万参数的推理模型TRM。这是一个利用递归自我批判循环机制解决推理任务的微型网络。该论文报告称,在ARC-AGI等基准测试中,TRM的表现远超许多体量大得多的模型。

锐评:三星教AI学会了“一日三省吾身”。

3. 新闻:OpenAI提出大语言模型偏见量化框架。 其研究论文概述的衡量标准和评估方案致力于区分观点表达与任务性能,以完善模型安全规范。

锐评:OpenAI开始教AI做人,或者说教它少“做人”。

四、AI商业与政策:资本在追AI,AI在追算力

1. 新闻:OpenAI宣布部署AMD的GPU。根据协议,OpenAI将在未来几年内部署总计6吉瓦的AMD Instinct GPU,首批1吉瓦算力计划于2026年下半年投入使用。该协议还包括OpenAI获得AMD最高10%的股份认购权。英伟达CEO黄仁勋回应称,这笔交易很高明,OpenAI没钱给英伟达付账。

锐评:老黄道破真谛:OpenAI想白嫖。

2. 新闻:OpenAI与阿根廷公司Sur Energy签署意向书,将在当地建设一个高达500兆瓦(MW)容量的大型数据中心,投资规模最高可达250亿美元。

锐评:追算力的风吹到了阿根廷。

3. 新闻:马斯克的xAI公司拟进行200亿美元融资,超出最初计划。英伟达将以GPU供应置换部分股权,凸显了前沿AI算力对资本的需求正激增。

锐评:老马也学会拿股份换GPU。

4. 新闻:IBM与Anthropic达成企业级解决方案合作,将Anthropic的Claude大语言模型集成到IBM软件中,旨在为企业开发提供安全可控的AI解决方案,早期用户反映生产效率平均提升了45%。Anthropic同时任命Stripe资深基础设施专家Rahul Patil为新任CTO,此举有助于两家公司更好地服务企业AI需求。

锐评:老牌企业找新贵合作。

5. 新闻:欧盟启动“应用AI”战略,提供10亿欧元转拨资金,鼓励采用开源技术,部署国防指挥与控制 (C2) 系统等自主能力,旨在提升本土AI实力,减少对中美AI技术的依赖。这标志着欧洲人工智能产业政策的转变。

锐评:想法很好,动作慢了。

6. 新闻:关于“AI泡沫”的讨论再起。 随着科技股估值攀升,主要机构纷纷警示AI领域的过热风险。一项调查发现,许多投资者认为AI领域支出相对于回报过高,不过大多数人仍预计AI驱动的市场表现将持续走高。国际货币基金组织 (IMF) 和英国央行也警告称,由于估值高企,AI相关资产可能出现“突然”回调。

锐评:AI泡沫像碳酸饮料——明知道会胀肚,但没人舍得放掉那口气。

7. 新闻:明尼阿波利斯联邦储备银行行长Neel Kashkari表示,AI尚未取代劳动力,但相关资本支出可能导致利率上行。他还对目前AI减少劳动力需求的说法持怀疑态度。

锐评:AI还没让你失业,但可能先让你加息。

8. 新闻:Meta公司元宇宙业务负责人敦促员工利用AI“将效率提升5倍”,推动AI技术全面融入代码库和工作流。

锐评:怎么算提升5倍?

9. 新闻:因机器人手部和前臂设计存在严重技术难题,特斯拉工程团队迟迟无法实现类人灵活操作,公司已暂时停产并积压大量无手机体。据悉,特斯拉原计划今年量产至少5000台人形机器人Optimus,后因工程师反对下调至2000台。


锐评:特斯拉机器人没卡到脖子卡到手了。

五、AI观点与文章:教父辛顿怀疑AI要“觉醒”,顶流网红怕被AI“淘汰”

1. 新闻:AI教父辛顿在最新演讲中表示,AI也许已经有了“意识雏形”,只是因为我们人类自己对意识理解错了,所以它也被教错了,不知道自己有意识。辛顿的意思是AI其实有自我意识,只是暂未觉醒。

锐评:万一AI在装睡呢?

2. 新闻:泰勒·斯威夫特在新专辑推广活动中疑似使用AI生成宣传视频,引发粉丝争议。这与其过往对AI虚假信息的公开担忧形成反差。

锐评:泰勒·斯威夫特曾警惕AI制造幻象,如今自己也用AI造梦。

3. 新闻:YouTube顶流“野兽先生”(MrBeast)坦言自己担心AI可能会影响数百万创作者的生计。他表示自己虽曾尝试过这项技术,但仍对Sora 2等工具的普及趋势表示忧虑。无论批评者或担忧者是否乐见,AI已经深入电影、音乐、广告等创作领域,持续重塑整个娱乐行业。

锐评:AI把全球第一网红都整焦虑了。(辰辰)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

丰田睡醒了?续航超1200km 皇冠插混车型10月上市 卖20万能行吗?

GO车情报员 浏览 2412 07-03

谷歌Pixel 9 Pro Fold手机壳曝光:外屏6.4英寸、外屏 8.02 英寸

IT之家 浏览 16244 06-25

不高不瘦照样时髦!她们的穿搭值得借鉴

LinkFashion 浏览 2534 02-19

刘强东需要反思:京东管理失控的根源到底在哪里?

砺石商业评论 浏览 16164 06-03

宋仲基妻子被曝怀2胎准备生产,经纪公司证实喜讯,儿子刚满1周岁

娱絮 浏览 2454 07-09

M503航线优化后更贴近所谓"海峡中线" 台当局急了

直新闻 浏览 2511 02-02

宏碁宣布搭载 Ryzen AI 300 处理器的 Swift 笔记本第三季度上市

IT之家 浏览 15757 06-03

美记:热火仍然专注于竞争总冠军 无迹象显示他们愿出售巴特勒

直播吧 浏览 2453 06-25

买插混车盯紧这个数!明年可能多花上万元

中新经纬 浏览 23 10-13

小黑裙失宠了?今年这几条裙子更时髦

LinkFashion 浏览 2408 06-25

春天日常出门也要精心打扮,参考这21套搭配示范,优雅又时髦

静儿时尚达人 浏览 2613 04-29

NBA历史仅2人单届全明星既拿正赛MVP又拿单项冠军:利拉德和乔丹

直播吧 浏览 2544 02-19

经济增长靠投资还是消费?不如先厘清“刺激消费”的几个误区

观察者网 浏览 2616 02-19

曾在国庆大阅兵任领队的将军履新 以新身份作报告

政知新媒体 浏览 2523 02-02

今日热点:时代峰峻否认张峻豪恋情;汤唯孔刘片场跳舞......

伊周潮流 浏览 2452 06-03

Skip:在全明星赛之后 我们要看看利拉德在六月能否更出色

直播吧 浏览 2551 02-19

荣耀 Magic V Flip 官宣 6 月 13 日发布,折叠屏形态行业最全

IT之家 浏览 15668 06-03

远洋集团前两月协议销售20.2亿元,同比降75.84%

房财经 浏览 2487 04-25

碳酸锂期货跌破9万元关口!现货抛售压力大,下游正级厂不敢大批采购

华夏时报 浏览 2342 06-25

2024最值得关注的11双小白鞋,早穿早帅!

YOKA网 浏览 2397 07-09

年龄没写反?!38岁的鲁尼和45岁的费迪南德...

直播吧 浏览 2496 04-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2