第008期《AI出海去周刊》:谷歌杀疯了!Gemini 3 终结堆参数时代,AI 战争进入全栈对决

1. 专栏:

一段话总结

2025 年 11 月,谷歌发布Gemini 3 及 Nano Banana Pro,以「原生多模态 + 动态计算」能力打破 OpenAI 依赖的「Scaling Law(堆参数)」模式,在复杂推理、低代码生成(战力榜、知识绘本、表情包等)上形成代际优势,迫使奥特曼承认「关键维度落后」;同时,该模型基于谷歌第七代 TPU(Ironwood)训练,谷歌启动「TPU@Premises 计划」向 Meta 等客户开放算力,直接冲击英伟达 CUDA 生态,导致英伟达股价下跌并紧急辩护;谷歌的突破得益于「全栈自研(数据 – 算法 – 硬件 – 云)」「DeepMind 与 Google Brain 团队合并」及创始人谢尔盖・布林回归赋能,标志着 AI 战争进入「全栈能力比拼」的下半场,终结了行业「线性增长」叙事。


思维导图(mindmap)

一、事件背景:谷歌 AI 巨头觉醒,Gemini 3 横空出世

2025 年 11 月,谷歌正式发布Gemini 3 及 Nano Banana Pro,这款原生多模态大模型的亮相打破了 AI 行业此前固化的「英伟达卖铲子、OpenAI 挖金矿」叙事。此前,OpenAI 依赖「Scaling Law(大力出奇迹)」模式,坚信数据与算力堆砌能持续提升模型能力;英伟达则凭借 CUDA 生态垄断 AI 芯片市场,所有 AI 公司均需支付「GPU 税」。而 Gemini 3 的发布,既冲击了 OpenAI 的模型护城河,也动摇了英伟达的算力霸权,被外媒评价为「沉睡的 AI 巨头全面觉醒」。

二、对 OpenAI 的核心冲击:从「堆参数」到「原生思考」

  1. 技术逻辑颠覆:OpenAI 的模型(含 GPT-4o)本质是「多模态缝合」(分离处理文本、图像等信息后拼接),而 Gemini 3 实现「原生多模态」—— 像人类一样直接理解光影、动态,无需转换介质,延迟极低且直觉敏锐。
  2. 思维能力突破:首次在硅基芯片上常态化实现「系统 2 慢思考」,无需用户提示即可自动判断任务类型(直觉秒回 / 逻辑推演),在代码生成、复杂数学、长逻辑链任务上形成代际优势。
  3. 低代码高产出场景:
    • 一句话生成各类战力榜(NBA、鬼灭之刃九柱);
    • 一句话生成知识绘本(长平之战、超市购物双语指南);
    • 一句话生成表情包(覆盖日常语气、情绪表达);
    • 低分辨率图像精准放大至 4K,支持真实笔迹交互解题。
  4. 市场反应:OpenAI CEO 奥特曼深夜发推,罕见承认「公司在某些关键维度确实落后」。

三、对英伟达的算力挑战:TPU 撕开 CUDA 生态铁幕

  1. 第七代 TPU(Ironwood)核心参数与优势:谷歌十年磨一剑的 TPU(张量处理单元)推出第七代产品 Ironwood,专为 AI 推理与训练设计,关键性能较上一代提升 4 倍,具体参数如下:
TPU 代际发布年份内存带宽算力(fp8)芯片集群规模核心特性
v1201534 GB/s初代 TPU,奠定基础
v420211200 GB/s275 TOPS7nm 工艺,支持集群部署
v6e20241640 GB/s1836 TOPS(int8)适配中端 AI 场景
v7(Ironwood)20257.37 TB/s4614 TOPS最大 9216 颗芯片性能最强、能效最高,芯片间互联速率 9.6Tb/s
  1. 商业突围动作:
    • 谷歌启动「TPU@Premises 计划」,允许 Meta 等云客户在自有数据中心使用 TPU,目标抢占英伟达 10% 营收;
    • Meta 已率先倒戈,成为谷歌 TPU 的核心客户,打破英伟达在 AI 芯片市场的垄断性依赖。
  2. 英伟达的应对:股价应声下跌 3.78%(单日跌幅 6.9 美元),官方在 X 平台发长文辩护,强调「CUDA 生态不可替代」「英伟达平台支持所有 AI 模型」,但市场对其 80% 高毛利率的可持续性产生质疑。

四、谷歌的全栈支撑:从技术到组织的全面赋能

  1. 全栈自研布局:谷歌是唯一实现「数据→算法→硬件→云服务器」全链条自研的 AI 公司,无外部供应商依赖:
    • 数据飞轮:YouTube(高质量视频数据)、谷歌搜索(实时世界知识)、Android(数十亿端侧场景);
    • 硬件闭环:TPU 芯片与 Gemini 模型深度协同,算力利用率突破行业天花板;
    • 云服务:谷歌云为 TPU 算力落地提供基础设施支持。
  2. 组织与文化变革:
    • 团队整合:合并 DeepMind 与 Google Brain,结束内部内耗,打通技术协同;
    • 创始人回归:谢尔盖・布林重返总部写代码,提交多年来首个 CL(代码修改请求),催化 Gemini 3 项目加速,聚焦长逻辑链推理的「长尾问题」。

五、AI 下半场:从「淘金热」到「全栈比拼」

  1. 行业趋势转变:OpenAI 联合创始人 Ilya 公开表示「Scaling 时代已终结,AI 进入研究时代」,Transformer 架构面临替代,行业亟需新架构创新(谷歌已发布相关论文)。
  2. 竞争焦点升级:上半场比拼「算力(英伟达)+ 模型迭代速度(OpenAI)」,下半场核心是「全栈能力、架构创新、定制化硬件与模型的深度协同」。
  3. 谷歌的优势:AlphaGo、Transformer 论文、AlphaFold 等科研成果奠定基础,全栈布局 + 数据飞轮 + 科研基因,成为 AI 下半场的核心竞争者。

六、彩蛋与后续动作

  1. 谷歌:DeepMind CEO 哈萨比斯严禁工程师对外发表核心论文,隐藏技术储备,避免技术路线被模仿;
  2. 英伟达:拟复制 OpenAI 的合作模式,向 Meta 注入巨额投资,换取其继续使用英伟达芯片的承诺,以资本手段巩固客户绑定。

4. 关键问题

问题 1:Gemini 3 对 OpenAI 的核心冲击并非「参数更大」,而是技术逻辑的颠覆,具体体现在哪些方面?

答案:核心冲击在于打破了 OpenAI 依赖的「Scaling Law(堆参数)」模式,实现了两大技术逻辑颠覆:① 「原生多模态」替代「多模态缝合」——Gemini 3 无需将视频、图像等信息转换为文本再理解,而是直接像人类一样感知光影与动态,延迟更低、理解更精准,而 OpenAI 的 GPT-4o 等模型本质是分离处理不同模态信息后拼接;② 「动态计算」替代「单一思考模式」——Gemini 3 内化了「系统 2 慢思考」能力,可自动判断任务类型(直觉响应 / 逻辑推演),无需用户额外提示,在长逻辑链、复杂数学等任务上形成代际优势,而 OpenAI 的「慢思考」更像外挂插件,依赖用户引导。这种逻辑颠覆让 Gemini 3 在低代码高产出场景(如一句话生成知识绘本、战力榜)中表现突出,迫使奥特曼承认落后。

问题 2:谷歌 TPU 能挑战英伟达 GPU 的关键壁垒是什么?为何 Meta 等巨头会选择倒戈?

答案:谷歌 TPU 挑战英伟达的关键壁垒的核心是「软硬件深度协同 + 全栈生态支撑」,具体包括:① 性能与能效优势 —— 第七代 TPU(Ironwood)内存带宽达 7.37 TB/s(是英伟达主流 GPU 的数倍),算力 4614 TOPS(fp8),且针对 Gemini 模型定制优化,算力利用率远超通用 GPU;② 集群部署能力 —— 支持最大 9216 颗芯片组成超级集群,芯片间互联速率 9.6Tb/s,适配大规模 AI 推理与训练;③ 商业灵活性 ——「TPU@Premises 计划」允许客户在自有数据中心部署,降低迁移成本。Meta 等巨头倒戈的核心原因是「降低对英伟达的依赖 + 成本优化」:英伟达 GPU 垄断导致「GPU 税」居高不下,而谷歌 TPU 不仅性能匹配,且软硬件协同带来更低的综合成本,同时谷歌的全栈布局能保障算力供应稳定性,避免被单一供应商绑定。

问题 3:AI 战争进入下半场后,行业竞争焦点从「上半场淘金热」转向了什么?谷歌在这场竞争中最核心的护城河是什么?

答案:① 竞争焦点转变:上半场是「淘金热」,核心比拼「铲子质量(英伟达的 GPU 算力)」和「挖掘速度(OpenAI 的模型迭代效率)」,依赖数据与算力的线性堆砌;下半场进入「全栈能力比拼时代」,核心竞争维度包括「定制化硬件与模型的深度协同」「全链条自研能力(数据 – 算法 – 硬件 – 云)」「架构创新(替代 Transformer)」「科研储备与人才密度」,不再是单一维度的领先就能获胜。② 谷歌的核心护城河是「全栈自研 + 数据飞轮 + 科研基因的三重协同」:首先,谷歌是唯一实现数据、算法、硬件、云服务器全链条自研的公司,无外部依赖,软硬件协同效率(如 TPU 与 Gemini 的适配)远超依赖外部芯片的 OpenAI;其次,YouTube、谷歌搜索、Android 构成的 data 飞轮,提供了全球最优质的多模态数据、实时知识与端侧场景,为模型迭代提供持续动力;最后,谷歌的科研基因(AlphaGo、Transformer、AlphaFold 等突破性成果)与团队整合(DeepMind+Google Brain)、创始人回归的文化赋能,让其在架构创新等前沿领域具备先发优势,契合 AI 下半场「研究驱动」的趋势。


2. 科技动态

2.1 市场最大“黑天鹅”:AI资本支出放缓,三大“巨雷”会是美股噩梦

巴克莱股票策略团队指出如果数据中心资本支出在未来两年下降20%,标普500指数将面临3-4%的盈利下行压力,更严重的是估值可能下跌10-13%。报告识别三大风险:AI模型效率提升可能导致计算设施过度建设;电力

2.2 Meta推出Vibes平台,进军AI视频市场

Meta宣布将AI视频创作平台Vibes集成在Meta AI应用中,允许用户创作、发现和分享短视频内容。该功能以信息流的形式呈现,用户不仅可以浏览由其他创作者和社群生成的AI视频,还可以利用全新的AI视觉工具将自己

2.3 马斯克失宠,扎克伯格与奥特曼趁机上位,迎来与特朗普的“蜜月期”

今年扎克伯格和奥特曼已访问白宫约六次,并公开对特朗普政府表示赞赏。作为回报,他们正寻求白宫支持,以在发展AI的过程中获得更多商业机会并减少监管障碍。相比之下,今年5月以来马斯克就没去过白宫。但知

2.4 你的最快安卓芯片发布了!全面为Agent铺路

手机PC等终端芯片,在Agent变革面前也要被重塑了。刚刚,高通发布全球最快Windows PC处理器、全球最快移动SoC处理器:面向PC,高通首次推出专为超高端PC打造的骁龙X2 Elite Extreme,目标是“轻松驾驭智能体AI体验”

2.5 刚刚,LeCun团队开源首款代码世界模型!能像程序员一样思考的LLM来了

疯狂挖人的Meta,终于在今天发布了最新AI研发成果!代码世界模型CWM是本次发布的模型,创新性地将世界模型引入了代码生成任务中。这是否会成为编程模型新范式?

2.6 存储芯片:“饥饿游戏”开启,一场为期四年的上行周期

摩根大通认为,在AI计算对高性能内存的巨大需求的推动下,“内存饥渴”趋势正在推动整个行业进入结构性增长阶段,DRAM市场正迎来一个从2024年持续至2027年的“前所未有的四年定价上行周期”,预计到2027年,全球存储市场规模将达到近3000亿美元。

2.7 马斯克新模型背后算法来自英伟达?

Grok-4-fast最近在降本增效上的表现堪称一骑绝尘,连有「路由器」傍身的GPT5都给干趴下了。面对如此惊艳的推理效率,很多人第一反应就是:堆卡式的算力scaling又一次大显神威了。

实际上,Grok的背后确实有英伟达的影子。但这次立功的,或许不是老黄的显卡,而是算法。

没错,Grok-4-fast的秘密武器,被和一篇英伟达的算法论文关联在了一起。


3. AI出海动态

3.1 人工智能几何学基石,黎曼思想塑造AI未来

黎曼的几何学革命:《论几何学基础的假设》导读与阐释

报名中 智源社区 人工智能里程碑论文共读计划 黎曼的几何学革命:《论几何学基础的假设》导读与阐释 重读论文 On the hypotheses which lie at thebases of geometry 领读者:卢萌北京大学 2025年12月02日 19:30-20:30

3.2 DARLING|强化学习如何打破同质化

2025年12月04日 10:30-11:30

本期报告将由约翰霍普金斯大学李天健进行分享。

随着大语言模型能力不断提升,一个日益突出的现象是:模型的回答往往高度一致、内容相似、缺乏多样性。尤其在后训练阶段,由于强化模型的“正确性”与“有用性”,模型的输出分布会进一步被压缩,使得生成内容更趋同质化。这种模式在创意写作、头脑风暴、开放式推理等任务中尤其明显,限制了模型的创造力与探索能力。

为缓解这一问题,我们提出 DARLING(Diversity-Aware Reinforcement Learning)框架,旨在解决“高质量”与“高多样性”之间的长期矛盾。DARLING 的核心思想是:

  • 多样性不能仅依赖表层词面差异衡量;
  • 强化学习需要显式、稳定地优化语义层面的多样性信号。

4. 产品动态

4.1 Snapdeck

秒速打造高分演示文稿。 再也不用跟 PowerPoint 或 Keynote 较劲——只需输入一句话,AI 即刻为你生成版式、主题、图表和图示。现已推出独立应用。

4.2 Strata

Strata 是一个 MCP 服务器,可逐步引导你的 AI 代理在多款应用的上千个工具中穿梭。它消除上下文过载,确保精准选工具,让代理轻松搞定跨应用的复杂工作流。

4.3 Video Marketer by Memories.ai

Memories.ai 出品的 Video Marketer 就是“视频界的 Perplexity”。它帮品牌、营销人员和创作者解锁社交视频洞察:瞬间发现红人、解析爆款原因、预测趋势——由全球首个大型视觉记忆模型驱动。

4.4 Sprinto

解除销售团队的封锁。自动回答安全问卷使用Sprinto AI,自动完成问卷,重复使用答案,更快地完成交易。没有麻烦或瓶颈。

全球有远见的云公司都信赖 Sprinto:让它驱动安全合规计划,全速冲刺过审,节奏不乱。

4.5 Oreate

Oreate 登场——面向专业人士、学生与研究者的一站式 AI 工作空间。一键即可生成排版专业、来源权威、图表精美的幻灯片、研究报告与学术论文。从商业提案到学术研究,从营销方案到旅行攻略,Oreate 全能搞定。原本 3 天的任务,它 3 分钟完成;让你像身价百万的专家一样做出高水准演示与报告。

4.6 Doraverse

Doraverse 汇聚 15+ 顶尖 AI 模型与 50+ 应用集成,外加零代码工作流自动化——一站式平台,彻底重塑企业的思考、创作与增长方式。

4.7 Conduit AI

Conduit 是构建、训练并迭代对话式 AI 代理的平台。它将所有商务沟通汇入统一收件箱,代理不仅能即时回复,还能持续自我优化,跨电话、邮件、短信与聊天全程服务。

4.8 Atla

Atla 是唯一一款能自动挖掘 AI 代理深层问题的评估工具。它帮你洞察每一步的错误,优先定位反复出现的失效模式,并在用户察觉之前迅速修复。

4.9 alphaAI Capital

alphaAI Capital 用人工智能动态管理你的投资组合,随市况自动切换进攻与防守模式。提供全自动杠杆 ETF、加密 ETF 及节税策略,全部按你的风险偏好量身定制。

4.10 Ambient Daily Briefing

Ambient Daily Briefing 自动连接你的日历,遍寻可信信源,为每场会议提前备好资料。开启融资模式后,还能生成详尽投资人档案。每日直达邮箱——无需学习新工具。专为创始人打造,几分钟即可启用。


5. 开源分享

5.1 airi

开源的 AI 虚拟伴侣。这是一个将二次元虚拟角色等智能体带到你的身边。支持实时文字和语音聊天,可陪你玩 Minecraft、异星工厂等游戏,并提供 Web 端和桌面端应用。

5.2 glass

隐形的第二大脑。这是一款隐形桌面 AI 助手,不会出现在录屏、截图或桌面中。支持实时读取屏幕和麦克风内容,随时把所见所闻变成可检索、追问的结构化知识。

5.3 langflow

可视化 AI 工作流构建平台。这是一款面向开发者和企业用户的开源 AI 智能体与工作流构建平台。它将 LangChain 的核心能力(链、工具、记忆、向量存储等)封装成可复用组件,并结合 React Flow 实现可视化流程编辑,用户无需编写代码即可快速设计、调试并部署复杂的 AI 工作流。

5.4 ten-framework

开源的实时多模态对话 AI 框架。这是一个专为实时 AI 音视频互动场景设计的框架。它内置友好的 Web 界面,便于创建、定制和部署具备语音、视觉和虚拟形象交互能力的对话型 AI 智能体。

5.5 vibe-kanban

AI 编程助手任务管理看板。这是一款专为 AI 编程代理打造的看板工具,能够统一管理 Claude Code、Gemini CLI、Codex 等主流 AI 编程助手。它集成了看板任务、Git 仓库和 AI 编程代理,支持多种 AI 代理自动完成 bug 修复、功能开发、项目初始化和文档生成等任务。

5.6 VideoCaptioner

开箱即用的智能字幕助手。这是一款基于大语言模型的智能视频字幕处理工具。它界面简洁、操作便捷,支持语音识别、智能校对和自动生成多语言字幕等功能。来自


6. 精选推文

6.1 埃隆·马斯克: 未来应该像未来的Robovan一样。

6.2 可卷起的LED屏幕

6.3 赛博机器人

还记得酒店清洁用的那种人形机器人吗?顾客们已经开始使用它了。合肥的初创公司泽瑞斯机器人(Zerith Robotics)已在合肥机场、合肥燃气大厦、深圳等城市的购物中心、写字楼和超市部署了多台泽瑞斯H1机器人。

6.4 有意思。这款自动驾驶卡车通过驾驶室前方的大型高对比度LED屏幕来传达意图。

6.5 该研究使用了人工智能技术。筛选以寻找能够影响衰老和神经炎症的治疗方法

6.6 人工智能模型不断推陈出新,创造出更优秀的新型人工智能模型

人工智能模型不断推陈出新,创造出更优秀的新型人工智能模型。中国研究人员将所有LLM研究成果输入到一个模型中,结果发现了106种全新的人工智能模型架构,这些架构在降低损失和提升基准测试成绩方面均取得了显著成果。ASI-Arch是今年最酷的人工智能论文之一。通用人工智能(AGI)正在迈向未来。


7. 精选文章

7.1 英伟达提出ReaSyn,借鉴思维链类比分子合成,实现超高重建率与路径多样性

英伟达研究团队推出融合推理能力的高效可合成分子投影框架 ReaSyn,采用反应链表示法,将合成路径视为 LLM 的 CoT 推理路径,为破解分子合成的现实难题开辟了新路径。它借鉴大型语言模型中的 「思维链推理」 思想,从技术底层为解决可合成分子设计的核心痛点提供了新思路。

7.2 人工智能+国际合作倡议【AI战略洞察】

当地时间9月23日,国务院总理李强在纽约联合国总部出席由中方主办的全球发展倡议高级别会议并致辞。联合国秘书长古特雷斯、哈萨克斯坦总统托卡耶夫、伊拉克总统拉希德、安哥拉总统洛伦索、安提瓜和巴布达总理布朗、巴基斯坦总理夏巴兹、尼日尔总理泽内以及30多国部长级官员、国际组织负责人与会。

7.3 一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍

当芯片像炉子一样发烫,电费狂飙、延迟卡顿、服务掉链子,所有想象中的未来都会被「热」锁死。微软这次亮出的杀手锏,是在芯片里开出液体血管,让冷却液直达发热核心。这AI能不能继续狂奔,价格能不能压住,体验能不能丝滑,都系于这场降温革命。


8. 播客推荐

大小马聊科技 最懂AI的汽车科技播客


9. 书籍推荐

9.1 Crypto 101

开源书籍《Crypto 101》密码学入门。这是一本面向程序员的密码学入门书籍,从 XOR 和一次性密码本开始,循序渐进地讲解对称加密、公钥加密、哈希、MAC、签名、密钥交换、随机数等密码学“积木”,并把它们组装成 TLS、OpenPGP、OTR 等真实系统。

9.2 ThinkStats

开源书籍《Think Stats》统计思维。这是一本写给程序员的统计学电子书,所有代码示例和练习均以 Python 实现。全书围绕真实数据集展开,通过探索性数据分析、概率分布、假设检验、相关性与回归分析等统计方法,用统计思维解决实际问题。

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *