为什么苹果和在AI上的节奏快不起来


很多人看到标题估计要吐槽了:苹果不是热火朝天推“Apple Intelligence”了么,不是快速接入DeepSeek和元宝了么,怎么能说它们慢呢?看事情不能只看表面,如果我们仔细琢磨,就能发现二者在AI层面的节奏其实和大多数人想象的要慢。废话少说,咱们掰开了来聊:一先看苹果:去年WWDC,苹果高调推出“Apple Intelligence”,试图告诉公众它没有在AI浪潮中掉队,而且还要雄心勃勃地用“苹果的方式”重新定义AI。的确,苹果的风格一直是这样:不抢第一枪,但一旦出手往往能重新定义游戏规则,教其他同类产品做人。但库克的意气风发并没有持续多久,在今年财报会上亲口承认AI版Siri延期,一年前画的很多饼都成了期货,“稍后推出”成了官方口径中的高频词。而且细心的观众和科技媒体们发现,上线后Apple Intelligence第一个版本很多功能都非常鸡肋:Genmoji这种低频需求聊胜于无,而“写作建议”实用性被批评为“噱头大于实质”,图片消除的效果甚至和美图秀秀相比都存在肉眼可见的差距。稍微复杂一点的问题就得用户确认“是否访问ChatGPT”,而且仅支持iPhone15等更高机型,同时中国区还得继续等。所以无论是YouTube还是B站的数码KOL,都在不同程度上对Apple Intelligence表达了失望。而让人匪夷所思的是,根据The Imformation的报道,苹果在WWDC 2024上展示的很惊艳的横跨邮件、日历、地图等多个App的“会议时间修改还能否赶上孩子学校活动”的Case居然是“剪辑”的。多位工程师接受采访时表示,看到发布会的这个演示后很惊讶,因为这些功能在测试设备上都还不能正常工作。以上种种表明,Apple Intelligence重演了12年前Siri的发布,即演示的时候是卖家秀,实际到手成了买家秀。预告片比正片精彩,至少截至目前是这样的。二再看,拥抱AI看似动作非常多,概括来讲就两个层面:第一个层面——单一功能的AI化,比如的AI朗读,的智能体回复,输入法支持生图,读书支持AI总结等等。第二个层面——接入头部大模型产品,比如搜索接入DeepSeek,将元宝加入到通讯录。特别是后者,行业内各种“颠覆”“革命”“干翻”“终结”等虎狼溢美之词层出不穷,但实际带给用户的体感和预期还是多少有落差的。那么,原因是什么呢?核心在于本质上只是给元宝和DeepSeek开了一个入口,并没有真正将其和的底层产品架构打通,我用一个词表述就是“像是透明胶粘上去的”。某种意义上,入口的作用被严重高估了,如果入口有用,腾讯当年做短视频,就会给微视在上加个入口。京东当年占据着九宫格的入口,结果和真正玩转底层的拼多多完全没法比。和给微视加一个入口相比,视频号有什么不同?核心在于它将的社交体系打通了,它成了一个真正融进去的原子组件,而现在无论是加入通讯录的元宝还是加入口的“AI搜索”DeepSeek,都没有和真正融为一体。这些看起来都是外围的战斗,都是一个个的小点,并没有连成线,也没有纳入核心功能的主线程。像是仅仅贴了一张告示——“内有AI”,而这非常不“张小龙”。我个人一个强烈感受是:从上面的动作中很难捕捉到张小龙产品哲学的影子,那么问题来了:什么原因造成了苹果和在AI层面的动作缓慢?三“隐私”是一个非常重要的答案。几乎所有科技公司都会说:“我们重视用户隐私”,对不少公司来说,这可能只是公关措辞的一部分。但苹果和有一点不一样——苹果以隐私和数据安全作为重要核心卖点,而作为IM工具的,业务模式决定了数据安全成为其生存的重要基石。这导致了一个根本的矛盾:AI的智能来自数据,这个数据既指海量的训练数据,也包括足够长、足够丰富的上下文。越牛X的AI需要越多的数据,而越强的隐私保护则意味着越少的数据共享。这条“钢丝”对于苹果和而言,走起来无比艰难。苹果的解决方式是“三驾马车”:1. 端侧模型,数据不离开iPhone;2. 私有云部署,发明了一套独有的、无比复杂的端到端加密系统(详情可参考B站UP主“林亦LYi”的相关视频),任务完成数据立马删除。3. 还搞不定的,直接让用户确认去问ChatGPT。而这么做是有代价的,端侧模型对性能的要求让iPhone15 Pro以下的机型无缘,同时导致了更大的功耗。即便这样,智能程度依然相当有限,高阶任务还得云端调第三方,而调用OpenAI的方式也在一定程度上牺牲了技术的主导权。四也是一样,我不相信张小龙没有思考过将AI和的社交核心功能结合起来,但隐私和数据安全是悬在头上的“达摩克利斯之剑”。让我们随便看两段的《服务协议》和《隐私保护指引》:关于小程序的数据收集描述关于聊天记录的数据收集描述可以看到,的确可以收集用户的很多行为数据进行分析,比如小程序、视频号等业务的相关数据。但有一条——“聊天记录”是高度敏感的数据,绝无可能直接拿去做训练。理解大模型训练原理的同学就会知道,无论数据传输、存储过程如何端到端加密,但训练前token化这一步毫无疑问得变回明文的“语言”。这是“语言模型”的内在训练要求,而这个泄露风险代价大概率无法承担。尽管到了今天这个技术阶段,聊天记录本身作为基座模型的训练语料价值其实极其有限(聊天数据逻辑单一且简单),但它是应用“上下文”的重要组成部分。没有它,主线程的AI产品相当于废了一只眼睛。因此,没有了云端聊天记录,无论是寻找端侧解决方案还是造数据进行后训练,都会增加社交主线程拥抱智能的难度。还有一些观点,认为还可以更进一步,发展更多“主动智能”,比如:1. 我最近聊天最频繁、且感情正向的10个好友,他们发的朋友圈在5个小时内自动点赞;2. 当我的好友连续发了两条“加班很累”的朋友圈,提醒我给他发送问候;3. 工作群里老板问工作进度,提醒我及时回复,且给出三个不同的回复话术选项;…….这种看似合理的想象首先在技术层面上对智能水平和上下文长度要求极高,而更重要的是,这种社交层面的动作会导致“智能的通货膨胀”。什么意思?假如真实现了上述的“智能”,那么你给我点赞了,我怎么知道是你主动点赞还是AI帮你点赞的?这种关乎核心社交的AI功能一旦推出,信任裂痕就会开始扩散,反而有可能被过度的“智能”反噬,而对社交认知极高的张小龙绝无可能让这种事发生。五但这并不意味着不能在现有层面做更多智能化尝试,提示词专家李继刚最近发了一条即刻:的确,要知道现在已经有“提醒”这个功能了,那么完全可以推出一个“智能版提醒”。以上其实是一个极简的例子,事实上,我们还可以再开一些可能的脑洞:现在长按之后会出现一些写死的常用功能,理论上这些常用功能也可以智能化。比如,任意界面长按呼出“AI”,根据页面内容在本地自动识别上下文,猜测用户的可能意图,智能推荐不同的动作。此外,今天几乎所有的生成式AI,其触发都是被动的,即需要用户主动做些动作才能给回应。而这种和用户交互极高的App,其实是可以做一些“主动智能”的尝试的,尽管这对智能上限、隐私方案和交互设计要求极高。从这个意义上,的AI其实才开了一个头,更武断的说法是:在AI这件事上,产品大神张小龙还没出手呢!现在的的散点AI、粘贴AI,只是龙哥在练手,这个谜一样的男人还在观察、在沉思、在憋大招。(关于擅长后发先至可参见我的另一篇分析长文《有一种罕见的细水长流的能力》)现在还是加法阶段,接下来才是乘法阶段。六什么是乘法?我们从腾讯Q1的财报电话会可以略窥一二——在前天晚上的腾讯电话会中,腾讯管理层在回答分析师提问时,几乎预告了版的Agent,原话是这样表述的:“在生态系统中,我们认为有机会创造出独特的Agent AI,这种AI能够深度整合生态的各种独特组件。这些组件包括社交图谱、通信和社区能力、内容生态,比如、视频号等,以及中存在的数百万个小程序,它们覆盖了各种信息流、交易操作,以及跨多个垂直领域的应用。这种Agent AI能够利用独特的社交、内容和服务体系,在不同场景下进行信息整合和操作执行,形成比通用型Agent AI更具差异化的产品。这种生态专属的Agent AI,与市场上其他更通用型的智能代理相比,具备独特竞争优势。”尽管没有给出时间表,但这个蓝图绘得务实而宏大,而这正是产品大神张小龙的手感舒适区。直观判断,版的Agent才是真正有张小龙气质的AI产品:没错,从“生成”到“行动”,由于有社交、内容、小程序生态,它某种意义上是一个类“操作系统”的存在。因此叫外卖、打车、订酒店、电商下单……都可以完全在内完成,而这给做“生活全能版Agent”提供了一个极大的想象空间。在我看来,现在的所谓通用AI Agent,主流场景是PC,主流人群是以生产力为核心的知识工作者,而这部分人在泛AI人群中的占比其实并不大。在这个阶段,如果说只有一个产品能让国内的Agent从PC场景到移动场景、从专业人群到大众人群,那这个产品大概率是。更重要的是,如果愿意提高其大模型的输入带宽,智能化程度上限大概率还会上一个大台阶。(具体分析见卫夕的另一篇长文《短期被高估、长期被低估——接入DeepSeek的冷思考》)七需要指出的是:腾讯电话会的表述是“我们认为有机会创造出……”,并没有说“我们即将推出”。这表明版Agent目前的进度还在很早期的阶段,至少现在没办法给出清晰的时间表。我预计,即便现在各家Agent如火如荼竞相发布,版的Agent大概率在未来两个季度之内不会推出。无独有偶,今年3月7日,Apple通过对Daring Fireball的声明承认,Apple Intelligence版的Siri增强功能(如跨应用操作能力)延期,计划在“未来一年”内推出。而Basic Apple Guy的分析指出,这些功能将被推迟到iOS 19及以后,暗示延期到2026年。可以看到一个事实——苹果和在主线程上拥抱AI的速度目前都不算快。而不够快的原因除了上述说的隐私和数据安全的掣肘之外,另一个重要原因在于——在技术路线层面,他们都选择了“应用优先”。换句话说,苹果和自身在模型训练层面都不去追逐“智能上限”。苹果本身多次被媒体报道在训练自己的模型,但从有限的信息来看,它们的目标并非冲击智能顶峰,而更多是通过小尺寸的模型匹配自身的功能。尽管有同属腾讯系的自研大模型混元,但二者并非同一事业群。尽管从招聘信息看,也在训练自己的模型,但我们可以从事业群的相关招聘岗位描述中直观判断,这个训练的中心大概率在“后训练”、“微调”等优化层面的工作。5月14日更新的招聘岗位描述我们今天很难用上帝视角判断这个策略从长期看是否明智,毕竟“洞悉自己的优势、做长自己的长板”在逻辑上是顺理成章的选择。但必须指出,二者同样得承受“拿来主义”所付出的成本——磨合节奏长、产品迭代缓慢。OK,总结一下,苹果和同属国民科技消费级产品,在拥抱AI的过程中由于两个核心原因导致了节奏平缓——第一是隐私和数据安全的掣肘,第二是“应用优先”的实用主义策略。结语OpenAI的SamAltman最近在接受红杉资本的采访的时候称:“The platonic ideal state is a very tiny reasoning model with a trillion tokens of context that you put your whole life into:Every conversation you’ve ever had in your life, every book you’ve ever read, every email you’ve ever read, everything you’ve ever looked at is in there.”“柏拉图式的理想状态是有一个非常小的推理模型,有一万亿个tokens的上下文,把你的一生都装进去,你生活中的每一次对话,你读过的每一本书,你读过的每封电子邮件,你看过的一切都在那里。”如果这真的是未来的图景,那么在靠近这个图景的过程中,至少在可见的时间内,苹果和都是绕不过去的两座大山。本文来自:卫夕指北 (ID:weixiads),作者:卫夕


  TOC