12月11日 ,小鹏汽车董事长何小鹏发文称,小鹏汽车的VLA 2.0(Vision-Language-Action,视觉语言动作模型)将在下个季度发布,“因为是第一个版本 ,所以压力很大 ” 。
此外,何小鹏还与公司自动驾驶团队立下特别“赌约”:若2026年8月30日前,小鹏VLA系统在国内达到特斯拉FSD V14.2版本在硅谷的整体效果 ,他将在硅谷筹建特色中国风味食堂。反之,自动驾驶负责人需在金门大桥完成裸跑挑战。
图片来源:新浪微博
就在前一天,理想汽车自动驾驶研发高级副总裁郎咸朋在社交平台发布长文 ,回应宇树科技创始人王兴兴此前对VLA模型的质疑。
“我跟王兴兴观点最不一样的地方在于,他认为模型架构更重要,但我认为模型的关键是要与整个具身智能系统适配 。在此基础上 ,数据是起决定意义的。”郎咸朋认为,“VLA就是自动驾驶最好的模型方案。”
图片来源:新浪微博
近几年,辅助驾驶行业经历了多次“技术底座 ”的范式迁移——从企业普遍把激光雷达+高精地图奉为“黄金组合” ,到引入BEV(鸟瞰图)+Transformer摆脱高精度地图,再到端到端将辅助驾驶带入AI时代,企业普遍按照这个路径来推进辅助驾驶功能 。
但进入2025年,行业在辅助驾驶的发展方向上出现了VLA与世界模型的“分歧” ,而理想与小鹏就是选择VLA方案的代表。
两技术派别“各执一词 ”
据了解,VLA被业内视为端到端方案的“智能增强版”。其名称中的V代表视觉感知(Vision),A代表动作执行(Action) ,而中间的L则是大语言模型(Language Model) 。V负责实时感知环境,A负责输出具体控制指令,L则像“中台”一样 ,把感知信息转译为可供A执行的规划与决策。
清华大学车辆与运载学院助理研究员颜宏伟表示:“VLA是多模态大模型驱动的智能体架构,其核心突破在于引入思维链,通过语言模型实现对环境理解与决策推理的可解释性。 ”
“VLA模型融合了语言模型 ,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联 、分析 ,从而推理出因果关系 。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。”元戎启行CEO周光认为。
不过 ,王兴兴在今年8月的一次演讲中则表示:“我个人对VLA模型还是保持比较怀疑的态度 。”在他看来,VLA模型是一个相对比较傻瓜式的架构,在和真实世界交互时 ,它的数据质量、能采集的数据是不太够用的。
郎咸朋则认为,空谈架构不如看疗效。在自动驾驶领域,脱离了海量真实数据谈模型架构都是空中楼阁 ,“我们之所以坚持VLA,是因为我们拥有数百万辆车构建的数据闭环,这让我们能在当前算力下 ,把驾驶水平做到接近人类 ”。
图片来源:理想汽车官网
郎咸朋称,要想做好自动驾驶,必须先把自动驾驶当作完整的具身智能系统对待 ,每一部分在研发过程中要相互配合才能将价值发挥出来 。此外,他还认为,模型的关键是要与整个具身智能系统适配,在此基础上 ,数据是起决定意义的。在机器人领域获取数据相对困难,但在自动驾驶领域,特别是建立起数据闭环能力的车企来说并不是大问题。
尽管郎咸朋表明了机器人领域与汽车领域有别 ,车企搭建数据闭环并非难事,仍有一些汽车背景的公司并未踏上VLA这条路径 。比如,华为智能汽车解决方案BU CEO靳玉志就表示:“我们不会走向VLA的路径。这样的路径看似取巧 ,其实并不是走向真正自动驾驶的路径。”
“华为更看重WA(世界行为模型),也就是World Action,中间省掉Language这个环节……直接通过Vision这样的信息输入控车 ,而不是把各种各样的信息转成语言,再通过语言大模型来控制车 。”靳玉志进一步解释称,华为乾崑自研的WEWA架构包含云端的世界引擎(WE)与车端的世界行为模型(WA)。其中 ,WE负责海量数据训练与场景生成,WA则实现车端的实时环境推理与拟人化决策。
据悉,“世界模型 ”源自人类对环境的认知机制,指的是AI系统通过感知数据构建一个对物理世界的内部模拟 ,从而具备预测、推理和生成合理行为链的能力 。在辅助驾驶中,它不再只是“看见”世界,而是理解世界 ,预测未来可能发生的情况,并提前做出决策。例如,它不仅能识别前方有一辆自行车 ,还能预测它是否会突然变道,从而提前减速或避让。
除华为外,蔚来、商汤等企业也都在此技术路线上进行布局 。
VLA与世界模型未来有望深度融合
需要注意的是 ,尽管不同企业对于VLA和世界模型两种技术“各执一词”,但两者并不矛盾。
国海证券在研报中表示:“VLA与世界模型在技术上并非同级或对立关系。我们将发展路径分为两派,实质上是产业玩家在实现端到端能力之后 ,在能力优化侧重点上出现了分化。”
“双方技术融合趋势明显,双方均在向对方领域渗透 。例如,VLA 引入强化学习与仿真优化动作生成。 ”国海证券表示。
理想汽车董事长李想在去年底的直播中也提到,VLA可以拆解为预训练 、后训练和强化学习三个层面 。强化学习中最重要的一步就是在世界模型里闭环学习 ,引入舒适度、碰撞、交通规则等规则来打磨 、反馈,让VLA比人类开得更好。
“世界模型的高算力需求(训练和推理都是)决定了它更适合在云端做数据生成和极度逼真的仿真测试和强化训练,这也是理想目前正在做的。”郎咸朋说 。
小马智行CTO楼天城则表示:“我了解大部分公司两种技术都用 ,比如Waymo也用了谷歌Gemini大语言模型。世界模型和VLA模型不是一个维度的东西,而是交错的。这两个东西不矛盾、不冲突,机器人领域非常多 。我认为想要做百辆无人车以上 ,世界模型最关键。对其他公司(而言),可能做VLA模型卖车最关键。大家选择不同的路线是因为目标不同 。”
值得一提的是,既向C端卖车 ,又计划推出Robotaxi的小鹏,有将两种技术融合的趋势。在11月5日的2025 AI DAY小鹏科技日上,小鹏汽车正式发布了第二代VLA。第一代VLA的方案是V到L再到A ,第二代VLA是V+L到A,也就是把L转移到了输入端。
图片来源:小鹏汽车官网
“第一代VLA模型中间涉及两次语言转换,这会带来大量信息损耗,比如一段1200多字的文字描述也无法精准地‘翻译’一个十几秒的视频 ,而以视觉为核心,则把模型看到的世界直接转换成运动轨迹 。 ”何小鹏说。
11月7日的上海进博会上,小鹏汽车自动驾驶产品高级总监袁婷婷分享了她对小鹏二代VLA架构的理解:“小鹏的二代VLA既是VLA模型 ,也是世界模型。”
在其展示的PPT中,世界模型是作为二代VLA的一个记录器存在的:当V和L作出车辆运动轨迹和动作决策时,这个决策会被记录到世界模型中;同时 ,与这个决策一同被记录的,还有决策前的车辆状态,即V和L形成的感知信号 。也就是说 ,小鹏二代VLA在用其VLA数据训练世界模型。
在小米汽车主任科学家陈龙看来:“一个管‘抽象思考’,一个管‘物理感知’,完全没必要拉踩!VLA+WM的结合 ,才是通往更强通用具身智能。”
对于辅助驾驶底层技术的演进,国元证券方面认为,未来,VLA与世界模型的深度融合 ,有望成为高阶智驾系统实现类人驾驶决策能力的关键拐点 。
长安汽车智能驾驶高级总工程师则表示,在未来2至3年内,辅助驾驶的技术架构还将迎来1至2轮迭代 ,到2028年有望收敛至相对稳定的状态。
(文章来源:每日经济新闻)
手机炒股怎么加杠杆:如何办理网上股票开户-我国心脑血管患者已超3.3亿 疾病防治知多少 ?这场会议给出答案
如何利用杠杆原理炒股:股票开户资金账户是什么意思-宇树科技创始人王兴兴:AI大规模爆发性增长的时代还未到来
股票利息:炒股票新手如何开户网上开户-巴菲特清仓!比亚迪回应 国内重要汽车股业绩一览
企业回购公司股票价格:如何办理网上股票开户股票开户-潘功胜、李云泽、吴清、朱鹤新同日发声 信号巨大
十大炒股杠杆平台排名:买股票如何网上开户-已组建筹备组、预计8月落地 “新长安集团”呼之欲出
股票投资新手怎么炒股:网上买股票开户流程-“高位股”巨震 常山药业跌停!固态电池迎密集利好催化 杠杆资金加仓多股
联丰优配-联丰优配平台-配资一流股票配资门户提示:文章来自网络,不代表本站观点。
联丰优配-联丰优配平台-配资一流股票配资门户㉖投资者在参与股票配资时,应了解并熟悉平台所提供的投资工具,如杠杆、止损单等,以便更好地控制风险。
9月12日,厦门证监局公布了一则行政处罚决定书,揭穿了一桩利用内幕信息违规交易上市公司股票的案件。 当事人楼某民,...
3月24日,业内权威专家表示,MLF(中期借贷便利)不再有统一的中标利率,标志着MLF利率的政策属性完全退出。3月24日...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
2025年3月24日下午三点A股收盘后,港股科技板块持续走强至四点十分收盘。消息面上,一方面美元相对于人民币连续3个交易...
记者闫桂花 王珍中国社会科学院学部委员、中国社会科学院原副院长高培勇周日在“中国发展高层论坛2025年...
当地时间3月11日,美国白宫贸易顾问纳瓦罗表示,12日不会对加拿大钢铝产品征收50%的关税。当天早些时候,加拿大...
记者辛圆给补贴、建平台,为了吸引更多高层次人才,各地纷纷放出“大招”。据央广网周一发布消息,湖...
界面新闻记者|陈靖国元证券(000728.SZ)投行动荡不断。近日,上交所接连发布三张罚单,揭开了安...
日本30年期国债收益率升至2006年以来最高水平。...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
记者|张乔遇骑行热潮的兴起,直接带动了自行车及相关装备市场的火爆。去年以来,自行车尤其是高端自行车以及相...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
界面新闻记者|龙力开年两个多月,不少头部量化私募都在积极“上新”。Wind数据显示,截至3月17日,...
3月24日,海洋王照明科技股份有限公司(以下简称“海洋王”,002724.SZ)早盘一字跌停,此后股价拉涨,尾盘封涨停板...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...