{{detailStore.author.is_follow?'已关注':'关注'}}
新出行深度|对话周光 智能驾驶现在只是GPT2 GPT2-GPT4才是暴涨期
新出行原创 · 精品文章

元戎首个量产项目从定点到 SOP 只有 8 个月,同时第一个版本实际已经实现全国都可开的无图端到端能力。

作为量产端到端头部企业之一,元戎启行的关注度在今年尤为突出。

而创始人周光对技术发展的路径预判也都很准确。从看到 L4 的技术问题切换赛道,再到无图化技术架构的切换,再到如今走向量产端到端,每一步都踩准了行业关键技术的浪潮。

周光提到元戎公司的理念就是 build AGI for robots, for physical world,所有公司的技术发展的优先级就是要做一个通用 AI ,这是公司的使命。

而未来 AI 的趋势就是往通用化,周光认为未来没有区别都是为 physical AI,不需要去细分无人驾驶、机器人具身。

在人才架构上,周光认为不同公司实际就决定了人才体系、人才理念不一样,特别是 AI 人才。在人工智能时代对 AI 的追求绝对是极致的,而这样的人才其实数量并不多。

过去 1.0 时代是靠人看数据,再归纳总结出规律,规律就是算法。现在人工智能 2.0 时代是靠机器看数据,然后统计出详细的分布,更多的资源是在算力、数据上。端到端到来后一家公司可以根据业务量增加业务人才,但核心人才不需要那么多。

而技术的发展、扩散实际也与市场需求存在关系,周光认为国内智能驾驶市场对于元戎而言是 lucky enough。

如果你存在技术领先性,但遇到了技术暴涨期跟市场暴涨期不匹配时候,会非常惨。但今天的中国消费者已经证明了会因为有好用的智驾用户就会买智能电动汽车,反观欧美市场看,特斯拉体验再好但欧美市场还没有意识到智能驾驶的意义。

对国内智能驾驶的判断,周光认为现在只是 GPT2 的水平,即使端到端的到来也只是一个开始,就是相当于“重启一下”。GPT2- GPT3.5再到 GPT4 会是暴涨期,也是未来两三年的事,但 GPT4- GPT5 可能不一定还是暴涨期,后面有个停滞期。

在合作模式上,周光认为端到端后和车企合作最大的变化是从过去的分模块化到如今没法拆。

但企业提供的解决方案更加综合,需要有多维度数据模型、量产经验以及工程化能力等。相比数十万上百万台的数据,周光提到目前元戎只用了市场上千分之一的数据达到目前的体验效果,也证明了系统的 scaling 上限更高,如果用上目前市场主机厂体系的数据量,周光认为元戎会是特斯拉的水平。

在技术预判看,周光提到未来三年芯片的发展基本是明确的,所以现在喊口号已经失去意义。所以过去通过预埋硬件再选择软件算法可能不可行,即使预埋了 Thor 也不一定能够达到全国都可开的能力。需要先知道你的软件方案再定义芯片。

在接下来竞争中周光认为就是万米跑,但是赛道是 400 米一圈,别人只要超过你一圈你就很难追得上,就被淘汰,现在的局面是高速竞争期而不是稳定期。

以下为新出行深度与元戎启行创始人元戎启行创始人兼 CEO 周光 对话,经编辑:

一、无图化、端到端 元戎如何做技术预判?

新出行深度:我们很早就做了无图化、端到端的技术路径?

AI 需要数据、也需要量产,才有后面我们一系列的做无图、端到端这些决策,这其实是公司理念上的追求。我觉得是整个公司的经营理念是 build AGI for robots, for physical world 这一点。

而且这也是看哪个是你的 priority(优先级)?我觉得我们公司的第一 priority 是技术追求,我们希望能做出一个通用的物理AI。这也是我们整体的布局,我们所有公司的决策也都是基于此。

还有就是我们整个的人才体系、人才理念我觉得都不太一样,跟其他公司不太一样。

新出行:现在市场三种人才,工程化、算法以及AI人才,你认为哪个更重要?

其实你要做好这个事我觉得三种人才都得有。但是谁lead这个公司?这是不一样的。

我认为长期来说它一定是第三种人才,因为毕竟这个时代是人工智能的时代,你对 AI 的追求一定是极致的,反而是其他的因为产业链很成熟。我也可以去从市场上招聘到。AI 未来两三年的迭代会更快。现在很多算法迭代都比较小。甚至很多已经不迭代。

新出行深度:像我们这代 AI 人才出来的很早?大家似乎分散在各个行业,我们一路又是如何面临不同的选择的?

像我们这代人可能就是原生 AI 背景出来的最早的一代了,也是最老的了。

因为在我们之前可能基本上也都没有参与过这事,像我们这种 12 年之前毕业的,我们自己的这个愿景,是能够做出一个牛的事儿,能做出通用AI,再加上我们的核心团队有技术判断,我们能够做一些长期的选择。

当我们看到 L4 这条路可能有问题的时候,我们就很快就没有做 L4 了。我们认为哪怕最终是要做 Robotaxi,它也不是靠规则、靠地图来做。

二、首个量产项目,耗时 8 个月

新出行:我们第一个项目开发时间多长?

从立项到 SOP 只有 8 个月,而且是直接一步到位全国都可开。

新出行深度:端到端的到来后,和车企的合作模式上是否会有变化?

以前分模块化的。端到端到来的话,我觉得第一来说它就没法拆,你要硬拆体验就会很差。以后可能车企合作会更紧密。

新出行深度:包括数据吗?

对,包括多维度的数据模型、量产经验、工程化能力都很重要。但工程化能力你通过一两个项目,也能帮你补齐。

新出行深度:相比自研方案,我们如何解决数据量少的问题?

我们与车企深度合作,大量训练数据来源于车企客户提供的脱敏数据。

虽然数据量对比一些同行较少,但最后的行车表现却不输同行。我们也和竞品做过很多对比测评,在复杂、狭窄的城市路段,我们系统的博弈能力更灵活,对微小障碍物的识别更精准,我觉得还是很不容易的,这证明我们系统的 scaling 上限更高。 

新出行深度:那这就意味着我们对于数据的抓取的精准度更高?

不止是数据的抓取,还有数据的利用率,以及模型利用率、精准度,模型能不能学到都有关系。

新出行深度:如果我们也用上十万级的车辆数据,效果会怎么样?

我觉得如果我们上了这种规模的数据,我们应该就是特斯拉的水平。

三、端到端后,对人才架构的影响

新出行深度:我们现在有多少人员规模?

超过600人。

新出行深度:端到端后,对未来人才架构有哪些影响?

我觉得其实肯定不会像以前那种动辄几千人的这种团队,这种团队肯定是有问题的。

你可能根据你的业务量可以去增加,但是你的核心的不应该是那么多。

因为你原本是人去看数据,然后归纳出这些规律出来,其实规律就是算法,现在正在发生的人工智能2.0,是靠机器去看数据,然后统计出来它详细的分布,应该是更多的资源是花在算力、数据上。

当然也不是那么简单,不是说买几个服务器就做出来了,你有服务器、存储只是一个必要条件,但不充分,我觉得未来两年的发展会更快。

四、端到端现在只是 GPT2 ,接下来是爆发期

新出行深度:如何看现在大家对端到端的定义有很大不同,有分段式也有one model?

在我们看来整个的定义是全程可求导,就是说你的输入输出是可求导的。

但 anyway 我们不多评价,大家都可以有新的定义。前融合还有中融合、后融合还有全融合,现在比如说 GPT 还可以定义有前 GPT、后 GPT、全 GPT。这个问题不需要讨论。

新出行深度:有些车企对智能化的理解可能会结合底盘、架构、电动化思考,这会是未来自动驾驶的方向吗?比如爆胎后的处理?

可能你 2 万公里爆一次胎,但自动驾驶现在的 MPI(每干预一次行驶的英里数) 远远低于2万,我觉得这不是目前主要 focus 的一个问题,因为投入大,产出小。

如果有一天爆胎已经成为导致智能驾驶接管的主要因素时,你放资源去干,我觉得回报会更大。这是我的一个看法。

因为事情它分几类,重要紧急、重要不紧急、不重要不紧急,不重要紧急。有些事情肯定是不重要不紧急的。

新出行深度:如果类比 GPT ,现在端到端你觉得会在哪个阶段?

前几天正好有一个同行跟我们在谈,他说技术扩散,我说技术肯定会扩散,没有任何技术是不扩散的,这个未来两年一定会发生的,甚至有可能未来技术迭代的速度快于扩散速度。

今天整个自动驾驶我觉得就属于 GPT2 的水平,GPT2 到 3.5 再到 4 的暴涨期就是未来两三年的车,但你说它 4- 5 可能不一定还是暴涨期。后面是有个停滞期的,现在是暴涨期,未来两三年都会处于一个暴涨期。

这对我们来说是 lucky enough。因为我们的技术领先,即将迎来技术扩散期与市场的暴涨期。

那如果遇到了技术暴涨期跟市场暴涨期不匹配时候,是很惨的。今天的中国消费者已经证明了,会因为用了好用的智驾,可以去买更多的车,说到底这就是技术跟市场同比成长。

你看看现在在欧美市场,特斯拉的东西好,但跟进的也并不多。

因为说实话可能市场上还没意识到智能驾驶的意义。因为在一些发达国家,高速路、快速路布局发达,又不堵车,我还是很想开车的,因为你有这个愉悦感。在国内开车,道路状况比较复杂,很难一直有这种愉悦感。

新出行深度:所以类比 GPT2 ,你认为端到端只是一个基础的开始?

对,不是一个结束,而只是一个开始,就是重启一下。

新出行深度:端到端的到来它到底是过去技术的一个平替,还是说它就是一个兜底信息?比如它就是为了解决那规则外的5%?

端到端是去冲上限,下限还是拿传统的规则来保,就是rule base兜个底,甚至rule base都可以往 AI 进化,因为小模型它是可确定的,它的上限灵活也可以更拟人。更高的上限能处理更多case。

新出行深度:对,其实端到端下限其实上也是一个比较重要的话题。

对,下限就是其实也就是 safety 的事情,你需要去保障安全,其他时候就不应该去限制。

新出行深度:那我们去怎么去保证它下限不要太低?

其实 AEB 也是一种AI safety,只不过它是前向的AI safety。

五、算法平台决定上限 Orin 还有深挖空间

新出行深度:接下来硬件、算法哪个迭代更快?

芯片是比较明确的比如 Orin ,而且 Orin 的平替也有很多。然后 Thor 也是确定的,这个芯片其实在未来的三年是确定的。

其次是软件,今天的算法就根本都没有把硬件的性能榨干了。你想想 Orin 出来快 4 年了,到今天也没有榨干。

新出行深度:现在 Orin 的可用率会有多少?

每家都不一样,我觉得 Orin 还可以继续深挖的,还有空间。

新出行深度:我觉得这个因为你之前也提过,就是说超过我一个数量级的算力,实际上它就不会有太大的优化可能。

其实跟你的算法息息相关。你属于算法的哪一代,对吧?你可能用一堆芯片的意义不大。

比如说你打一个普通游戏,你装个 2080 跟 4080 是没有区别。但是你今天的时候打黑悟空?你可能 2080 跟 4090 区别就很大,这个是你的架构决定。

比如说你装高精地图,你用J5就行了,你跑高精地图的代码,你用 TDA4 也行。你为啥非要上 Orin 呢?

新出行深度:单 Orin 为什么也能做端到端?短期会不会不够用?

因为一个模型它不太可能跑两个芯片量,现在 Orin 之间的芯片通信只有 10 G,一个模型不太可能跑在两个芯片。

因为之前大部分设计双Orin方案,都是为了当时模块化。这里放一点,那里放一点。不一样的需求跑在两个芯片上。所以只有模块化才能跑到两个芯片上。所以说为什么四颗 Orin 跟 Thor 不一样,1000TOPS 就等于 Thor 吗?不可能。

新出行深度:现阶段,预埋硬件是否还有必要性?

过去你可以喊口号,但现在不是的,现在你在喊人口号没有用,预埋几个 Orin 就代表着你能够全国都能开?可能预埋 Thor 也不一定。

它不是一个等号,我觉得现在就是这样,你首先得要知道你的软件方案,再去定义芯片,不要反过来,反过来选不work。

新出行深度:那接下来,大模型是否会有对芯片需求有不一样的变化?

我觉得未来几年会发展得很快。因为今天端到端它还不是大模型,它还是很小的。

所以我就说现在的智能驾驶是 GPT2 ,至少会比之前两到三年的进展更快,竞争也更激烈。你可以认为,这是一个万米跑比赛,赛道是 400 米一圈,别人只要超过你一圈,你就会被甩开了,就被淘汰。

新出行深度:你觉得这个的淘汰赛会在哪个时间段会到?

未来两三年。我觉得今年已经开始有了,现在属于是高速竞争期,不是稳定期。

今天很多大牛都是物理数学背景,基本上没有纯编程的。编程跟 AI 这是两个概念,曾经可能大家觉得在编程比赛拿金牌的是 AI 高手,其实现在都知道这是完全不同。

因为我们今天都还是属于在经典力学框架里面的,对吧?相对论对对做 AI 没有帮助,量子力学对做 AI 基本上也没什么帮助。

所以我们现在也觉得说很大一部分的传统车企进入到新的赛道当中,他的整个技术架构、所有的人才背景其实都要经过一大轮的洗盘,而且市场也没有那么多人才,也不一定会给你这个时间。

六、激光雷达会是必须项吗?

新出行深度:如何看接下来对激光雷达的需求?是否是必选项?

人工智能就应该越来越像人,是可以不通过这种距离传感器就能做好的,而且很安全, AI 的能力就应该越来越靠近人。

但今天的 AI 跟人还是有一定差距的,你看一下今天比较有代表性的GPT,它能够考上 985 了,但是对比顶尖的人才还是要差的。

新出行深度:所以短期来说,你觉得激光雷达还是有必要的?

因为今天的 AI 不够, not good enough。从 AI 层面分析,长期我觉得不是必要的,但是在现在这个阶段还是很有帮助。

七、端到端的未来是通用 AI

新出行深度:从明年的整个技术路径来看,成本会不会成为一个重要因素?

成本很重要。毕竟现在国内这么卷。但也不能说只卷成本不卷质量。

芯片成本我觉得肯定会降下来,因为芯片都有黄氏定律,每一年还是每两年便宜一半,这个不用去管。激光雷达这些你根据你的情况去选择,要还是不要。

新出行深度:那我们会做 Robotaxi 吗?

Robotaxi 是一个 business model ,L4 是个技术路线,让自动驾驶承担网约车的工作,这商业模式非常健康。L4不等于不需要 Robotaxi。

Robotaxi 没有理由不做。只是唯一的路线,就是靠端到端去实现 Robotaxi,而不是看地图、画地图,那就是 Demo。

新出行深度:那机器人呢?

我觉得端到端是给了一个 universal 的 solution for robotics and autonomous driving,是通用的。

而且不需要去细分无人驾驶、机器人具身,它都是 physical AI,就跟语言模型一样。GPT能做律师,也能做数学,也能做语文,对不对?

难道他就 GPT 就只能干一件事?不是的,现在的趋势就是往通用走,没有区别的,都是为 physical AI。我们将是第一个有大量数据的 physical AI 公司。

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • 举报
  • 加入黑名单
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{digest?'撤销精华':'设为精华'}}
回到顶部