埃隆·马斯克:“即使外星人明天绑架了我,特斯拉也要解决掉自动驾驶问题。”
这句看似一句玩笑话,但也显露出了马斯克对于智驾上的决心以及信心。不得不承认,特斯拉 FSD 目前的智驾能力在全球范围内依旧是独一份的存在。
虽然在国内 FSD 如何落地,以何种方式落地还无从知晓,但在大洋彼岸的特斯拉已经大规模推送了「哪都能开」的 FSD V12.3。
这是特斯拉面向普通用户的一次重磅更新,带来的影响不止是海外社交平台上涌现的各种“民间短视频”,北美人们的热情还刮到了微博、微信等中文互联网社交平台上……
那么今天我们就根据 FSD V12.3 的一些体验视频,来看一看,聊一聊这“披”上了端到端大模型的 FSD 实力吧。
点到点?哪都能开?
「哪里都能开」、「点到点」的智驾体验真的做到了吗?
其实细想一下,你就会发现,国内造车新势力所宣传的「全国都能开」、「哪里都能开」、「点到点」的高阶智驾系统,目前似乎并没有真正做到所宣传那样的智驾体验。
按照字面意思来说,「点到点」、「哪里都能开」的智驾功能应该是可以随时随地可开启、起点到终点的全场景智驾行驶,其中包括出停车场、进停车场,或者是施工绕路这些特殊场景。
而目前国内的这些高阶智驾系统,面对这些场景的应对就不太完善了,比如说需要识别到车道线才能开启智驾功能,还无法自行驶出停车场等等。
而通过 YouTube 用户所展示的特斯拉 FSD V12.3 来看,特斯拉它们似乎正在解决这些特殊场景,或者说是完善整个点到点的智驾功能。
就例如下面这几个场景,FSD V12.3 在静止状态下直接从停车位上一键启动智驾功能并且自行驶出停车场。
其实这种场景在 FSD V12.3 的小视频里已经非常普遍了,几乎可以在无划线或者静止状态下随时开启智驾功能,这样也能更完善或者是提升智驾的体验。
不知道大家有没有尝试过,在一些划线不清晰或者车道线过宽的情况下,部分车企的智驾系统是难以开启的,即使一直连续拨杆(或者按键)都无济于事,这体验感就相对不好了。
接着说到驶出停车场这个场景,其实这个场景对于 FSD 以及是国内的一些高阶智驾系统来说,难度就在于没有地图底的情况下,如何找到入口?
事实来看,目前的确有点困难,不管是 FSD 还是国内的一些高阶智驾系统,依旧要依靠地图来实现正确的行驶路径。
而特斯拉的 FSD V12.3 虽然有了端到端的加持,但面对无图情况下,也会像无头苍蝇一样,无法理解停车场的标识,导致一直转圈圈或者是乱绕。
聊完起点,再聊一下终点。目前大多数高阶智驾系统,或者是是导航,它们对于终点的定义其实都是到达目的地附近就结束了,并没有完整地帮你驶入停车场,或者告诉具体的停车场位置。
当然,目前国内的一些高阶智驾系统已经可以实现特定停车场的驶入以及车位的泊入,但和上面所说的场景一样,需要依靠地图的加持。
而通过 FSD 体验视频来看,特斯拉 FSD V12.3 却做到了一些不同的效果,在无图的情况下,它会想办法无限接近你选择的目的地,并且会试图靠边停车。
靠边停车这个逻辑在 FSD V12.3 的小视频里也出现了许多次,它并不会一味地告诉你「行程即将结束,请接管车辆」,而是会在抵达目的地后进行靠边停车的操作。
似乎 FSD V12.3 已经可以实现更接近真实生活下的「智驾行为」。
说了那么多的起点和终点,那么中间过程 FSD V12.3 又怎么样呢?
面对常规的场景,包括红绿灯等待、无保护左转右转掉头、避让行人、对向会车等等,对于特斯拉 FSD V12.3 来说已经没什么难度了。
更多的是在这个「中间过程」减少断点的存在和减少接管的次数,让通行效率更高。
就例如下面这个施工封路的场景,正常情况下智驾功能都会请求接管,从而停止智驾工作。但 FSD V12.3 却尝试进行绕路的动作,虽然没有成功,但这个操作确实实现了更拟人化的行为。
再说下面这个掉头的场景,从正常逻辑来说,城区 NOA 的逻辑应该是地图导航位于路线规划的最高优先级,但 FSD V12.3 却似乎违背了这一点,选择了一条更优的左转路线抵达目的地。
在没有更近一步说明的情况下,我们尚无法根据这种行为做出更深层次的分析,或是神经网络的作用,又或是一个巧合走错了路,但这一“小视频”的出现却实实在在给我们看到了惊喜点。
还有窄路会车的时候,对向车辆做出让道的动作后,FSD V12.3 似乎明白了这个道理,立马就做出了行进的动作。
再面对特殊的对向施工路段场景,能够理解(不再遵循底层的安全规则:双黄线不能变道)并且做出跨车道的动作,随后完成原车道的并入。
对于 FSD V12.3 的小视频还有许多,这里就不一一赘述了。
从以上的体验视频以及小视频来看,FSD 从 V12.3 开始,显然已经不再局限于「能用」和「好用」的阶段,而是慢慢开始跨入「要用」的门槛。
更少断点、更加拟人化的体验、更多能处理的场景、更加完善的智驾行程,不得不承认的是,特斯拉还是走在了智驾浪潮的前段。
未来智驾的可能性
回过头看看,不管是特斯拉,还是国内的一些高阶智驾系统,在这近两年的时间里,其实不知不觉中处于在了一个迷茫困惑的阶段。
多融合传感器方案?纯视觉方案?不管在硬件上如何切换,但智驾体验上却一直卡在 「能用」和「好用」之间,难以实现飞跃式的进步。
马斯克曾也表示过:“自动驾驶技术是一个难题。”
即使特斯拉也是如此,在 FSD V12 之前,特斯拉一直依赖于规则判断,任何一个行为都有规则和条件判断代码,凭借特斯拉工程师们手动编写的数十万行 C++ 代码来应对各种情况。
不仅仅是特斯拉,传统自动驾驶模型中,规则的占也是比较高的一部分,想要提升模型性能,就需要大量优秀的工程师编写巨量的规则代码,模型的上限也取决于规则代码的质量。
而这样持续做下去的最终结果,可能也只能达到「好用」而无法突破「要用」的阶段。
面对这种情况,特斯拉也终于大手一挥抛弃了以往依赖于手动编码规则和机器学习模型的方法,转而全面采用端到端的神经网络。
也是在特斯拉 FSD V12.3.3 的版本当中正式提出了 FSD V12 的概念:城区智驾的堆栈已经升级为单一的端到端神经网络,而接近 30 万行 C++ 代码已经由经过数百万个视频片段的训练替代。
特斯拉 FSD 的端到端方案,本质上是将上千万个甚至上亿个视频片段中,包含人类驾驶的习惯压缩到了端到端神经网络的参数里。(具体详解可前往:AI 狂人的特斯拉端到端 会是下一个智驾风口吗? )
神经网络就像一个人类的大脑,它能自己以 AI 的方式去思考,遇到场景直接输入传感器数据,输出转向、制动和加速信号,而且这个过程中没有任何编码。
与其说是端到端,更不如说是特斯拉以端到端的算法变革,转向类似于 OpenAI 旗下 GPT 这样的大模型思维。
而这一行为,从体验视频来看,的确也让特斯拉取得了不少的突破。
与此同时,端到端的热潮也席卷了国内智驾圈,什么 BEV、Transformer、Occupancy 占用网络成为了业内热词,各大头部车企也开始向上发力。
不得不否认,端到端的方案确实给到了智驾圈一个新的解法,而这个解法即使不是智驾未来最终的方案,但至少让目前面对一些 corner case,也就是极端场景下,不再需要工程师们做苦力活,用庞大的数据代码去做支撑,而是让整个过程更轻松一些。
最后,我也期待端到端的方案能够给智驾圈带来一个全新的体验,不仅是「好用」,更是「要用」,也要更安全的「用」。
最近使用
我的收藏
大家上传的表情
最近使用
所有表情
暂无相关评论
发表一下个人看法吧