【小哈划重点:特斯拉此次无人驾驶交付的成功,离不开其最新的HW5.0硬件平台的强力支撑。该平台在传感器配置和计算能力上都实现了跨越式升级。 在传感器方面,特斯拉构建了一套精密且全面的感知系统。】
2025年6月28日,第一辆完全自动驾驶的特斯拉Model Y自己从工厂开到客户家完成交付,比原计划提前了一天!整个过程包括高速公路行驶在内的跨城镇运输,全程实现无人驾驶(没有远程安全员)!
“车内完全没有人,且在任何时候都没有远程操作员进行控制。”从某种意义上说,特斯拉的完全自动驾驶(FSD)和机器人出租车项目也能够做到这一点,只是特斯拉没有信心它们能够长时间足够可靠地运行,从而无需人工监管。而这一次model Y的自主交付,穿越整个城市,最高时速达到116 km/h,总路程约24公里(30 minutes,可见全程还是低速为主),成功抵达车主家中,整个过程无需任何人类干预。这一事件标志着自动驾驶技术的重大突破。
01
HW5.0硬件平台:构建自动驾驶的感知与运算基石
特斯拉此次无人驾驶交付的成功,离不开其最新的HW5.0硬件平台的强力支撑。该平台在传感器配置和计算能力上都实现了跨越式升级。
在传感器方面,特斯拉构建了一套精密且全面的感知系统。12颗高清摄像头覆盖车辆360度视角,探测距离可达250米,能够精准捕捉道路上的各种细节,包括远处的交通标志、周围车辆的行驶状态以及行人的动作。为应对复杂天气状况,这些摄像头采用了三星定制的“耐候镜头”,内置加热元件可以在一分钟内快速融化冰雪,疏水涂层则能有效提升在雨天或雾天的透光率,确保摄像头始终保持清晰的视野。此外,4颗4D毫米波雷达和超声波传感器与摄像头相互配合,形成了多传感器融合的感知矩阵。毫米波雷达不受光线和天气影响,能够实时探测车辆周围物体的距离、速度和角度,超声波传感器则在近距离感知和泊车场景中发挥重要作用。
计算能力上,HW5.0平台配备了Dojo超级计算机,其算力达到了1.1 EFLOPS,是前代产品的5倍之多。如此强大的算力,使得系统能够每秒处理250亿像素的数据,为复杂的神经网络运算提供了坚实保障。无论是4D环境建模,还是实时路径规划,都能快速且准确地完成,确保车辆在行驶过程中做出及时、合理的决策。同时,平台采用的冗余设计也极大提升了系统的可靠性,双独立计算单元具备0.3毫秒自动切换能力,即使其中一个单元出现故障,另一个单元也能迅速接管,保证车辆行驶的安全性和稳定性。
EFLOPS是浮点算力单位,适用于需要高精度计算的场景(如科学模拟、AI训练)。
TOPS是操作次数单位,侧重低精度整数运算,常见于边缘设备(如自动驾驶芯片、手机NPU)。
如果硬要换算一下,1 EFLOPS = 10^6 TOPS,但实际转换需考虑精度差异:若硬件支持混合精度(如FP16+INT8),这个换算仅是理论峰值,而且实际效率还受内存带宽限制。
还需要说明的是Dojo是一个计算系统架构,也被称为超级计算机架构,可以组合扩展的(所谓scalable),它的核心芯片是D1。在特斯拉引领的自动驾驶技术变革浪潮中,Dojo扮演着举足轻重的角色,它不仅是特斯拉AI战略的核心驱动力,更是其在硬件层面实现突破的关键标志。但严格来说,Dojo一个集计算、网络、输入 / 输出(I/O)芯片,指令集架构(ISA)、电源传输、封装和冷却于一体的超级计算架构。它专为大规模运行定制的机器学习训练算法而设计,致力于为特斯拉的自动驾驶技术以及其他AI应用提供前所未有的强大算力支持。
图 Dojo的堆叠式组合架构,可以组合扩展
Dojo架构的核心组件之一是D1芯片。这颗由特斯拉自主研发、基于台积电7纳米工艺打造的芯片,集成了多达500亿个晶体管。每颗D1芯片内包含354个定制的64位RISC-V内核,每个内核配备1.25MB的SRAM,用于存储数据和指令,这使得D1芯片在处理AI相关运算时具备高效的数据读取与存储能力。从性能参数上看,在400W的TDP(热设计功耗)下,单个D1芯片能够实现22.6 TFLOPS的FP32(单精度浮点运算)性能。
图 D1芯片,Dojo的基本tile(瓦片)
为了进一步提升算力,特斯拉采用独特的设计方式,将25颗D1芯片以5×5的集群形式进行组织,运用台积电的晶圆上系统技术(InFO_SoW)进行封装。这种封装技术实现了芯片间极低的延迟和极高的带宽,使得大量的计算得以高效集成。由25颗D1芯片组成的一个训练模组,在15千瓦的液冷封装下,能够达到556TFLOPS的FP32性能,且每个模组配备11GB的SRAM,并通过9TB/s的结构连接。
Dojo超级计算架构通过将多个这样的训练模组进一步组合,构建出更庞大的计算集群。例如,120个训练模组组成一组ExaPOD计算集群,其中共计包含3000颗D1芯片,展现出惊人的算力规模。在实际应用中,这种强大的算力让Dojo能够对海量的视频数据进行高效处理,如每天处理23.2万帧视频,助力特斯拉不断优化神经网络模型,提升交通灯识别、自动泊车等功能的准确性和稳定性。
而作为Dojo元件的D1芯片本身也表现不俗。
图 Tesla FSD V12架构图,“99%都是神经网络”
03
数据与训练:海量数据驱动的智能进化
数据是自动驾驶技术发展的核心驱动力,特斯拉在这方面拥有巨大的优势。其全球车队积累了超过120亿英里的真实驾驶数据,这些数据涵盖了各种道路条件、天气状况和驾驶场景,为算法的训练提供了丰富的素材。同时,特斯拉还通过仿真平台生成大量的合成数据,模拟现实中难以遇到的极端场景,如突发的自然灾害、罕见的交通事故现场等,进一步扩充训练数据的多样性,帮助系统更好地应对各种边缘情况。
Dojo超级计算机在数据处理和模型训练中发挥着关键作用。凭借88.5 EFLOPS的总算力(单个Dojo训练模块(含3000颗D1芯片)算力为1.1 EFLOPS(每秒1.1×10^18次浮点运算),Dojo超级计算机是多个训练模块组成,可以参见https://www.slashgear.com/1516714/what-to-know-about-tesla-dojo-supercomputer/),Dojo能够对海量的视频数据进行高效处理。例如,它可以每天处理23.2万帧视频,通过对这些视频的分析和学习,不断优化神经网络模型,提升交通灯识别、自动泊车等功能的准确性和稳定性。
影子模式(Shadow Mode)是特斯拉持续优化自动驾驶系统的重要手段。在实际道路行驶中,该模式会持续对比自动驾驶系统的决策与人类驾驶员的操作,收集两者之间的差异数据。这些数据被反馈到训练模型中,用于进一步改进算法,降低系统在实际应用中的干预率。目前,特斯拉的城市道路自动驾驶干预率已降至每千公里1.2次,这一成绩充分体现了数据驱动的优化策略的有效性。
04
极端环境适应:应对复杂场景的技术底气
自动驾驶技术在实际应用中面临着各种复杂的环境挑战,特斯拉通过硬件和软件的协同优化,提升了系统在极端环境下的适应能力。
在天气应对方面,硬件上的耐候设计和软件算法的优化缺一不可。耐候镜头和加热元件解决了冰雪天气下摄像头视野模糊的问题,而HDR成像和去雾算法则在软件层面增强了系统在低能见度条件下的感知能力。在暴雨测试中,FSD V12的避障准确率较前代版本提升了30%,这得益于算法对雨水干扰的有效过滤和对道路信息的精准提取。
光照条件同样会影响自动驾驶系统的性能。特斯拉采用的自适应曝光调节和偏振滤镜技术,能够有效减少强光眩光的干扰,使交通灯识别准确率提升40%。无论是在阳光强烈的正午,还是在光线昏暗的傍晚,系统都能清晰地识别道路标志和交通信号,确保车辆安全行驶。
对于复杂地形,特斯拉也进行了针对性的算法优化。在旧金山等拥有大量陡坡和急转弯的城市,FSD V12针对这类特殊地形进行了专门的训练和参数调整,使其在处理陡坡起步、急转弯等场景时更加得心应手,急转弯成功率较V11版本提升了37%。
05
冗余:保证AI安全的基本技术
安全始终是自动驾驶技术的重心,特斯拉通过多重安全与冗余设计,为无人驾驶交付提供了可靠的保障。
硬件层面,双计算单元、三冗余传感器融合以及独立电源构成了坚固的安全屏障。即使其中一个计算单元出现故障,另一个单元也能无缝接管,确保系统的正常运行;三冗余传感器融合(摄像头+雷达+惯性测量单元)则保证了在某个传感器失效的情况下,其他传感器仍能提供准确的环境感知信息。在软件方面,传统控制算法与神经网络相互交叉验证决策,当神经网络出现异常时,传统算法可以及时介入,避免事故发生。在紧急制动场景下,系统能够实现0.8g的减速度,并且避障成功率高达95%。
此外,特斯拉还建立了实时监控机制,AI系统持续监测传感器和计算单元的运行状态,一旦检测到异常,能够在50微秒内触发警报或使系统进入安全模式,最大限度地保障车辆和乘客的安全。
06
总结
当然,这次model Y的自主交付是在美国完成的,在国内表现可能没这么好,因为国内的训练数据是禁止流入境外的,特斯拉引以为傲的120亿英里的真实驾驶数据,并没有多少是中国国内的。
比如拟在2026年1月1日生效的最新的国标,《汽车整车信息安全技术要求》GB44495—2024,就明确有如下测试条目。
图 防数据出境测试方法
众所周知,AI的基础是大数据,AI模型都是大数据喂出来的。所以此次drive itself to owner还只能当做个例来看。何时能够普及到国内用户,拭目以待。
(部分插图未收录)
https://mp.weixin.qq.com/s/1qQ_gf_1uglAMTiemk_AxQ