「学校里很少教授的一点是如何思考规模化问题。当问题规模扩大百倍时,解决方案往往随

依萱谈汽车啊 2025-10-25 09:47:43

「学校里很少教授的一点是如何思考规模化问题。当问题规模扩大百倍时,解决方案往往随之改变。最初选择的解决方案可能很快会演变成问题本身」特斯拉团队成员近期在不同场合的发言都表达了一层含义:“规模化是智能突破关键”的发展趋势

特斯拉AI负责人近日在国际计算机视觉大会(ICCV)上分享了特斯拉在端到端自动驾驶方面的最新研究进展。以下为核心要点👇

特斯拉的自动驾驶系统采用端到端神经网络:

它直接从多摄像头画面、车辆运动信号、导航地图、音频等输入中学习,输出控制车辆的转向与加速度命令。

💡 为什么坚持端到端?

-难以用传统编程写出“人类价值判断”,但AI可从真实驾驶数据中学习到这些决策逻辑;

-感知、预测与规划之间的界限模糊,端到端能让梯度贯通全流程,实现整体最优;

-可扩展性强,能涵盖现实世界中大量“长尾场景”;

-硬件结构统一、延迟可控;

-顺应“规模化是智能突破关键”的发展趋势。

从近期 FSD V14 的部分客户实测体验中可以看出的案例展示:

-系统学会在遇到大水坑时选择安全避让,而非死板遵守车道规则。

-能理解“鸡要过马路”和“鹅只是待在原地”这种柔性意图。→ 这些都是人类直觉式判断,端到端网络通过大规模人类驾驶数据学会了这种“价值感知”。

⚙️ 技术挑战与突破:

1️⃣特斯拉车辆每秒产生海量传感器数据(相当于 20 亿个输入 token)。系统必须在其中学会因果关系,而非虚假相关。👉 特斯拉凭借全球车队每天“500 年驾驶量”的数据流,通过自动数据引擎筛选出高价值样本,极大提升了泛化能力。

2️⃣虽然是端到端模型,但仍能输出中间的可解释信号。

例如最新的 Generative Gaussian Splatting(生成高斯点云) 技术:可在 220 毫秒内重建高质量 3D 场景,无需外部初始化,可建模动态物体与主AI模型联合训练。

此外,FSD v14 已内置部分自然语言推理能力,让模型能结合语言与视频进行场景理解。

3️⃣评估与闭环仿真:特斯拉打造了神经世界模拟器(Neural World Simulator):用真实数据训练,可根据AI控制信号生成未来世界状态;支持高帧率、高分辨率、实时仿真;既可用于模型验证,也能生成对抗性场景或用于闭环强化学习。甚至可以让人“在AI生成的世界里开车”,画面逼真、交互流畅。

最后他还强调了同样技术也无缝迁移到 Optimus 人形机器人,使其能在虚拟环境中学习导航、操作与互动。

新能源汽车特斯拉人工智能Optimus

0 阅读:0
依萱谈汽车啊

依萱谈汽车啊

感谢大家的关注