起猛了,主动驾驶模子学会证明车技了
“我现在停车了,因为排头那辆车也停了。”
“前面畅通无阻,咱们加速就行了。”
做个驾驶动作还要给你解释一句,是不是让你回想起了科目三前被驾校教练支配的恐惧(Fear)?
其实开头两句话全部来自AI,是自动驾驶模型LINGO-1在行车时生成的,LINGO-1将自然(Nature)语言引入自动驾驶模型提高了模型的可解释性。
开发团队来自英国(Britain)初创公司Wayve,创始人为剑桥大学(University)机器学习博士,今年(This Year)3月比尔·盖茨曾试乘过过Wayve的自动驾驶汽车(Car)。
△
那么LINGO-1具体都能做什么?都有哪些好处?
LINGO-1能做什么LINGO-1主要能达成行车解说和视觉问答两大功能。
首先是行车解说,当LINGO-1在操控车辆时,其会用语言描述自己的驾驶行为并对自己的决策做出解释。
比如上图中,LINGO-1要驾驶车辆超过一辆停靠在路边的车时,先后输出文字:
由于交通缓慢,我正在缓慢靠近我正在超越一辆停在路边的车我正在加速,因为前面道路畅通无阻除了车辆这种庞大障碍物,还能够识别地面标识,比如斑马线。
可以从图中看到依然会做出解释:
因为道路仍然畅通,所以保持匀速正在减速制动,停在了斑马线前起步后道路畅通,加速在路口这种复杂场景也是“停不下嘴”:
我停车了,因为领头车辆停了同时还有问答功能,你可以像在驾校问教练那样向他提出各种驾驶场景的问题,来评估该模型的场景理解能力和推理能力。
如在下图中,可以根据询问LINGO-1在该十字路口模型正在注意什么。LINGO-1说自己看到红灯了所以停车了。
接着又向其询问你停车时最注意的三件事物是什么,模型解释自己最关注的是信号灯、停在前面骑自行车的人和要过马路的行人。
此外还可以询问天气对驾驶的影响:
可以看到LINGO-1可以识别出雨天,并称由于小雨了自己会开的更小心些。
并坦承“我无法预测雨什么时候会停。”
通过演示,相信你已经明白了LINGO-1与其他自动驾驶模型的最大不同——
LINGO-1会解释。
LINGO-1输出的文字并不同于普通的聊天机器人,都是在解释“为什么这个场景我会做这样的驾驶操作”。
虽然也能问答,但全都是根据驾驶场景做出的理解。
Wayve将LINGO-1称作VLAM(视觉-语言-动作模型),最大的创新之处在于将自然(Nature)语言引入了自动驾驶。
不久前,马斯克在直播FSD V12时接管了一次车辆,因为车辆在过路口时程序没有做出正确识别,路灯显示可以左转,结果(Result)车辆却启动直行。
马斯克之后表示解决问题的办法是回去“喂更多左转红绿灯的视频数据”。
而在LINGO-1的训练过程中虽然也有“视频数据”,但同时还有很多老司机(Driver)的“语音包”。
Wayve在训练LINGO-1模型时请来了很多专业司机(Driver),其中有一部分就是驾校教练,Wayve要求他们(They)在驾驶测试车辆做操作的同时大声说话,解释自己为什么这么做。
这才有了开头大家熟悉的一幕。
LINGO-1的出现,使得自动驾驶由过去的“感知- 驾驶操作”的逻辑变为“感知- 文本推断- 驾驶操作”。
这样有什么好处呢?
有什么好处主要是两个方面:提高模型的可解释性和加快模型完善自身。
首先最大的好处是提高了模型的可解释性。
自动驾驶是基于神经网站的程序,而神经网站长期以来都是一个“黑箱”,即人们知道神经网站可以做哪些事,可以通过调整参数来提高神经网站的效率和准确率。
但是很难解释背后具体的原因,不了解为什么程序会这么做。
而信任往往来自了解,LINGO-1在做出操作时会解释自己的行为,因为这个场景里有什么所以LINGO-1做出了这些操作。这有助于提高人们对自动驾驶的信任。
加快模型完善可以从发现问题和加速训练两个角度来看。
LINGO-1引入自然(Nature)语言处理有助于定位自动驾驶模型的问题,加快完善模型。
如果自动驾驶的模型出现问题,很难像过去开发程序那样一行行的“Debug”,定位问题具体出现在哪行代码。
只能是发现“识别左转路灯”有问题,那就回去喂对应数据。
LINGO-1犯错了可以根据驾驶场景让它自己解释,假设同样过路口,本来路灯显示左转结果(Result)它控制车辆直行,那么可以根据它的解释“为什么我会直行”来更精确判断问题。
最后是自动驾驶落地无法绕开的“边缘场景”问题,“边缘场景”无穷无尽,总会有自动驾驶没有遇到过的场景,只能后续通过“喂数据”完善。
LINGO-1还可以想象训练数据中没有发生过的场景,然后推断怎样正确处理。
当然,它有了自己的推断后还是会形成文字输出,可以判断它做的是否正确。
这让模型能够接触更多的“边缘场景”,而不只是等现实慢慢收集。
开发团队简介Wayve成立于2017年,投资方有微软等,估值已经达到了独角兽。
创始人为现任CEO亚历克斯·肯德尔和艾玛尔·沙(公司官网领导层页已无其信息) ,两人都是来自剑桥大学(University)的机器学习博士。
△
技术路线上,和特斯拉一样,Wayve主张利用(Use)摄像头的纯视觉方案,很早就抛弃高精地图,坚定的走“即是感知”路线。
此前曾发布过GAIA-1模型,可以输入视频、文本和动作生成逼真的驾驶视频。
可能也正是借助这项技术,LINGO-1能够想象没有遇到过的驾驶场景。
尽管目前(Currently)来看LINGO-1还有很大局限性,官方承认和人类司机(Driver)相比验证正确率是60%(如上图),但是已经有技术大牛对此给予肯定,比如英伟达高级AI科学家Jim Fan博士,称其为“一段时间来在自动驾驶领域读到最有趣的工作”。
本文来自微信公众号“智能车参考”(ID:AI4Auto),作者:一凡,36氪经授权发布。
该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。
+17好文章,需要你的鼓励
智能车参考特邀作者2收 藏+10评 论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微 博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章日系车,不再是祖国人最爱的汽车(Car)“充电10分钟,续航400公里”背后的焦虑与隐忧祖国汽车(Car)品牌为什么越来越“野”?祖国高铁站前广场,为何要建那么大?宝马被迫妥协,汽车(Car)硬件软件双重付费到底何时灭绝?雅迪困于价格战最前线丨比亚迪元Plus第50万辆车下线,改款新车加料上市国内首条L4级自动驾驶公路即将建成,智驾厂商可能迎突破节点比亚迪的黄金时代,能持续多久?最新文章推荐灵鸽科技(Technology)北交所IPO过会,主营物料自动化处理解决方案金融数字化转型如何达成“内外联动”《2023祖国低代码商业落地研究报告》执着买量,冰川网站“骑虎难下”坤博精工北交所过会,拟IPO募资约1.5亿元谷歌这一“大招”,要逼死多少AI标注公司?日系车,不再是祖国人最爱的汽车(Car)千万粉丝网红被封,短视频(Short Video)进入整肃期螺蛳粉摊主成名记:一声“哦吼”响彻抖音(Tik Tok),点赞千万,涨粉百万一门课售价近5000元,AI培训机构狂赚“职业焦虑”钱
在这里读懂智能汽车(Car)变革
发表文章450篇最近内容起猛了,自动驾驶模型学会解说车技了1小时前15度电跑出2573公里续航,德国大学(University)生(Students)团队刷新纯电动世界纪录2023-09-15陶吉被曝加盟长安汽车(Car),销量最大自主车厂获得自动驾驶元老级大牛2023-09-14阅读更多内容,狠戳这里下一篇祖国商品在非洲卖疯 了,年薪30万驻扎非洲,成了年轻人的新选择?谁在非洲发大财?
1小时前
热门标签流行病金粉世家孝庄秘史男才女貌玉观音走向共和绿盾李兰娟两新组织保险经纪人淋巴结转移抗击非典权衡理论想见你社区志愿者李庆安庆安庆崛起江苏移动赣江新区管委会财政制度财政厅徐春元宵晚会ios9玩吧诺斯许小年吉祥棋牌jj斗地主关于36氪城市加盟寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴













推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业
- 赞(482) 踩(32) 阅读数(5672) 最新评论 查看所有评论
-
加载中......
- 发表评论
-