为了让AI特别是在自动驾驶汽车中,加速器在最短延迟内达到最佳精度,TFLOP然而,一些专家认为,这种野蛮的处理方法已经成为许多所谓大脑芯片的关键指针。……
芯片采购网专注于整合国内外授权IC代理商现货资源,芯片库存实时查询,行业价格合理,采购方便IC芯片,国内专业芯片采购平台。
人工智能(AI)特别是在自动驾驶汽车中,加速器在最短延迟内达到最佳精度(AV)中,TFLOP(兆次浮点运算)已成为许多所谓大脑芯片的关键指针。比赛的选手包括Nvidia的Xavier、Mobileye的EyeQ5、特斯拉(Tesla)全自动驾驶(FSD)以及计算机芯片NXP-Kalray芯片。
然而,一些专家认为,这种野蛮的疗是不可持续的。在EE Times在独家专访中,DeepScale执行长ForrestIandola提出其不可持续的原因是因为AI硬件设计师持有的许多常见假设已经过时。随着AI应用越来越多,AI供应商积累更多的经验,导致不同的经验AI任务开始需要不同的技术方法。假如是这样,AI使用者购买AI技术方式会改变,供应商也会做出回应。
DeepScale执行长ForrestIandola
Iandola这意味着搜索神经网络架构(NAS)例如,其快速发展不仅加快了对深度神经网络的优化(DNN)搜索过程,降低成本。他认为,有一种方法可以在目标任务和目标操作平台上建立最低延迟和最高精度DNN,而不是依靠更大的芯片来处理所有的事情AI任务。
Iandola设想未来AI芯片或传感器系统(如计算机视觉、雷达或光达)供应商不仅提供硬件,还提供自己的高速高效DNN——为应用而设计DNN架构。任何供应商都将匹配他们需要的不同操作平台DNN,假如真的是这样,那么AI比赛中的所有赌注都将失败。
需要明确的是,芯片公司和传感器供应商都没有提出上述前景。很少有人在特定的硬件上有针对性地运行AI任务的可能性。
Iandola及其DeepScale最近团队设计了一系列DNN模型被称为SqueezeNAS”。在最近的一份报告中,他们声称在目标平台上搜索延迟,SqueezeNAS能够建立更快、更准确的模型。这份报告被推翻了AI小区先前对NAS、乘积累加(MAC)运算和将ImageNet精度应用于目标任务中的一些假设。
DeepScale于2015年由Iandola和KurtKeutzer教授共同成立,是位于加州山景城的一家新公司,致力于发展微型DNN。两位联合创始人曾在加州大学柏克莱大学分校工作,DeepScale因其快速高效DNN研究在科学界备受推崇。
手工设计(Manual designs)
要真正理解机器学习在计算机视觉方面的最新进展,需要了解其发展历史。
还记得AlexNet2012年,网络结构模型获胜ImageNet图像分类竞赛吗?这为研究人员专注于竞争打开了大门ImageNet在计算机视觉任务中找到最高精度的研究DNN,竞争。
基于强化学习和超级网络的基础NAS比较(数据源:DeepScale)
过时的假设
机器学习的简短历史向我们展示了神经结构搜索的出现如何为计算机视觉研究奠定基础。但在这个过程中,它也反驳了研究小组的一些早期假设,Iandola指出。
那么,需要纠正哪些假设呢?
Iandola称,大多数AI系统设计师认为,ImageNet分类中最精确的神经网络可以为目标任务提供最精确的骨干网络。但计算机视觉包括许多AI任务-从目标检测、分割和3D从空间到目标跟踪、距离估计和自由空间。并非所有任务都是平等的。Iandola强调。
ImageNet目标任务的准确性与目标任务的准确性关系不大。这不能保证。
来看由Iandola团队创建的SqueezeNet。Iandola这是一个小的神经网络,它的解释ImageNet分类精度明显低于VGG,但在识别一组图像中类似斑块的任务时,它比VGG更准确。
当分类任务达到极限时,Iandola是时候为不同的任务设计不同的神经网络了。
另一个常见的假设是Raltron代理在目标运算平台上减少MAC然而,最近的研究表明,减少了MAC与减少延迟没有太大关系。MAC神经网络并不总能实现较低的延迟,Iandola指出。
在Iandola的SqueezeNAS在报告中,他坚持认为不仅仅是不同的AI任务需要不同DNN。为目标运算平台(如CPU、GPU或TPU选择合适的版本)DNN也很重要。
例如,他引用了优化不同智能手机网络的方法FBNet作者的话。他们发现了DNN在iPhonex它在三星运行得很快,但在三星运行得很快Galaxy S八上执行得很慢。报告中,Iandola即使MAC数量保持不变,不同的卷积维数会根据处理器和核心来决定更快或更慢的运行。
对自动驾驶的影响
今天,DeepScale与包括在内的多家汽车供应商建立了合作关系Visteon、Hella Aglaia Mobile Vision GmbH其他未透露姓名的公司。DeepScale一直在开发微型DNN,该公司声称,在保证最先进性能的同时,它们需要更少的计算。
在SqueezNas的报告中,Iandola他向同事解释说,他的团队使用超级网络NAS用于语义分割的设计DNN,用于识别道路、车道、车辆和其他物体的准确形状。NAS系统配置优化Cityscapes语义分割数据集精度高,在小型车辆级运算平台上实现低延迟。
随着SqueezNAS的发展,DeepScale对自己的定位是:优化DNN、AI硬件和特定AI任务之间的协同关系成为先驱。
随着AI芯片即将席卷市场,Iandola认为系统设计师必须明智地选择加速器。他们应该准确地考虑硬件应该执行AI以及硬件加速器应在哪种神经网络上运行。
将使用安全摄像头、自动驾驶汽车和智能手机AI芯片。考虑到每个系统所需的速度、准确性、延迟和应用程序,确定合适的硬件和NAS它变得至关重要。
Iandola表示,对于OEM对于汽车制造商来说,要将测试版的自动驾驶汽车转化为商业产品,必须提取存储在自动驾驶汽车后行李箱中的刀锋服务器。Iandola预计汽车制造商可能会要求硬件芯片公司提供适合硬件平台的优化DNN。
对于Nvidia这样的公司可能不是问题,因为它GPU它得到了大型软件生态系统的支持。然而,其他大多数AI硬件供应商会吓出一身冷汗。
此外,随着一系列新的传感器-摄像头、光达和雷达的设计,汽车OEM例如,不同类型的神经网络可能会面临一些残酷的现实。另一个例子是,不同品牌设计的光达使用不同的光达AI硬件。Iandola今天,无论是传感器供应商还是传感器供应商AI处理器公司没有为其硬件提供优化推荐的神经网络。”
Iandola表示,OEM汽车厂和一级零部件供应商将开始要求优化DNN,匹配特定硬件和AI任务,这将是不可避免的。我们相信使用NAS在目标运算平台上优化低延迟变得越来越重要。
以超级网络为基础NAS出现,NAS成本一直在下降。因此,是时候让硬件供应商开始寻找自己的优化了DNN。当被问及DeepScale通过合作、授权或AI开发和优化硬件公司DNN填补这个缺口时,Iandola我们还没有真正考虑过这个问题。
- 主驾无人车首次获批 自动驾驶进入快车道
- TrendForce:监视面板出货Q2季减11.3% 下半年需求持续疲软
- 苹果再次邀请一群开发人员参加WWDC22 全球开发者大会
- VR 技术帮助:复杂连体婴分离手术由英国和巴西医生完成
- 台湾印度讨论太空半导体技术合作
- 新型划时代显示非接触空气成像
- AMD扩大高效运算研究基金 帮助研究人员解决全球艰巨挑战
- 基于大联大解鼎集团的推出Richtek产品的65W Type-C PD快充方案
- 智能驾驶迎风而起,车载芯片筑高楼
- 明星耳机配明星大咖,Cleer将与杨千嬅同行
- M12349内置PD3.1/QC3.0快充协议140W双C口升降压车载充电IC解决方案
- 日经:苹果将部分iPad产能从中国转移到越南