分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU

2024-09-20

近年来,随着汽车智能化和电动化的快速发展,汽车半导体市场展现出了前所未有的增长潜力。根据S&P Global Mobility的预测,到2029年,全球汽车半导体市场的收入预计将大幅增长,超过1300亿美元。2022年该市场的收入为680亿美元,意味着未来几年将实现一倍的增长。这一增长主要得益于先进驾驶辅助系统(ADAS)、电动化以及信息娱乐系统的普及,尤其是在电动汽车领域,半导体内容的增加更为显著。未来十年,随着这些技术的广泛应用,汽车半导体市场将迎来爆发式的增长。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第1张

高性能计算需求上升正在推动着包括车规级GPU在内,发挥出更为关键的作用尤。随着ADAS(高级驾驶辅助系统)和自动驾驶对高性能计算需求的增加,车规级GPU不仅是图像处理的核心,更在驾驶辅助、自动驾驶决策和传感器数据融合等方面发挥着重要作用。车规级GPU正在推动汽车从辅助驾驶逐步迈向完全自动驾驶的未来。

作为深耕GPU领域近40年的专家,Imagination的半导体解决方案在各类市场中已经出货超过13亿台设备,其中3.95亿设备是应用在汽车领域的。尤其是在座舱和信息娱乐系统GPU IP供应上,是当之无愧的的全球领先者。通过统一的PowerVR GPU架构,Imagination在汽车领域内提供了高效、安全且可扩展的图形和计算处理能力,满足了现代汽车对计算性能日益增长的需求。

近日Imagination发布了其最新的汽车级GPU IP——IMG DXS GPU,相比上一代汽车GPU IP,DXS GPU的峰值性能提升了50%,并结合了最新的D系列架构效率和图形功能,使其成为强大的图形处理器。新推出的分布式安全机制(Distributed Safety Mechanisms)在不影响性能的前提下,简化了实现ASIL-B(汽车功能安全等级)的成本。通过软硬件的协同优化,DXS GPU的计算性能提升高达10倍,极大增强了GPU在自动驾驶等高计算需求场景下的表现。



最新的PowerVR架构,突破GPU计算能力新高度

最新的IMG DXS GPU在图形处理和计算性能上的强大表现。首先,相比上一代产品,DXS GPU的每核心性能提升了50%,显著提高了图形和计算任务的处理能力。此外,DXS GPU具有极强的可扩展性,支持扩展至四个核心,最大化系统的处理能力。在1GHz时,DXS MC1能够达到1.5 TFLOPS的浮点性能,并在INT8计算中实现6 TOPS(每秒万亿次操作),图形像素填充率达到48 GPixels/s。而当频率提升至1.5GHz,DXS MC4的整体性能能够达到9 TFLOPS的浮点性能、36 TOPS的INT8性能以及288 GPixels/s的像素填充率。通过这些优化,DXS GPU在计算性能、图形处理能力和可扩展性方面都达到了一个新的高度。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第2张

IMG DXS GPU的强大性能表现来自其最新一代PowerVR GPU架构。通过采用2D双速率纹理处理、数据主线、固件处理器、片段着色率以及ASTC HDR等先进技术,该架构实现了性能密度提升20%。这种提升不仅增强了乘客的游戏体验,还改善了车载用户界面的响应速度,提供了更顺畅的操作体验。同时,PowerVR GPU显著增强了环视系统的图像渲染能力,提升了驾驶安全性,并为车内座舱提供了更个性化的体验,使每辆车的座舱设计更加差异化、与众不同。

据悉,IMG DXS GPU在多种工作负载下相较于竞争对手的显著性能优势。首先,在峰值性能方面,IMG DXS的表现达到了竞争对手的四倍,这意味着在处理高强度任务时,它能够提供极为强大的处理能力。此外,在填充率为中心的图形工作负载中,其性能可以达到竞争对手的两倍。而对于计算密集型图形任务,IMG DXS GPU的性能提升高达28%。特别是在安全关键的工作负载中,IMG DXS的性能还能进一步提升,最高可达两倍。这些表现凸显了IMG DXS GPU在处理复杂图形和计算任务时的出色能力,尤其在对安全性和性能有高要求的应用场景中,优势更加明显。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第3张

“首先DXS完美地匹配了今天汽车对于中央计算的要求,迎合了整车架构正在从分布式转向中央计算的趋势。第二个是完美匹配今天高性能的中央计算的要求,它提供了远高于CPU的计算性能,同时提供了远远高于NPU以及这类加速器SoC的编程灵活性。”Imagination车载GPU产品线产品总监章政分享到,“而且除了性能之外,最重要的是我们推出了全新的功能安全解决方案:分布式安全机制——几乎完全消除了以前的其他功能安全方案实现机制带来的性能以及片芯面积损失。”



创新的专利——分布式安全机制,让ASIL-B的实现更为高效

正如章总强调的,此次IMG DXS GPU的一大创新就是采用了Imagination最新的专利技术——分布式安全机制,所以能够在几乎不增加核心面积的情况下,实现更高的安全性和性能效率,助力客户构建ASIL-B级别的汽车级GPU。

要实现ASIL-B级功能安全,传统的方式有双核锁步(Dual-Core Lock Step)和工作负载重复(Workload Repetition)两种。其中双核锁步是通过增加核心面积(面积增加至两倍),来实现更高的安全性。然而,虽然面积显著增加,性能却没有显著提升。这意味着为了满足安全要求,系统的成本会大幅上升。工作负载重复这一方法通过在相同面积上重复工作负载,来提高安全性,但结果是性能仅为标准核心的一半。这种方法虽然占用的额外资源较少,但性能损失明显。

IMG DXS GPU则能够在标准核心的基础上,以最小的面积增加的前提下,提供与标准核心相同的性能,同时实现ASIL-B的安全标准。这使得它比双核锁步和工作负载重复更为高效,既保证了安全性,又避免了面积和性能的重大损失。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第4张

这种创新的技术叫做Safety Pairs,这是一种分布式功能安全机制,是Imagination的最新专利技术,它通过利用现代处理器中的并行性和自然空闲时间来实现故障检测,且无需对工作负载或硬件进行重复处理,从而减少了开销。

如下图展示了处理器在不同时间段的运行状态,其中每个条形代表了处理器的任务执行情况和空闲状态。黄色部分标记为“IDLE”(空闲),表示处理器的自然空闲时间,而紫色和红色部分表示不同的任务执行时间。通过在这些空闲时间运行测试向量来检测潜在故障,Safety Pairs能够在不增加硅片或工作负载的前提下,实现故障检测功能。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第5张

这个技术的优点在于它避免了传统方法中需要通过重复执行工作负载或增加处理单元来实现安全检测的做法,从而提高了系统的效率和资源利用率。简言之,Safety Pairs使得IMG DXS GPU能够以更少的硬件和资源开销,确保系统的安全性和可靠性,满足汽车行业的功能安全要求(如ASIL-B标准)。

“为什么功能安全在车这一块很难推广起来?主要是因为成本,因为芯片面积增加一倍或者是性能降低为二分之一,对于厂商来说它的成本也就增加了一倍。这个增加一倍的成本,最后都要转化到消费者头上去,那这个价格就要增加一倍。过去没有太多客户愿意为这个东西买单,所以一直推不起来。”章政解释到,“Imagination作为一个传统的GPU玩家,我们对GPU非常了解,我们对GPU怎么运行是非常清楚的。所以我们利用了GPU的一些特性来非常灵活地实现了功能安全机制。”

整体而言,DSM(Distributed Safety Mechanism-分布式安全机制)是一种分布式架构,通过持续发送微小的测试向量来确保各子组件的正确性与稳定性。该机制不仅适用于车载电子系统,还能够满足航空、医疗、工业等多个具备功能安全要求的领域的需求。Imagination将持续优化和发展这一机制,提升其效率,并扩大其应用范围。目前,DSM已能够轻松满足ASIL-B的安全等级要求。未来还有望将进一步提升其安全等级,并在更低的资源和成本消耗下,确保更高的安全标准的实现。



双速率FP16+SPU增加+软件优化,AI能力提升近十倍

AI的能力和图形处理的能力是想通的,而高阶自动驾驶的实现又必须依赖AI能力,因此DXS GPU在AI能力上的创新和优化,也是其重要的一部分。透过软件优化和架构创新,DXS GPU也进一步帮助开发者更快速和高效地将AI的能力部署到汽车中。

尽管图形处理是GPU的核心强项,随着计算任务对并行处理要求的增加,图形处理和计算的需求变得高度一致,许多GPU厂商开始将图形处理硬件用于加速计算任务。这一趋势也推动了AI的发展,因为AI的巨大算力需求最初就是通过GPU实现的,而CPU无法提供足够的计算能力来支持AI的工作。

然而,尽管现代AI算法需要更高的性能,当前的半导体技术仍然面临带宽和工艺节点的瓶颈,尤其是在5纳米甚至更小的技术节点上,成本会极具上升。因此,DXS在架构上进行了创新,通过支持FP16精度的计算来满足大部分AI工作负载的需求,减少了对高带宽的依赖。FP16比FP32带宽需求更低,通过增加双速率的FP16单元和SPU,DXS能够在FP16工作负载下提供三倍的算力,显著提升了性能。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第6张

此外,为了进一步降低带宽需求,DXS尽可能将所有计算控制在GPU内部,减少数据在GPU和其他模块之间的流动,从而大幅降低系统的带宽要求。DXS在1GHz主频下,能够在FP16半精度浮点计算中提供12 TFLOPS的性能,在int8计算中则可达到24 TOPS的性能,且在主频进一步提高到1.2GHz甚至1.5GHz时,性能会进一步提升。

另外值得关注的一点在于,相比于其他专门用于AI加速的NPU,GPU的最大优势在于其成熟的生态系统,这主要得益于基于开放标准的编程环境,如OpenCL、Vulkan和oneAPI。强大的生态系统不仅降低了研发成本,还使得客户能够方便地将任务从竞争平台移植到DXS上,推动了产品的市场推广和盈利能力。经过多年的发展,Imagination的GPU生态系统已经非常成熟,为客户的产品优化提供了极大的便利。

“整个 npu 生态系统是四分五裂的,开发成本非常高。根据行业内一些反馈——一个 NPU 的硬件工程师大概要搭配 10 到 20 个软件工程师去把这个 NPU 的硬件给运行起来,这个软件的成本是非常昂贵的。而且NPU 它是固化的一个东西(因为要追求效率,编程性就非常差),但是我们看一看今天 AI 才刚刚开始新的算法,每一天都在出现新的架构。没法去预测明天会有哪个新的架构出现,所以今天固化的NPU架构也无法去适配未来新的算法架构。特别是当NPU都追求高制程,高制程的制造成本又非常高昂。如果固化架构的这一NPU的生命周期很短,那这笔投资基本上就是有去无回的。”章政特别解释到,”我们看到的这个将来的趋势是什么?将来的趋势是在 AI 没有完全固化之前,编程性是很重要的。可编程性,一个开发的生态系统有众多的参与者,能更好的适配新的这个方法是用新的 framework 让这个产品的生命周期增长,能有更多的销量,摊薄你研发的成本,那你这个公司的最后这个产品才有机会去盈利。“

因此,DXS GPU有着天然的开发生态优势,而Imagination也进一步在硬件架构优化创新的基础上,提供了最新的计算库(compute library)和工具包(Toolkit),来帮助开发者加速关键的汽车应用——特别是ADAS(高级驾驶辅助系统)和计算机视觉相关的任务。

据悉,在一些典型的工作负载中,DXS的AI性能相比上一代产品提升了近十倍。前面提到虽然硬件性能仅提升约50%,但这次显著的性能增长主要归因于软件的支持与优化。特别是在计算库方面,性能提升了2至4倍。优化的计算库不仅在带宽使用上实现了显著的节省,同时也对片上内存进行了有效的管理与优化。通过尽可能将所有计算保持在片上运行,避免了数据在不同计算单元之间的频繁传输,从而降低了带宽消耗。这一优化措施不仅提升了系统效率,也显著降低了能耗,因为数据传输通常是能耗的主要来源之一。

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第7张

未来,随着计算库的不断增强,DXS GPU的硬件利用率将持续提升,使得更多的高级驾驶辅助系统(ADAS)功能能够在GPU上实现。这样DXS GPU就能够为ADAS提供更多更灵活的算法支持,从而帮助客户的产品在未来具备更高的可持续性。利用强大的可编程性和计算能力,客户在面对新的自动驾驶算法或功能需求时,也能够通过开放API快速地在DXS平台上实现这些新功能,从而满足市场多样化需求。

灵活可拓展方案保证客户成本效益,应对未来增长需求

最后,DXS GPU**延续了Imagination在GPU产品上的拓展性优势,这保证了客户的长期灵活性和成本效益,尤其是在应对未来可能增长的智能座舱和人机交互(HMI)需求时。

“虽然现在的需求可能不需要使用最高级别的GPU,但DXS GPU架构设计了多种可扩展的方案,以满足未来可能出现的更高计算需求。例如,在未来5到10年内,如果智能座舱的屏幕数量增加,或者对HMI的要求提升,用户可以从不同级别的DSX GPU中选择,比如从8核心到256核心,或者选择更高级别的MC2、MC4型号。简单来说,即便当前你选择的是低规格的GPU,未来仍然可以根据需求逐步升级和扩展,保持灵活性和成本效益。”Imagination 资深产品总监Stephen Spain表示,“简单来说,即便当前你选择的是低规格的GPU,未来仍然可以根据需求逐步升级和扩展,保持灵活性和成本效益。”

分布式安全机制实现更高效的ASIL-B级功能安全构建,Imagination发布最新汽车级GPU IP——IMG DXS GPU (https://www.qianyan.tech/) 头条 第8张

相关推荐