(原标题:1亿美元的芯片,如何成功?做到这10点!)
公众号记得加星标,第一时间看推送不会错过。
来 源 : 内容 编译自 synopsys 。
正如俗语所说,高风险伴随着高回报。
由于硬件和软件之间存在着极其复杂的相互依赖关系,因此开发定制人工智能芯片是当今半导体行业中资本密集度最高、风险最大的项目之一。
在先进工艺节点上,项目总成本很容易超过1亿美元。如果设计需要返厂重新制版,成本还会大幅上升。而最糟糕的情况——错失融资机会、上市时间延误以及由此导致的市场份额损失——可能会造成灾难性后果。
然而,越来越多的芯片制造商和初创公司无视这些风险,因为他们看到了巨大的回报。但容错空间很小,第一次就做对已成为技术、财务和商业上的当务之急。
以下是开发人工智能芯片时实现首次芯片测试成功的十个行之有效的策略:
1. 优先进行早期架构探索
从一开始就优化人工智能芯片的架构会带来巨大的收益。早期架构探索使团队能够评估计算、内存和互连的多种配置和权衡方案。性能和功耗可以针对特定的人工智能工作负载进行优化。由于大多数人工智能芯片采用多芯片设计,因此可以使用专门的工具来分析和优化整个封装内各个芯片的划分和配置。通过优先进行早期架构探索,团队可以快速识别潜在的瓶颈,并针对复杂的算法和海量人工智能数据集优化其设计。
2. 利用经过硅验证的 IP 解决方案
使用经过硅验证的 IP 解决方案(包括高速接口、内存控制器、专用加速器和安全解决方案)可以降低风险并加快开发速度。
3. 软件和硬件协同设计
人工智能芯片并非独立运行,而是构成一个包含软件、固件和外部组件的庞大系统的一部分。让软件团队参与芯片设计前的规划,有助于确保硬件能够适配人工智能芯片将支持的算法和框架。通过提供硬件模型,使软件能够在芯片问世前运行,团队可以验证功能、优化实际性能,并在问题影响产品质量或交付之前发现缺陷或集成难题。
4. 在整个开发过程中优化电源效率
人工智能工作负载正给全球能源资源和基础设施带来巨大压力。过去,芯片设计中对能效的考虑往往被忽略,但如今,能效已成为影响人工智能芯片商业可行性、差异化和可持续性的关键环节。功耗建模能够帮助团队做出明智的架构决策,在不影响性能目标的前提下最大限度地降低能耗。根据 调查,在架构探索和 RTL 阶段就关注功耗问题,比在设计后期才着手解决功耗问题,对提高能效的影响要大得多。
5. 进行严格的RTL设计验证
稳健的RTL设计验证策略结合了仿真、形式验证和覆盖率驱动方法,以确保满足功能和性能要求。早期且持续的验证——采用人工智能驱动的行业标准流程——有助于最大限度地降低未发现缺陷和后期意外情况的风险。借助硬件辅助验证(HAV)工具进行RTL仿真,团队可以在真实环境下验证系统行为、软件集成和性能。仿真还能发现仅靠仿真可能遗漏的功能缺陷、极端情况和集成问题,从而降低代价高昂的芯片重制风险。
6. 利用人工智能驱动的EDA工具提高生产力并优化PPA
人工智能驱动的EDA工具将递归学习(RL)、辅助驾驶和数据分析引入设计流程,实现日常任务的自动化,并挖掘设计优化机会。这些工具能够快速评估数千种设计方案,帮助团队加快设计周期,减少人工优化工作,并实现极高的功耗、性能和面积(PPA)目标。
7. 设计和模拟先进封装
人工智能芯片通常需要先进的封装解决方案,例如 2.5D 和 3D 多芯片架构。由于来自不同工艺节点的芯片可以在同一封装内混合搭配,这些架构能够提高灵活性、降低成本并有助于满足性能要求。但是,为了优化功能并避免后期出现意外情况,需要对封装系统进行早期协同设计、仿真和分析,包括信号完整性和热分析。芯片团队和封装团队之间的紧密合作有助于确保从互连到散热的各个方面都针对性能、总体成本和一次性成功率进行优化。
8. 进行全面的芯片前系统验证
在将设计送交晶圆厂之前,需要进行广泛的硬件辅助仿真、原型验证和系统验证至关重要。实施全面的测试计划、构建真实环境的接口验证板以及开发具备高级调试功能的快速周转软件环境,可以提高芯片一次成型成功的概率,并在首批芯片到货后加快启动和调试速度。对于尖端人工智能芯片设计而言,达到这种准备程度需要数万亿次的验证和确认循环。
9. 实施测试和生命周期管理能力
测试策略应在首片芯片交付之前就充分实施,尤其是在开发多芯片设计时。可测试性设计 (DFT)功能(例如扫描链和内置自测试 (BIST))能够提高故障检测和隔离能力。它们提供宝贵的信息,有助于提高良率、可靠性和性能。此外,当与芯片生命周期管理 (SLM)解决方案结合使用时,它们还能在芯片的整个生命周期内进行监控和优化。
10. 尽早且明智地选择外部合作者
与外部合作方(包括半导体代工厂和技术合作伙伴)的早期和持续互动对项目成功至关重要。代工厂在工艺能力和可制造性方面提供关键指导。可靠的技术合作伙伴提供必要的设计工具、经过硅验证的 IP以及以协作为导向的设计服务。两者都有助于接入更广泛的硬件和软件生态系统,使 AI 芯片能够与之交互。与这些合作伙伴合作有助于增强内部资源和专业知识,使企业能够更专注于核心竞争力和创新,并最终提高设计质量和缩短产品上市时间。尽早建立这些关系并在整个设计周期中保持协作,对于优化 AI 芯片的性能、良率和可靠性至关重要。这也有助于确保从流片到概念验证或量产爬坡的无缝过渡。
在人工智能芯片研发这个高风险领域,容错率极低。由于投资额往往超过1亿美元,而且每一个决策都可能带来代价高昂的延误,因此,首次尝试就成功设计至关重要。
采取严谨积极的方法——优先考虑早期架构探索、硅验证IP、AI驱动的EDA工具、广泛的硬件辅助验证、早期软件开发、稳健的DFT和SLM实践,以及团队间的紧密协作——有助于工程组织最大限度地降低风险,并按时按预算实现突破性性能。借助值得信赖的合作伙伴,AI芯片公司可以显著提高芯片一次成型成功的几率。
https://www.synopsys.com/blogs/chip-design/ai-chip-silicon-success-tips.html
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4223期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
