一种新的强化学习算法已经学会优化组件在计算机芯片上的位置,使其更有效率和更省电。
3D俄罗斯方块:芯片摆放,也称芯片层规划,是一个复杂的三维设计问题。它需要在一个受限制的区域内跨多个层小心地配置数百个(有时是数千个)组件。传统上,工程师会手动设计配置,以最小化组件之间使用的电线数量来提高效率。然后使用电子设计自动化软件来模拟和验证它们的性能,而仅一个单层的平面图就需要花费超过30个小时。
时间耗费:由于每个芯片的设计投入了大量的时间,传统上认为芯片的寿命在2到5年之间。但随着机器学习算法的快速发展,对新芯片架构的需求也在加速。近年来,一些优化芯片层规划的算法试图加快设计过程,但它们在跨多个目标(包括芯片的功耗、计算性能和面积)的优化能力方面受到了限制。
智能设计:为了应对这些挑战,谷歌的研究人员Anna Goldie和Azalia Mirhoseini采取了一种新的方法:强化学习。强化学习算法使用正反馈和负反馈来学习复杂的任务。因此,研究人员设计了一种所谓的“奖励函数”,根据算法的设计表现对其进行惩罚和奖励。然后,该算法产生数万到数十万个新设计,每个设计都在几分之一秒内完成,并使用奖励函数对它们进行评估。随着时间的推移,它最终形成了以最佳方式放置芯片组件的策略。
验证:在用电子设计自动化软件检查设计后,研究人员发现,算法的许多平面图比人类工程师设计的要好。研究人员说,它还教会了人类一些新技巧。
生产线:纵观该领域的历史,人工智能的发展与芯片设计的发展紧密相连。该算法有望加速芯片设计过程,并产生新一代改进的架构,从而加速人工智能的发展。