本论文面向当前AI for EDA研究中电路图表示不统一、评测协议不一致、模型性能与图表示选择相互耦合等问题,提出了一个从寄存器传输级(RTL)到版图数据(GDSII)的多视角电路图基准数据集R2G。该工作围绕30个开源IP核,构建了覆盖综合、布局与布线阶段的端到端DEF-to-Graph数据生成流程,并提供统一的数据加载器、训练/验证/测试划分、领域评测指标和可复现实验基线。
论文进一步设计了五类具有信息等价性的阶段感知电路图表示,使研究者能够在固定电路、固定任务和固定特征信息的条件下,独立分析“图表示选择”对模型性能的影响。实验结果表明,在布局线长预测和布线线长预测等物理设计任务中,电路图表示方式对图神经网络模型性能具有显著影响:对于同一GNN模型,不同图视角下的测试性能差异可超过0.3;节点中心化的图表示在布局与布线任务中均表现出更好的泛化能力;同时,任务解码头深度是影响预测精度和训练稳定性的关键因素,适当增加解码头层数可将模型性能提升至接近最优水平。
该研究不仅为AI for EDA领域提供了标准化、多视角、可复现的电路图评测平台,也为后续开展电路表示学习、跨阶段物理设计预测和图神经网络模型设计提供了重要的数据基础与实验依据。