【香山双周报 101】20260427 期
欢迎来到香山双周报专栏,我们将通过这一专栏定期介绍香山的开发进展。本次是第 101 期双周报。
昆明湖 V3 的设计文档已经逐步公开,欢迎大家阅读并与我们讨论!目前,新版设计文档包含 ICache 和 BPU 两个模块,其他模块的设计文档将随着开发的进行陆续发布。设计文档仍然在 https://docs.xiangshan.cc/projects/design/zh-cn/,如果大家对昆明湖 V2 的设计文档感兴趣,可以通过网页右下角切换分支来查看。
关于香山核近期开发进展,前端着重优化了 BPU 的时序,后端和访存实现了多个新特性,并且修复了一些功能 bug。
近期进展
前端
? RTL 新特性 ? 启用 SC Backward 表(#5796) ? Bug 修复 ? 修复 S1 级 RAS 在 S3 override 时栈顶地址用错的问题(#5680) ? PPA 优化 ? 去除存储在 FTQ 的 SC 训练元数据,改为更新时读,节省面积(#5819) ? 解耦 TAGE 跳转计数器和 useful 计数器的写入,节省功耗(#5782) ? 修复 BPU S3 多条时序路径(#5797) ? 修复 SC 预测时序路径(#5843) ? 修复 FTQ 重定向及分支 resolve 时序路径(#5835) ? 代码质量 ? 删除未使用的 V2 工具类(#5821)
后端
? RTL 新特性 ? (V2) 允许通过 CSR 配置“提交停滞”(commit stuck)关键错误检查 (#5806) ? 新增开关,用于禁用分派负载均衡优化 (#5815) ? 解决因主流水线资源不足导致的误报问题 (#5803) ? PPA 优化 ? 优化分派策略以提升性能 (#5801) ? Bug 修复 ? 修复间接 CSR RegOut 问题 ((V2) #5823, 5833)
访存与缓存
? RTL 新特性 ? 完成新版 StoreUnit 设计(#5760) ? 持续推进新版 L2 设计 ? Bug 修复
XSAI
? RTL 新特性 ? 正在测试矩阵模块的 FP8 精度支持 ? 正在评估矩阵模块的 8 通道访存 ? 正在与后端组配合实现 BF16 标量与向量 ? 代码质量 ? 优化了 XSAI 的参数系统(XSAI #59) ? 调试工具 ? NEMU 新增 BF16 扩展支持(NEMU #995) ? HBL2 测试兼容多核环境
性能评估
处理器及 SoC 参数如下所示:
性能数据如下所示:
编译参数如下所示:
注:我们使用 SimPoint 对程序进行采样,基于我们自定义的 checkpoint 格式制作检查点镜像,Simpoint 聚类的覆盖率为 100%。上述分数为基于程序片段的分数估计,非完整 SPEC CPU2006 评估,和真实芯片实际性能可能存在偏差。
相关链接
? 香山技术讨论 QQ 群:879550595 ? 香山技术讨论网站:https://github.com/OpenXiangShan/XiangShan/discussions ? 香山文档:https://xiangshan-doc.readthedocs.io/ ? 香山用户手册:https://docs.xiangshan.cc/projects/user-guide/ ? 香山设计文档:https://docs.xiangshan.cc/projects/design/
编辑:徐之皓、吉骏雄、陈卓、余俊杰、孙际儒、李衍君
