转自公众号:香山开源处理器
http://mp.weixin.qq.com/s?__biz=Mzg5MTY4MjgyNg==&mid=2247486382&idx=1&sn=fd6de0d50eb5838381410f3cd094802d
欢迎来到我们的双周报专栏。本次是香山双周报专栏的第 53 期,我们将通过这一专栏,定期介绍香山的开源进展,希望与大家共同学习,一起进步。欢迎大家通过公众号后台留言的方式与我们交流!
近期,昆明湖各组持续推进面积、时序、功耗的优化。此外,前端完成 new ICache 的实现,后端完成 v0 和 vl 拆分,访存模块正在实现新版 CHI-L3 基础框架并建立仓库,实现相关缓存子系统的 TL-test 测试环境搭建。
前端
完成 new ICache 实现(#3051)
修复 IFU 的 MMIO 相关 bug(#3038)
预测器中 pc 分高低位实现 CGE(#3027)
后端流水线
v0 和 vl 拆分为独立重命名表和物理寄存器堆(#3040)
继续优化后端时序(#3052、#3018)
修复浮点开方时涉及到的 NaN 类型错误问题(#3047)
修复高位非全零时,f2v boxing 错误的问题(#3035)
访存与缓存
CHI 总线
正在实现新版 CHI-L3 基础框架,建立 GitHub 仓库(OpenXiangShan/OpenLLC)
完成 CoupledL2-OpenLLC 缓存子系统的 TL-test 测试环境搭建
H扩展
csr 添加 Zicntr、Zihpm 支持
在 github CI 中添加 H 扩展测试
向量访存
继续优化时序,目前时序违例从 -160ps 收敛到 -86ps
修复部分逻辑 bug 和仿真 X 态 bug
初步性能测试中,向量化 hmmer 分数从 13.04/GHz 提升到 15.33/GHz,向量化 libquantum 出现显著性能下降,正在进一步确认和测试。
性能优化
利用 Trace TL-Test 微观分析 TP meta on L2 实现,修复若干 bug,利用 RRIP 进行替换管理,目前测试结果发现 TP 预取并没有充分发挥性能作用,正在继续优化
通过对软件模拟- RTL 仿真的替换路选择结果进行对比,定位到多个 Hawkeye 替换相关的 bug
Tubins 替换经测试,在 L2 中 SPEC 性能比 PLRU 高 0.03%,在 L3 中比 PLRU 高 0.3%
功耗优化
LSQ 门控修改合入主线
修复门控工具中的仿真 X 态 bug
香山开源处理器正在火热地开发中,新的功能与新的优化在持续添加中,我们将通过香山双周报专栏定期地同步我们的开源进展。感谢您的关注,欢迎在后台留言与我们交流!
在香山昆明湖架构研发后期,性能会每月公布一次,敬请期待!
News: 香山开源技术讨论 QQ 群人数首破 500,感谢大家关注,也欢迎新人进群和香山开源爱好者一起交流!
香山技术讨论 QQ 群:879550595
香山技术讨论网站:
https://github.com/OpenXiangShan/XiangShan/discussions香山文档:
https://xiangshan-doc.readthedocs.io/DiffTest 框架:
https://github.com/OpenXiangShan/difftest/SPEC06片段编译选项:
https://github.com/OpenXiangShan/CPU2006LiteWrapper文中如 #2211 格式的工作,对应 PR 链接为:
https://github.com/OpenXiangShan/XiangShan/pull/2211
编辑:高泽宇、唐浩晋、李燕琴、蔡洛姗
校阅:香山宣传工作组
点个在看你最好看