首页 > 最新动态 > 【大咖观点】包云岗:RISC-V 在未来的发展前景如何?
最新动态
【大咖观点】包云岗:RISC-V 在未来的发展前景如何?
2026-06-2221
编者按:

2026年度 RISC-V 欧洲峰会圆满落幕,中国科学院计算所副所长、研究员、开芯院首席科学家包云岗老师从博洛尼亚带来了最新最全面的 RISC-V 趋势、实践与前沿洞见,让我们一起倾听来自意大利的声音,探讨RISC-V 在未来的发展前景。


2026年度 RISC-V 欧洲峰会于6月8日至12日在意大利博洛尼亚举行,现已圆满落幕。每年的峰会都是一次信息高度集中的爆发,吸引着全球 RISC-V 业界与社区的关注。我从2023年首次参加欧洲峰会,至今已是第四次。过去三年,欧洲各国机构对 RISC-V 的高度重视、峰会偏重技术的风格始终未变,而变化则体现为不断涌现的新产品与新公司。比如,今年峰会出现了一匹黑马——一家名为 NextSilicon 的以色列初创公司现场展示了他们已回片的一款高性能 RISC-V 芯片;而 MIPS 公司则“弃暗投明”,放弃自有的 MIPS 指令集,转而推出了一款基于 RISC-V 的 NPU 处理器 MIPS S8200。

趁着端午假期,我对欧洲峰会做了简要梳理,并结合自己最近的一些思考整理形成下文,与大家分享。

1. 欧洲峰会的观察与体会

1.1 RVA23标准极大加速高性能RISC-V芯片研发

2024年10月北美峰会上,RVA23 Profile 标准正式冻结并发布,这对 RISC-V 生态发展具有重要意义——它不仅解决了 RISC-V 实现碎片化的问题,更保障了软件兼容性:支持 RVA23 的操作系统和应用软件,可以在所有符合 RVA23 的硬件上运行。

RVA23 正式发布一年半以来,全球涌现出一批支持该标准的高性能 RISC-V 芯片与操作系统,标志着 RISC-V 正从 MCU /边缘级向服务器级、高性能计算方向加速推进。本届欧洲峰会首日上午,RISC-V 国际协会 CEO Andrea Gallo 在大会报告中列出了全球范围内支持 RVA23 的 RISC-V 芯片,包括:

  • 已用于服务器芯片并流片的 SiFive P870D;将于 2026 年 Q4 回片点亮的 Tenstorrent Altantis;一颗芯片同时支持 CPU 与 AI 的 EPIC Contrail AIX;
  • 已于 2025 年 12 月流片的 AKEANA Alphine;面向 AI 和 HPC 负载的 NextSilicon Arbel;支持 60TOPS AI 算力的进迭时空 K3;
  • 基于香山·昆明湖的 V100 服务器级芯片,其 SPECCPU 2006 实测性能达 16.5/GHz;以及 Andes 推出的高性能核 AX66,MIPS 基于 RISC-V的 NPU S8200。

如此众多的 RVA23 芯片集中亮相,已然令人感受到高性能 RISC-V 芯片势如破竹的态势。需要说明的是,Gallo 的报告只是列举了一部分,至少国内的玄铁 C950 核同样支持 RVA23。

1.2 双向奔赴:AI 需要 RISC-V,RISC-V 需要AI

RVI CEO Gallo 的大会报告标题正是“The Architecture of Intelligence”,这表明 RISC-V 与 AI 的结合已成为全球 RISC-V 界的共识。

AI 需要 RISC-V:AI 时代的核心需求之一是定制化。不同 AI 场景、模型和部署形态对硬件提出高度差异化的需求。RISC-V 的开放性和可扩展性天然适配 AI 的定制化需求,正在成为 AI  时代的主流指令集选择。为此,RISC-V  国际协会已经在积极推动面向 AI 的矩阵扩展指令集(见下图 ),而且 RISC-V 的灵活性可以更好地支持通推一体架构(见下图 )。

RISC-V 需要 AI:一方面,RISC-V 要成为主流生态,很难在存量市场上从 x86 和 ARM 手中抢占份额,必须寻找新兴应用场景,而 AI 推理正是一个适合 RISC-V 的新兴赛道。另一方面,RISC-V 作为后起生态,若想尽快走向主流,就必须充分发挥 AI 技术来加速生态关键核心技术的突破(第二节和第三节将专门介绍如何利用 AI 加速芯片开发与应用迁移)。

1.3 软件生态壁垒将发生根本性改变,生态最大短板是量产芯片

当前 RISC-V 生态面临两大短板:软件生态不成熟,以及缺乏规模量产芯片。

在 AI 时代,关于软件生态不成熟的认识需要刷新了。相比 x86 和 ARM 已形成的上千万应用,RISC-V 的软件生态确实依然弱小。将软件应用从 x86 和 ARM 指令集迁移到 RISC-V,是 RISC-V 生态建设中必须完成的一项艰巨任务。以往,软件生态的迁移成本高、门槛高,一直是 CPU 生态竞争的核心壁垒。然而,随着 AI Agent(智能体)技术的快速发展,代码迁移、适配、调试和优化的成本将出现数量级的下降,这将从根本上改变指令集生态竞争的格局。在此做个预告:今年10月的中国峰会上,将会有一个面向 x86/ARM 到 RISC-V 的软件迁移智能体正式亮相。

当软件迁移不再是 RISC-V 生态的最大短板时,如何实现高性能 RISC-V芯片的规模量产便会成为新的最大短板。尽管今年欧洲峰会上涌现出一批支持 RVA23 的芯片,但美中不足的是,都尚未达到百万量级的规模量产阶段,多数仍处于原型样片和测试芯片阶段,仍需1至2轮迭代才能形成规模量产,预计还需要2年左右时间。高性能处理器的最大挑战正是从 POC(概念验证)到规模量产的跨越。能否实现规模量产,是核心竞争力的直接体现,也是 RISC-V 高性能芯片必须突破的关卡。

1.4 全球 RISC-V 区域特色逐渐形成,开源成为中欧共识

当前,全球 RISC-V 生态呈现出明显的区域特征:

  • 欧洲:关注前沿技术与基础研究,产业落地相对薄弱;
  • 美国:关注资本导向的技术整合,产业应用比欧洲好些;
  • 中国:关注应用落地、产业转化,并积极探索基于RISC-V的各种创新技术。

中国与欧洲在战略方向上高度一致,尤其在“用开源实现自主可控”这一点上拥有更多共同语言,为中欧开源芯片合作奠定了基础。很高兴看到我们团队的工作在国际上已有一定知名度,香山、一生一芯已形成一定的国际影响力,拥有相当数量的国际关注者和“粉丝团”;UCAgent 今年首次在国际峰会亮相便备受瞩目,成为香山团队在智能体与工具链方向的新名片;开芯院今年也将迎来首批欧洲企业合作伙伴,标志着国际合作正从人才培养走向产业落地。


RISC-V 欧洲峰会的观察与体会,与我最近反复思考的两个关于 RISC-V 生态相关的问题形成了合鸣:

  • 第一个问题:芯片敏捷开发最终能达到什么效果?

  • 第二个问题:AI 大模型和 Agent 的快速发展,会对软件生态带来什么影响?

下面分别展开分析。

2. 芯片敏捷开发最终能达到什么效果?

2.1 敏捷开发的评价方式

我们团队从2016年开始使用 Chisel 语言,2020年正式启动香山项目,到今天已有十年的芯片敏捷开发实践经历,这个过程中对其认识也在不断加深。如今,我们初步形成了一个评价芯片敏捷开发的标准——在保障高质量交付的前提下,将一款芯片从项目启动到流片这一阶段内的总人力投入数倍降低。

这里需要强调两点:

第一,敏捷开发不是简单追求“更快流片”。如果以牺牲质量为代价,流片越快,返工越快,最终成本反而更高。真正有价值的敏捷开发,必须建立在高质量交付基础上。

第二,所谓“高质量交付”,不仅包括功能正确,还应包括 PPA 目标达成度、首硅成功率、可量产性、长期可靠性、软件生态适配和企业客户导入成本等因素。

以高性能处理器为例,传统一款 ARM Neoverse N2 级别的处理器 / SoC 项目,从处理器核 IP、SoC 集成、验证、物理实现到最终流片,如果按完整工程口径估算,大概需要上万人月投入——200–300人团队投入3–4年。

敏捷开发的目标,就是在不牺牲质量的前提下,把这个万级人月投入持续压低。以香山·昆明湖为例,2022年8月启动联合开发,到2025年10月企业完成 SoC 集成并流片,按联合开发团队约150人估算,总投入约为5000人月。

从10000人月到5000人月,这正得益于香山探索出的一条高性能处理器敏捷开发的新路径。

2.2 香山突出的 ST 能力与敏捷验证实践

香山为什么能够省出相当一部分人力?核心原因是形成了一整套敏捷验证能力,尤其是在系统级测试和系统级调试层面(即 System Test,ST),形成了非常突出的能力。

传统企业往往更强调单元测试(即 Unit Test,UT),在单元级尽量把bug 拦截住。这样做的好处是 bug 发现早、定位边界清晰、修复成本低。但代价是需要投入大量验证工程师。

但香山面临的现实约束是:我们不可能像海思等大公司那样投入大量人力做极其完整的 UT。因此,在香山早期实践中,UT 层面确实做了较大妥协。根据内部复盘口径,UT bug 拦截率一度只有23%。但香山团队通过DiffTest、FPGA 原型验证、系统级 trace 分析、自研敏捷验证工具和全栈调试能力,在 ST 层面拦截和修复了大量复杂 bug。内部统计显示,ST 层面修改 bug 的比例达到56%。

这组数据如果放到传统验证理念下看,可能显得有些反常:通常越晚发现bug,代价越高。但香山的特殊之处在于,团队成员具有很强的全栈能力,既懂硬件、微架构、RTL,也懂软件、编译器、操作系统和系统调试;同时还能创造新的工具来增强 ST 层面 bug 的可观测性和可调试性。

因此,香山团队最突出的能力是在 UT 投入不足的现实约束下,依靠强大的 ST 能力,把大量复杂 bug 在 ST 阶段高效拦截和修复,保障高质量交付。

这是一种高人效的敏捷验证模式。但也必须看到,这种模式有明显风险。ST 层面的 bug 往往涉及软硬件交互、缓存一致性、异常中断、内存系统、操作系统、驱动和真实 workload,定位复杂度通常远高于 UT。更重要的是,这种模式高度依赖全栈能力突出的顶级工程师,而这样的人才非常稀缺,企业也很难大规模招聘。

因此,香山当前模式的有效性,既是敏捷方法和工具的成功,也有“天才团队”的因素。下一阶段的关键,不是继续依赖少数顶级工程师在 ST 层面兜底,而是要通过 AI Agent 来把此前的短板 UT 给补齐,从而让香山的高质量交付能力再上一个台阶,达到百万量级规模量产无故障。

2.3 如何进一步实现1000人月迭代一轮的目标?

现在我们已经初步实现了从万级人月到5000人月的压缩。下一步,可以把目标设定得更有挑战性——在充分发挥 AI Agent 和敏捷工具链优势的情况下,争取实现1000人月的一轮高性能处理器迭代。

1000人月意味着什么?如果按100人团队计算,就是10个月完成一代重要版本,从而支持每年在中国 RISC-V 峰会发布一代新版本香山的节奏。

从当前5000人月的投入看,可以粗略拆分为两部分:

  • 设计侧约1000人月,包括架构设计、RTL 设计、部分物理设计协同;

  • 验证侧约4000人月,包括 UT、IT、ST、FPGA 原型、系统调试等。

未来要实现1000人月目标,验证侧和设计侧都必须大幅压缩。

(1) 验证侧:AI Agent 补齐 UT 短板

过去香山 UT 做得不够理想,但并不意味着 UT 没有人力投入。事实上,香山团队有一支近50人的队伍曾经有相当长时间都在做 UT,同时设计侧也需要配合投入。粗略估算,UT 及其相关配合工作消耗了2500–3000人月,但相比于海思等芯片大企业,香山的 UT 投入远远不足,因而 bug 拦截效果并不理想(23%),距离传统芯片开发模式下约80%的拦截率还有较大差距。

幸运的是,这一部分最有机会通过 AI Agent 实现数量级加速。原因在于,UT 相比 ST 更适合 AI Agent,前期香山团队开发的 UCAgent 在UT 验证方面已经展现出验证效率数量级提升的潜力。因此,通过AI Agent把 UT bug 拦截率从当前的 23% 提升到80%,再结合香山原本就很强的 ST 能力,就有可以实现更高质量的交付。

(2) 验证测:IT / ST层次增强路径

AI 对 IT 也会有效,因为集成测试中有大量重复性的规范校验、接口检查、协议验证、配置组合测试和回归分析工作,可以由 Agent 辅助完成。

但 ST 层面的重点,是进一步增强系统级可调试能力。香山已经有DiffTest 等非常有价值的工具,但在 FPGA 平台上每次修改后都需要很长时间重新综合,ST 调试效率受到严重影响。因此,后续还需要进一步加强 FPGA 可调试性,尤其是系统级 trace 能力、关键状态可观测性、增量式综合等能力。目前来看,基于FPGA的增量式综合和调试基础设施,是ST层面敏捷验证继续提效的关键。

(3) 设计侧:AI 加速设计空间探索(DSE)

设计侧当前约1000人月,未来目标是压缩到400人月左右。这里最有潜力的方向是 DSE,也就是设计空间探索。

学术界在 AI 加速 DSE、性能 / 功耗预测、自动化架构探索方面已有大量研究。我们可以充分利用这些研究,引导学术界把相关方法应用到香山平台上。

2.4 后续几个主要任务

总结来看,围绕香山开源处理器项目,下一阶段要实现芯片敏捷开发能力继续提升,主要有以下几项任务:

(1) 建设 UT 层面的 AI 辅助能力与验证流程。这是必须做、而且优先级最高的任务。它不仅是技术问题,更是开发流程问题。我们不仅让AI Agent实现自动化UT验证,而且要优化开发流程,像软件工程那样实现单元级代码“谁设计,谁负责”。

(2)增强 ST 层面的 FPGA 可调试能力。除了继续强化 DiffTest 能力,还必须考虑增量式综合、系统级 trace、关键状态可观测性和自动化 bug triage,以缩短每次系统级调试的反馈周期。

(3)建设敏捷高效的 DSE 能力。要把学术界已有的 AI + DSE 方法引入香山平台,在真实性能模型、workload、PPA 数据和工程工具链之间建立闭环。

(4)强化架构-物理设计协同能力。未来高性能处理器迭代,不能只看架构和 RTL。架构、微结构、物理实现、时序、功耗、面积必须更早协同。AI 可以在约束生成、PPA 预测、时序问题定位等环节发挥作用。

(5) 将香山经验从“专家能力”沉淀为“平台能力”。香山过去的优势在于少数全栈专家和工具创造能力,未来必须把这些经验沉淀为流程、平台、知识库和可复用 Agent,让更多团队能够复制这种敏捷开发能力。

3. AI 快速发展对软件生态带来什么影响?

3.1 跨指令集迁移应用成本巨大

AI 大模型对软件编程的影响巨大,已经让一批程序员感受到职业压力。但对于 RISC-V 生态建设来说,AI 大模型和 AI Agent 的发展,恰恰带来了前所未有的机遇。

过去每当出现一个新指令集,最大的难点就是:存量应用如何迁移到新 ISA?

迁移应用需要大量人力,因为工程师要处理编译错误、依赖缺失、架构相关代码、平台 API 差异、三方库适配、测试失败、性能退化等问题。

我们的合作伙伴企业在 RISC-V 芯片产品推广过程中,有用户提出要运行国产软件 WPS。这让 RISC-V 芯片企业感到无能为力,因为 WPS 包含约4000万行 C/C++ 代码,要将其迁移至 RISC-V 终端设备上,工作量巨大——具体可参考《鸿蒙开物》一书中提到的一个案例:

2023年9月,金山公司在华为10多位资深驻场工程师的支持下,组建了一支30多人的团队,全力攻关将 WPS 移植到鸿蒙操作系统。攻关任务启动后,仅仅是重新编译4000万行代码就耗时近一个月,投入近50人月(算上华为驻场工程师)。如果按5万元/人月估算成本,仅重新编译这一项任务就投入了超过250万元。此后,攻关团队继续夜以继日地调试 bug,终于在2023年12月底实现了第一个可正常运行的、最原始的 WPS预览版,转而进入到优化阶段。粗略估计,针对 WPS 适配鸿蒙操作系统这一攻关任务,金山与华为累积投入了近千万元。

虽然这个案例是跨操作系统迁移,从安卓迁移到鸿蒙,但这些数字对于跨 ISA 迁移的成本依然有参考意义,即说明了一个事实:大型复杂应用迁移成本非常高,单靠应用厂商自发迁移,动力往往不足。如今 x86 和 ARM 生态中都积累了上千万个应用,其中常用应用也有几万级别。若按传统思路,每个应用迁移需要投入千万级,那么新 ISA 要建立完整软件生态,需要投入的总成本将高达上千亿元。目前,只有像华为这样具备强大组织能力和战略投入能力的企业,才有可能推动鸿蒙这样的大规模迁移工程。

这就是传统 ISA 生态壁垒的来源。

3.2 AI Agent 将显著降低迁移成本

AI Agent 的出现,将改变这种高成本迁移局面。

将一个应用从一个 ISA 迁移到另一个 ISA,工程师要面对大量错误信息和重复性工作。例如:

  • 编译器报错;

  • 依赖库缺失;

  • C / C++ 宏定义不兼容;

  • SIMD intrinsic 不支持;

  • 汇编代码需要重写;

  • 字节序、对齐、内存屏障差异;

  • 平台 API 不一致;

  • 构建系统脚本需要修改;

  • 测试失败需要定位;

  • 性能热点需要重新优化;

  • ……

这些工作几乎不需要原创性发明,而是需要经验、规则、工具和大量耐心。它们非常适合沉淀到大模型中,然后由 AI Agent 自动化处理,形成一个完整自动化迁移闭环:扫描源码 → 识别架构相关代码 → 分析依赖 → 修改构建系统 → 处理编译错误 → 替换不兼容库 → 自动运行测试 → 定位测试失败 → 给出性能优化建议 → 更新迁移知识库

为了验证上述技术路径的有效性,中国科学院软件所正在开发一个从 x86 / ARM 到 RISC-V 的源码迁移工具箱 Agent,针对有源代码的应用场景。软件所本来在编译器、操作系统和软件迁移方面有较好基础,与 AI Agent 结合后,进展非常快。按照当前规划,今年10月份的中国峰会上将会推出一版能支持复杂应用迁移的智能体,值得期待。

这个迁移智能体主要针对有源代码场景。对于只有二进制的情况,中国科学院计算所的编译团队正在开发面向 RISC-V 的二进制翻译技术,同样与AI结合来加速翻译效率。

3.3 AI Agent 重塑 ISA 生态壁垒

如果源码迁移智能体和二进制翻译技术都被证明有效,那么人们长期担心的 RISC-V 软件生态问题,就会被显著缓解。

传统观点认为,ISA 是处理器生态的根,也是生态隔离的壁垒。一个软件在 x86 上开发,迁移到 ARM 或 RISC-V 往往成本很高;一个 ISA 软件生态形成后,应用、工具链、驱动、SDK、开发者社区、商业支持都会围绕它形成惯性。

AI Agent 不会让这些壁垒瞬间消失,但会让其中最昂贵的一部分——应用迁移和适配成本——显著下降。因此,在AI技术快速发展的背景下,我们需要刷新关于生态壁垒的新认识,做出新的研判:ISA 将不再是生态壁垒,AI Agent 将显著降低跨 ISA 软件迁移的边际成本,使 ISA 生态对存量应用的锁定效应弱化。

未来我们可能实现这样的局面:一个软件最初在 x86 上开发,但借助 AI Agent,可以较低成本迁移到 ARM、RISC-V 甚至 LoongArch 上运行。

这将极大改变软件生态建设的成本结构。过去新 ISA 最大的问题是“没有应用”;未来如果迁移成本大幅下降,竞争重点就会转向“谁的硬件运行效率更高”——这对 RISC-V 是重大机遇。

3.4 开放灵活的 RISC-V 更有优势

如果应用迁移成本显著下降,指令集的角色会发生变化。过去指令集不仅是软硬件接口,也是生态壁垒。因为软件迁移成本高,一个 ISA 一旦积累大量应用,就形成强锁定效应。

但如果 AI Agent 能够显著降低跨 ISA 迁移成本,那么 ISA 的生态锁定作用会变弱,ISA 更接近其本质:它是软件和硬件之间的接口。

在这种情况下,针对同一个软件,哪个指令集和硬件平台运行效率更高,哪个平台就更有优势。这恰恰有利于 RISC-V,因为 RISC-V 的核心优势是开放、模块化、灵活、可定制。它可以根据不同软件和 workload 特征,在硬件层面做更有针对性的定制优化。

因此,当软件迁移壁垒降低后,RISC-V 的开放灵活性会被进一步放大。这意味着,AI 大模型和智能体技术的发展,可能会同时改变两个关键问题:

  • 在芯片侧,AI Agent 降低高性能处理器研发与验证成本;
  • 在软件侧,AI Agent 降低跨 ISA 软件迁移成本。

这两个变化叠加起来,将使 RISC-V 在 AI 时代获得新的战略窗口。

4. 总结:AI 时代 RISC-V 生态建设的两个关键变量

综上,RISC-V 生态建设正在面临两个关键变量。

第一个变量是芯片研发生产率革命。香山的实践已经证明,依靠开源协同、敏捷验证工具、全栈团队和强 ST 能力,高性能处理器研发可以从传统万级人月工程压缩到5000人月级别。下一阶段,如果 AI Agent 能够进入 UT、IT、ST、DSE 和架构-物理协同流程,就有可能进一步向1000人月级别迭代目标迈进。

第二个变量是软件迁移成本坍缩。AI Agent 将显著降低跨 ISA 应用迁移成本,这将削弱传统 ISA 的存量生态锁定效应,使开放灵活的 RISC-V 更容易发挥硬件定制和软硬件协同优化优势。

因此,AI 时代的 RISC-V 生态建设,不能只围绕“开源指令集”展开,而应与其他多个层次紧密协同,形成更完整的开源组合:

开源芯片 + 开源软件 + 开源大模型 + 开源 Agent。

如果这条路线走通,RISC-V 将成为 AI 时代当仁不让的主流指令集。


欢迎您关注开芯院公众号


点我访问原文链接