GPU公司曦望(Sunrise)完成超 10 亿元融资,估值破百亿
中国 AI 推理 GPU 赛道再迎重磅融资。据凤凰网消息,国内 AI 推理 GPU 企业曦望(Sunrise) 完成新一轮超10 亿元人民币融资,估值突破100 亿元,成为中国纯推理 GPU 领域首家独角兽企业。
这是 2026 年 AI 需求向推理侧转移背景下,国内 GPU 行业最大单笔融资之一。曦望源自 AI 巨头商汤科技分拆,至今已完成7 轮融资,累计融资额约40 亿元。
本轮资金将主要用于:
下一代启望 S3(Qiwang S3) 推理 GPU 的量产与交付
全栈软件生态建设
后续 S4、S5 芯片的持续研发迭代
启望 S3:主打推理效率,采用 LPDDR6 架构
曦望于 2026 年 1 月正式发布旗舰推理 GPU 启望 S3,是国内首款采用 LPDDR6 显存、同时兼容 LPDDR5X的推理 GPU。
与高端训练 GPU 普遍采用 HBM 路线不同,该芯片专为智能体(Agent)推理场景量身设计,从 AI Core 架构到存储 I/O 系统进行全栈重构。
架构思路源于推理负载截然不同的存储需求:在主流高并发、长上下文云场景中,KV 缓存可占总内存的 80% 以上。
S3 基于 LPDDR6 的设计:
提供充足推理带宽
提升存储容量
功耗降低50%
完美匹配推理场景大容量、低成本、低功耗的核心诉求。
算力层面
S3 解决了通用 GPU 算力利用率偏低的痛点:
推理性能较上一代 S2 提升 5 倍
目标将Token 成本降低 90%
在大模型推理中,GEMM(通用矩阵乘法)与 Attention 操作占算力超 90%,S3 将核心算子利用率推至:
GEMM:约99%
Flash Attention:约98%
大幅提升整体效率。
企业定位:All-in 推理,已实现数万片量产
曦望董事长徐冰表示,2026 年 AI 推理需求预计将达到训练需求的4–5 倍,过去半年推理算力租赁价格上涨近40%。
公司已完成三代推理 GPU研发,实现数万片规模量产。
作为国内首家纯推理 GPU 独角兽,曦望的崛起标志着中国 AI 芯片从 “训推一体” 向专业化推理芯片的关键转向。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码