
中国GPUメーカー/曦望(Sunrise):再び10億元超の資金調達を完了

4月20日、中国国内でAI推論向けGPUのフルスタック自社開発を手がける杭州曦望芯科智能科技有限公司(以下、「Sunrise社」と略称)は、公式WeChatアカウントを通じ、10億元(約230億円)超の新規資金調達ラウンドを完了したと発表した。
同社は昨年7月初旬にも、約10億元(約230億円)規模の資金調達を終えたばかりだ。それからわずか10カ月も経たないうちに、再び10億元超の大型調達を完了させた。
これにより、分社独立からわずか1年余りで累計7回の資金調達を完了し、調達総額は約40億元(約920億円)に達した。同社は中国国内で初めて企業価値が100億元(約2,300億円)を超えた、推論特化型GPUのユニコーン企業となっている。
今回調達した資金の主な使途は、次世代製品「啓望 S3」推論GPUの量産・出荷体制の確立、フルスタックソフトウェアエコシステムの構築、そして後継製品となる「S4」「S5」チップの研究開発に充てられる予定だ。
Sunrise社は今回の発表にあわせて、2026年は業界が「AIエージェント元年」と位置づける転換点だと指摘した。大規模言語モデルが「会話するだけ」の存在から「自ら考え、タスクを実行する」デジタルワーカーへと進化するにつれ、推論処理の需要は爆発的にのびている。NVIDIAが先頃開いたGTC 2026では、AI産業が「推論の実装」と「エージェントの普及」という新段階に入ったことが明確に打ち出され、「消費電力1ワット当たりのトークン処理量」こそがこれからの競争軸になるとの見方が示された。これはSunrise社が創業時から一貫して狙ってきた領域だ。
Sunrise社の董事長である徐氷(シュイ・ビン)氏は「AIコンピューティング基盤の重心はすでに訓練から推論へと完全に移った」と語った。「2026年には、AI推論計算需要は訓練需要の4~5倍に膨らみ、推論用計算リソースのレンタル価格はこの半年で40%近く上昇している」と現状を説明した。
公開資料によると、Sunrise社の前身は画像認識大手・商湯科技(SenseTime)の大型チップ部門であり、2024年末に独立した。高性能GPUおよびマルチモーダルシーン向けAI推論チップの研究開発と商用化に特化している。研究開発チームは8年にわたる技術蓄積と、累計20億元(約460億円)の研究開発投資、そして2世代にわたる量産チップによるエンジニアリング検証経験を持つ。同社は国産GPUによる代替を推し進める中核的企業へと成長しつつある。同社が掲げるのは、あらゆる産業のAI化を支える計算基盤を、従来比で10分の1のコストで提供し、電力効率を飛躍的に高めることだ。技術革新と産業連携を通じて、汎用人工知能(AGI)を誰もが使えるインフラにすることを最終目標としている。
現在の従業員数は400人に拡大し、うち研究開発者の割合は8割を超える。人材の出身元はNVIDIA、AMD、HiSilicon(ファーウェイ傘下)など中国国内外のトップ半導体企業に及び、修士以上の学位を持つ社員も8割以上だ。チップ設計、高性能計算、AIアルゴリズム、ソフトウェア開発まで、異なる専門性を持った人材が結集している。
具体的な製品ラインアップとしては、すでに量産済みの「Sunrise S1」「Sunrise S2」、そして量産間近の「S3」がある。

△左から:Sunrise社 S1、Sunrise S2-M1モジュール、Sunrise S2-X1アクセラレータカード
「S1」はクラウドおよびエッジ向けの画像認識推論専用チップで、主に映像解析モデルの推論に使われる。すでに出荷枚数は2万枚を突破した。
「S2」は大規模言語モデルの推論を見据えた汎用GPU(GPGPU)である。7ナノメートル(nm)プロセスを採用し、NVIDIAのCUDAエコシステムとの互換性を確保した。性能水準はNVIDIAの「A100」に迫る。命令セットからIPアーキテクチャ、演算子開発、コンパイラツールチェーンに至るまで、すべて自社で手がけた完全内製の製品だ。
Sunrise社が2026年1月に発表された新型フラッグシップ「啓望 S3」は、中国製GPUとして初めて次世代メモリー規格「LPDDR6」に対応した(LPDDR5Xとの後方互換性も確保)。同製品の最大の特徴は、AI訓練用に設計された従来のHBM(広帯域メモリー)の考え方に安易に乗らず、エージェントによる推論処理の本質を見極め、計算コアのアーキテクチャからメモリー入出力までを根本から再設計した点にある。

一般的な汎用GPUで課題となる「搭載した演算性能を引き出しきれない」という構造的な無駄を、「啓望 S3」は計算層の徹底したカスタマイズで解決した。これにより、推論性能は前世代比で5倍向上し、1トークンあたりの処理コストを90%削減することを目標としている。
具体的には、「啓望 S3」はGEMMおよびFlash Attentionという二つの基幹オペレーター(大規模モデル推論における総計算量の90%以上を占める)において、利用率をそれぞれ約99%および98%まで高めた。これにより、公称演算性能のほぼすべてが有効スループットへと変換され、同じハードウェア投資でより多くの同時リクエストを処理できる。
「啓望 S3」は128ビット命令セットと3D命令をサポートし、命令密度は従来のSIMTアーキテクチャを上回る。スレッドの独立したスケジューリング機能は、エージェント特有の複雑な制御フローにも正確に対応し、条件分岐に伴うパイプライン処理の停滞を排除した。さらに、ブロッククラスターや同報通信といった技術によってチップ上のデータ再利用効率を高め、外部メモリー帯域への依存度を低減。これにより、エージェントが何度も推論を繰り返す際の処理効率が大幅に向上した。
また、「啓望 S3」はFP16からFP4までの全経路における低精度演算をネイティブサポートする。DeepSeek V3/R1などの主要モデルにおいて、ほぼ劣化のないFP4推論を実現し、FP16比でスループットを3~4倍に向上させる。これはそのまま、サービス提供事業者にとっての採算性向上や、利用料金の柔軟な値下げ余地につながる。
インターフェース面では、「啓望 S3」はLPDDR6メモリインターフェース、高速SerDes+SUE融合インターコネクト技術、PCIe Gen6インターフェースという三つの先進高速インターフェース技術を革新的に統合した。これにより、メモリとIOという推論時代における最大のボトルネックに直接切り込み、インテリジェントエージェントが抱える3つの中核的課題を解決している。
産業サイクルの観点から見れば、訓練側の勢力図はすでに固定化しつつある一方で、推論側はエージェンティックAIの普及に伴い指数関数的成長局面に入っている。複数の調査機関は、今後5年間で推論向け計算市場の規模が訓練市場を大きく上回り、とりわけエージェント関連の処理が主たる成長要因になると予測している。
Sunrise社は、「啓望 S3」について、「推論処理のためにゼロから設計されたアーキテクチャ」「演算器利用率98~99%を達成した技術力」「隙のないエコシステム対応力」という、通常ならば両立が難しい三つの要素を兼ね備えた製品だと説明した。
徐冰董事長は次のように締めくくった。「啓望 S3は単なる性能向上版ではない。AI推論のコスト構造そのものを塗り替える製品だ。我々の目標は、推論コストを『100万トークンあたり0.01元(約0.23円)』まで引き下げること。いずれAIを水道や電気のような社会インフラにしたい。」
今回の資金調達を追い風に、2026年のSunrise社は「実装、成果、成長」の年と位置づけ、「啓望 S3」の量産出荷と、中国国内外の主要な大規模言語モデルやマルチモーダルモデル、エージェント開発フレームワークへの対応を急ぐ。同時に、次世代高性能推論GPU「啓望 S4」と、安全性を強化した推論GPU「啓望 S5」の技術開発計画もすでに固まっている。近接データ処理(Near-Memory Computing)や光電融合パッケージング(Co-Packaged Optics)といった最先端技術の研究開発も、今後さらに加速させる方針だ。
(為替換算レート:1人民元=23円で計算)
(原文:https://www.icsmart.cn/104093/)

