160TOPSp次世代エッジ用AIチップ「Houmo M50」が正式発表
2025-07-28半导体行业动态AI半导体

2025年7月25日、WAIC 2025開幕を前に、人工知能(AI)チップ開発の後摩智能(Houmo Intelligence)は次世代エッジAIチップ「Houmo M50」を正式発表した。同時に「Liqing(力擎)」シリーズのM.2カード、「Limou(力謀)」シリーズのアクセラレータカード、コンピューティングボックスなどのハードウェアもリリースし、モバイル端末からエッジシナリオまでをカバーする完全なプロダクトマトリックスを形成した。Houmo M50チップは、160TOPS@INT8、100TFLOPS@bFP16という物理演算能力を実現できる。最大48GBのメモリと153.6 GB/sという超高帯域幅を組み合わせ、代表的な消費電力はわずか10W(スマホ急速充電並み)だ。また、PC、スマートスピーカー、ロボットなどのインテリジェントモバイル端末で、1.5Bから70Bパラメータのローカル大規模言語モデルを効率的に動作させることを可能になる。これにより、「高性能、低消費電力、プラグアンドプレイ」を実現した。



image.png



現在、大規模モデル業界は大きな変革期を迎えている。ChatGPTはわずか2年でGoogleが11年かけて築いた年間検索量規模に到達しており、スーパーアプリのユーザー1億人突破までの時間は、携帯電話時代の16年からChatGPTでは2週間にまで短縮された。業界は今後5年間で推論コストは大規模言語モデルのライフサイクルの80%以上を占めると予想されている。エッジ大規模モデル展開という「ラストワンマイル」の競争が、将来の産業構造を決める重要な転換点となる可能性がある。



高性能、高帯域幅、低消費電力というこの3つの指標こそが、メモリ内計算(Computing-in-Memory: CIM)技術の真価が発揮される領域で、Houmo Intelligenceは2020年からこの分野に注力してきた。この技術の集大成のM50チップは、第2世代SRAM-CIMデュアルポートメモリ内計算アーキテクチャにより、重みのロードと並列計算を同時に実行可能だ。



M50チップに加え、今回発表されたプロダクトマトリックスは、エンドサイドからエッジまでをカバーする多様なソリューションを形成している。「Liqing LQ50」M.2アクセラレータカードはガムサイズの標準M.2フォームファクタで、AI PC、AI Stick、コンパニオンロボットなどのモバイル端末に「プラグアンドプレイ」のエッジAI能力を提供し、7B/8Bモデルの推論で25トークン/秒以上をサポートできる。「Liqing LQ50 Duo」M.2アクセラレータカードは デュアルM50チップを統合し、320TOPSの演算能力で14B/32B大規模モデルのエンドサイド展開のボトルネックを突破した。「Limou LM5050」アクセラレータカード と 「Limou LM5070」アクセラレータカードはそれぞれ2個、4個のM50チップを統合し、シングルマシンおよび超大規模モデル推論向けに高密度演算能力(最大640TOPS)を提供できる。また、「BX50」コンピューティングボックスはエッジシナリオに適応し、32チャンネルのビデオ分析とローカル大規模モデルの実行をサポートできる。



これらの製品は、消費財端末、スマートオフィス、スマート産業など多様な分野に広く応用可能で、いずれもオフライン状態でフルローカルの処理を実現でき、データをネットワーク経由で転送するリスクを排除する。例えば、消費財端末はノートPC、タブレットなどのデバイスにローカル大規模モデル推論能力を付与し、ネット接続なしでインテリジェントなインタラクションやコンテンツ生成を完了できる。これにより、ユーザーのプライバシーデータはデバイス内で完全に閉ループ処理される。スマートオフィスの場合は、ネットワーク接続が切断された環境でも、スマート会議システムが多言語翻訳や議事録生成を実現できる。つまり、会議内容がクラウドに触れたり漏洩したりしない。Houmo Intelligenceは、メモリ内計算技術と大規模モデルの融合を通じて、AI大規模モデルがエンド&エッジ側で「オフライン利用可能、データ記録を外部に漏らさない」ことを実現でき、「低消費電力、高セキュリティ、優れたユーザー体験」を特徴とする新たなエッジ・インテリジェンス・エコシステムを構築している。



将来に向けて、Houmo Intelligenceは次世代DRAM-PIM(Processor-in-Memory)技術の研究開発を開始した。計算ユニットをDRAMアレイに直接埋め込むことで、計算と記憶の連携をさらに緊密かつ効率的にする。この技術は1TB/sのオンチップ帯域幅を突破し、エネルギー効率を現行比でさらに3倍向上させ、百億パラメータの大規模モデルをエンドデバイスで普及させ、より強力なAI演算能力をPCやタブレットなどのデバイスに組み込むという。



このような技術の方向性とビジョンは、主要な産業プレイヤーからも評価されている。ここ2年間で、Houmo Intelligenceは中国移動(チャイナモバイル)産業チェーン発展基金、北京市人工知能基金など複数の機関から出資を受けており、エンド&エッジ向け大規模モデルチップ分野での持続的なイノベーションを支援している。Houmo IntelligenceのCEO 呉強(ゴウ・チャン)は「M50の発表は単なる始まりに過ぎない。我々の目標は、大規模モデルの演算能力を電力のようにどこでも利用可能にし、文字通りあらゆる生産ライン、あらゆるデバイスに届けることだ。」と述べている。



image.png


image.png


image.png


image.png






(原文:https://www.icsmart.cn/94593/)

[注] 新闻内容由AI翻译生成,如有表述不尽完善之处,敬请谅解!
Please note: This news article was translated by AI. We apologize for any imperfections in the translation.
上一篇
総投資額約300億円、成都Silan自動車用半導体パッケージ工場第2期プロジェクト起工式を実施
下一篇
中国政府、世界人工知能協力機構の設立を提唱