VeriSilicon（芯原微電子）：NPU IPの累計出荷数が1億個を突破　AI製品布石を公開-Pandaroidニュース情報です。

VeriSilicon（芯原微電子）：NPU IPの累計出荷数が1億個を突破　AI製品布石を公開

2024-06-14半導体中国国産化AI半導体

6月13日、2024上海国際組込み展示会が開幕し、その中でVeriSilicon社（芯原微電子）は「クラウドからエンドまで、あなたの指先でAI」をテーマに「VeriSilicon AIシンポジウム」を開催した。

VeriSilicon社の取締役副社長兼IP事業部長である戴偉進（ダイ・エイジン）氏は、VeriSilicon社のAI製品ラインの布石を紹介し、NPU IP研究開発部長であるKenan Cha氏は、NPU IPに焦点を当て紹介した。

報告によると、過去7年間、VeriSilicon社は組み込みAI/NPUの世界的リーダーであり、同社のNPU IPは72の顧客によって128のAIチップに採用され、主にIoT、ウェアラブル、スマートテレビ、スマートホーム、セキュリティ・監視、サーバー、車載電子機器、スマートフォン、タブレット、スマートヘルスケアなど10の市場分野に適用されている。現在、VeriSilicon NPU IPを搭載したAIチップは世界で1億個以上出荷されている。

クラウドやエッジでの生成AIモデルの開発が活発化する昨今のトレンドの中で、VeriSilicon社はエッジサイドVIP9X00やAI-GPU IPに特化したNPU IPも発売している。クラウド向けには、VeriSilicon社にはTensor Core GPU IP - CCTC-MPもあるという。

VeriSiliconのNPU IP研究開発ディレクターであるKenan Cha氏は、エンドサイドのAI性能は非常に重要だが、エンドサイドIPでは消費電力と面積がより重要であり、より優れたPPAを持つ必要があると述べた。クラウド側では、高性能でTOPSが非常に高く、トレーニングや推論を行うことができなければならない。シングルカードでの推論トレーニングだけでなく、分散推論トレーニングを行うには、マルチカード、マルチマシン機能が必要である。そのため、より一般的なGPGPUプログラミングモデルが必要であり、より高い浮動小数点演算と固定小数点演算の比率が必要であり、高精度がより重要であり、さらに大規模なエコシステムへのアクセスも必要だという。

過去2年間で、Transformerは基本的に支配的なモデル・アーキテクチャになり、大きな言語モデルだけでなく、視覚、音声、Pixelなどで、すべてのパフォーマンスが向上した。従来の畳み込みニューラルネットワークに比べて、Transformerの全体的な効果はより明白である。そのため、VeriSiliconの最新のNPUアーキテクチャも、4bit、8bit、16×4、16×8など、Transformerを最適化するために特別にカスタマイズされている。4bitや8bitの量子化や重みの圧縮が可能になることで、帯域幅の消費を大幅に削減できる。汎用的な行列演算であるGEMM/GEMVの場合、大規模なモデルでは、Transformer内部に多数の畳み込み演算が必要であり、また、Transformer内部に異なるVectorを直接組み込んだ場合の帯域幅も必要である。 VeriSilicon社は、Transformer関連ネットワークの性能を10倍向上させた。

Kenan Cha氏によると、VeriSilicon社のエンド側NPUは48TOPSの演算能力があり、エンド側の大規模モデルの運用をサポートできる。例えば、Stable Diffusion 1.5モデルでは、VeriSiliconのNPUは20ステップの推論を2秒で実行することができ、LLaMA2 7Bモデルでは、VeriSiliconのNPUは20トークンを1秒で生成することができるという。

現在、VeriSilicon社のNPUは、すでにスマートフォン、AI PC、スマートカーなどのエッジデバイスの大規模モデルの運用をサポートしている。

AIアクセラレーション専用のNPU IPに加え、VeriSilicon社はGPU向けに自社開発した一連のGPU IPも有しており、これらは一般的なAIアクセラレーションに広く利用されている。

戴氏によると、ベリシリコンはGPU分野で20年以上の実績を持ち、同社のGPU IPを統合したチップは世界で20億個近く出荷されているという。

現在の市場需要に基づき、VeriSilicon社は、自社のNPU IPの拡張性と拡張性に基づき、高性能クラウドコンピューティングから低消費電力エッジコンピューティングまでをカバーする垂直ソリューションを開発した。一方、VeriSilicon社は、進化し続ける人工知能のアプリケーション・ニーズに対応するため、自社のNPU IPやISP IPなどの豊富なプロセッサIPをベースに、一連の革新的なAI-ISP、AI-GPU、その他のサブシステムも発表している。

また、ビデオ処理では、VeriSilicon社のVPU（Video Processor Unit）IPをベースとしたVeriSiliconの第1世代ビデオ・トランスコーディング・アクセラレーション・ソリューションが、従来のハイエンドCPUの1/13の消費電力でありながら、6倍のトランスコーディング能力を提供できる。この革新的な技術は、すでに世界の大手チップセット企業による5nmプロセスをベースとしたカスタマイズ・メディア・アクセラレーター・チップへの適用に成功しており、現在量産段階に入った。

開発者による様々な大規模モデルの展開と様々なAIアプリケーションの開発を容易にするため、VeriSilicon社は独自のAI-Computing IP製品群に基づく、AI-Computingソフトウェアフレームワークのサポートも開始したという。

（原文：https://www.icsmart.cn/78680/）

本記事のリンク：https://www.pandaroid-info.com/news/2546

IC Smart

SIA：2024年の世界半導体売上高は前年比16％増の6,112億ドルに

Hiascend（昇騰）：9月に発売される910C、性能はNVIDIA H200に匹敵