VeriSilicon(芯原微電子):NPU IPの累計出荷数が1億個を突破 AI製品布石を公開
2024-06-14半導体中国国産化AI半導体

6月13日、2024上海国際組込み展示会が開幕し、その中でVeriSilicon社(芯原微電子)は「クラウドからエンドまで、あなたの指先でAI」をテーマに「VeriSilicon AIシンポジウム」を開催した。


VeriSilicon社の取締役副社長兼IP事業部長である戴偉進(ダイ・エイジン)氏は、VeriSilicon社のAI製品ラインの布石を紹介し、NPU IP研究開発部長であるKenan Cha氏は、NPU IPに焦点を当て紹介した。

 


82-1.jpg

 


報告によると、過去7年間、VeriSilicon社は組み込みAI/NPUの世界的リーダーであり、同社のNPU IPは72の顧客によって128のAIチップに採用され、主にIoT、ウェアラブル、スマートテレビ、スマートホーム、セキュリティ・監視、サーバー、車載電子機器、スマートフォン、タブレット、スマートヘルスケアなど10の市場分野に適用されている。現在、VeriSilicon NPU IPを搭載したAIチップは世界で1億個以上出荷されている。

 


クラウドやエッジでの生成AIモデルの開発が活発化する昨今のトレンドの中で、VeriSilicon社はエッジサイドVIP9X00やAI-GPU IPに特化したNPU IPも発売している。クラウド向けには、VeriSilicon社にはTensor Core GPU IP - CCTC-MPもあるという。

 


82-2.png

 


VeriSiliconのNPU IP研究開発ディレクターであるKenan Cha氏は、エンドサイドのAI性能は非常に重要だが、エンドサイドIPでは消費電力と面積がより重要であり、より優れたPPAを持つ必要があると述べた。クラウド側では、高性能でTOPSが非常に高く、トレーニングや推論を行うことができなければならない。シングルカードでの推論トレーニングだけでなく、分散推論トレーニングを行うには、マルチカード、マルチマシン機能が必要である。そのため、より一般的なGPGPUプログラミングモデルが必要であり、より高い浮動小数点演算と固定小数点演算の比率が必要であり、高精度がより重要であり、さらに大規模なエコシステムへのアクセスも必要だという。

 


83-3.jpg

 


過去2年間で、Transformerは基本的に支配的なモデル・アーキテクチャになり、大きな言語モデルだけでなく、視覚、音声、Pixelなどで、すべてのパフォーマンスが向上した。従来の畳み込みニューラルネットワークに比べて、Transformerの全体的な効果はより明白である。そのため、VeriSiliconの最新のNPUアーキテクチャも、4bit、8bit、16×4、16×8など、Transformerを最適化するために特別にカスタマイズされている。4bitや8bitの量子化や重みの圧縮が可能になることで、帯域幅の消費を大幅に削減できる。 汎用的な行列演算であるGEMM/GEMVの場合、大規模なモデルでは、Transformer内部に多数の畳み込み演算が必要であり、また、Transformer内部に異なるVectorを直接組み込んだ場合の帯域幅も必要である。 VeriSilicon社は、Transformer関連ネットワークの性能を10倍向上させた。

 


Kenan Cha氏によると、VeriSilicon社のエンド側NPUは48TOPSの演算能力があり、エンド側の大規模モデルの運用をサポートできる。 例えば、Stable Diffusion 1.5モデルでは、VeriSiliconのNPUは20ステップの推論を2秒で実行することができ、LLaMA2 7Bモデルでは、VeriSiliconのNPUは20トークンを1秒で生成することができるという。

 


82-4.png

 


現在、VeriSilicon社のNPUは、すでにスマートフォン、AI PC、スマートカーなどのエッジデバイスの大規模モデルの運用をサポートしている。

 


AIアクセラレーション専用のNPU IPに加え、VeriSilicon社はGPU向けに自社開発した一連のGPU IPも有しており、これらは一般的なAIアクセラレーションに広く利用されている。

 


戴氏によると、ベリシリコンはGPU分野で20年以上の実績を持ち、同社のGPU IPを統合したチップは世界で20億個近く出荷されているという。

 


現在の市場需要に基づき、VeriSilicon社は、自社のNPU IPの拡張性と拡張性に基づき、高性能クラウドコンピューティングから低消費電力エッジコンピューティングまでをカバーする垂直ソリューションを開発した。 一方、VeriSilicon社は、進化し続ける人工知能のアプリケーション・ニーズに対応するため、自社のNPU IPやISP IPなどの豊富なプロセッサIPをベースに、一連の革新的なAI-ISP、AI-GPU、その他のサブシステムも発表している。

 


82-5.png

 


また、ビデオ処理では、VeriSilicon社のVPU(Video Processor Unit)IPをベースとしたVeriSiliconの第1世代ビデオ・トランスコーディング・アクセラレーション・ソリューションが、従来のハイエンドCPUの1/13の消費電力でありながら、6倍のトランスコーディング能力を提供できる。この革新的な技術は、すでに世界の大手チップセット企業による5nmプロセスをベースとしたカスタマイズ・メディア・アクセラレーター・チップへの適用に成功しており、現在量産段階に入った。

 


開発者による様々な大規模モデルの展開と様々なAIアプリケーションの開発を容易にするため、VeriSilicon社は独自のAI-Computing IP製品群に基づく、AI-Computingソフトウェアフレームワークのサポートも開始したという。



(原文:https://www.icsmart.cn/78680/

[注] 新闻内容由AI翻译生成,如有表述不尽完善之处,敬请谅解!
Please note: This news article was translated by AI. We apologize for any imperfections in the translation.
前の記事:
SIA:2024年の世界半導体売上高は前年比16%増の6,112億ドルに
次の記事:
Hiascend(昇騰):9月に発売される910C、性能はNVIDIA H200に匹敵