
4月20日、中国の音声認識大手の科大訊飛(アイフライテック)の深層推論大モデル「訊飛星火X1(Xunfei StarFire X1)」が全面アップグレードを実施した。業界唯一の中国全国産演算リソースでトレーニングされた深層推論大モデルとして、数学・コーディング・論理推論・文章生成・言語理解などの汎用タスクにおいて飛躍的な性能向上を達成した。モデルパラメータが同業他社のモデルより一桁小さい条件の下、全体的な効果はOpenAI o1やDeepSeek R1と同等だ。中国国産演算力をベースに学習させたフルスタック・自律制御型大型モデルが業界最高水準の実力と、継続的なイノベーションの可能性を持っていることが改めて証明された。

「星火X1」は、一般的な汎用タスクにおける大幅な進歩に加え、複雑な種類のデータを扱うシナリオも増加した。それによりモデルの一般化においても進歩を遂げ、複数の業界タスクにおいて業界をリードする能力を実証した。また、教育、医療、司法などの主要産業においても、その優位性をさらに拡大している。
企業や開発者のために、「訊飛星火X1」は、「速い思考、遅い思考の統一モデル」、新しいアップグレードモデルのカスタマイズと最適化ツールチェーンをデビューさせ、大規模モデルの民営化された展開とカスタマイズの敷居をさらに下げる。同時に、「訊飛星火 X1 API」は訊飛(アイフライテック)・オープンプラットフォームのオープンサービス上で開始された。計算力微調整ながら中国全国生産をサポートする最初の大規模モデルとして、「訊飛星辰MaaS」プラットフォームの同期オンライン「星火X1」は僅かな調整だけのサービスだ。
汎用能力で国際トップモデルに匹敵星火X1
アップグレードされた「星火X1」は、複数のタスクで突破し続け、優れた性能を発揮している。最新のテストセットの評価結果によると、「星火X1」は、一般的なタスクの効果評価において、OpenAI o1とDeepSeek R1を完全にベンチマークし、数学、知識クイズなどにおいて優れた性能を発揮した。

数学的な質問に対する回答や複雑な数学的論理推論の面では、「星火X1」は複雑な数式を正確に識別し、完全な解答を与えるだけでなく、厳密で明確な結果を出力することができる。論理的に推論する際に、あらゆる方向から考え、あらゆる可能性のある仮定について考えることで、より厳密で正確な結果を示す。コード能力の面では、「星火X1」はコード生成の精度を向上させるだけでなく、生成されたコードロジックの理解度をさらに向上させ、より複雑なプログラミングのニーズに対応し、問題の複数の可能性を考え、開発者が迅速に機能を実現できるようになる。 言語理解の面では、モデルの出力内容や形式がよりユーザーの指示に沿ったものとなり、より正確で深い思考結果を与えることができ、より首尾一貫した正確なコンテンツを生成することができる。
さらに、「星火X1」の長い思考連鎖(CoT)の機能は画像入力をサポートし、入力画像について相関的に考え、画像に含まれる複数の複雑な要素の可能な意味と目的を探り、より深いレベルの情報統合と推論を行うことができる。
「訊飛星火X1」の導入が容易で、カスタマイズの敷居が低い
「星火X1」のアップグレードは、一般的な能力を向上させるだけでなく、同時に業界指向のソリューション能力を強化し、業界のインテリジェント化を支援する。より多くのシナリオから、より複雑なタイプのデータを取り込むことで、モデルの一般化も進み、業界をリードする能力が多くの業界タスクで実証されている。教育、医療、司法といった最先端の主要産業でさらに拡大している。司法業界を例に挙げると、事件の事実関係や判決理由を資料に基づき要約するといった専門的なニーズに対して、アップグレードされた「星火X1」はユーザーの指示を正確に把握し、争点を詳細に分析、重要な情報を素早く見つけ出し、正確なコンテンツを出力することができ、業界ユーザーに専門的で信頼性の高いインテリジェントサポートを提供する。

新たにアップグレードされた「星火X1」は、業界の実用化において重要な利点を持っていることを言及する価値がある。
技術革新とモデル展開の面では、モデル展開は「速い思考、遅い思考の統一モデル」をデビューさせ、同時にモデルによって2つの思考モードをサポートし、モデルの能力を向上させ、異なる複雑さのタスクに対処するために、「星火X1」の全血バージョンは、わずか4枚のカード(Huawei 910B)で展開することができ、民営化された展開プロセスを簡素化する。
同時に、「星火X1」はモデルのカスタマイズと最適化ツールチェーンも新たにアップグレードし、SFT(Supervised Fine-Tuning)と強化学習の2つのモデルのカスタマイズと最適化ソリューションをサポートし、16枚のカード(Huawei 910B)だけで業界のカスタマイズと最適化を完了することができ、企業AIのカスタマイズの敷居を効果的に下げ、各業界がAIアプリケーションの価値をより便利に着地させることができる。
3つの核心技術のブレークスルー、国産AIは独立制御の新段階へ
「星火X1」のバージョンアップの背景には、一連のユニークな技術革新と概念のブレークスルーがある。
まず、問題の難易度に基づく大規模な多段階強化学習方式を提案し、複雑な推論、数学、コード、言語理解などのシナリオにおけるモデル効果と汎化を全面的に向上させる。同時に、強化学習の動的更新アルゴリズムを提案し、サンプルの長さに基づいて強化学習の更新速度を動的に調整し、深層思考の強化学習の効率と効果をさらに向上させる。
第二に、統一モデルの下で、高速思考と低速思考のハイブリッド訓練法は、高速思考データと低速思考データの相互促進を十分に発揮し、システム命令に基づいてモデルが深い思考であるかどうかを実現し、川下がより効率的かつ便利に展開し、使用することをサポートする。
第三に、複数のエンジニアリング革新を実現し、ビデオメモリの動的オフロード技術により、長文推論の同時性を大幅に向上させ、訓練とプッシュカードの協力により、効率的な訓練とプッシュリソースの変換を実現し、推論エンジンのハイバネーション機構により、高速な引き上げと回復を実現するなど、多くの技術革新を実現し、中国国産演算プラットフォームで高効率で安定した強化学習と訓練の全過程を実現した。
科学技術における中米間の競争がますます激しくなっていることを背景に、「星火X1」が選択した全ての中国国産化技術の道は、より遠大な意義を持っている。 最近、科大訊飛(iFLYTEK)と華為昇騰(HUAWEI Ascend)の共同チームは、前作を基礎として、MoEモデルのPD分離+大規模専門家並列システム方式をアップグレードし、クラスタ推論の性能を倍増させるという画期的な成果を上げた。PD分離の展開により性能を20%以上向上させ、MTPマルチトークン予測技術により全体性能を30%以上向上させ、専門家負荷分散アルゴリズムの最適化によりクラスタスループットを30%以上向上させ、非同期デュアル起動技術によりサービス要求のスケジューリング時間消費を削減し、システム性能を10%向上させた。また、非同期デュアル起動技術により、サービス要求スケジューリングの時間消費を削減し、システム性能を10%向上させた。独立した制御可能なアルゴリズムの技術革新とシステムエンジニアリングの技術革新により、中国国内計算力の星火モデルが継続的かつ急速に進歩した。また実際のアプリケーションのシナリオでも重要な性能上の利点を達成でき、現在の国際的な状況でも競争性が強い。
「星火X1」の全面的なアップグレードは、中国国内の演算プラットフォーム上の中国のAI技術の革新的なブレークスルーを示すだけでなく、様々な産業のデジタル変革のための新たな可能性を示した。中国国産計算力訓練に基づいた大型モデルの傑作として、「星火X1」の性能は技術的に自律性と制御性において、中国AIが国際トップモデルに対抗できる力を持っていることを証明している。

