AILIBERALMEDIA
BASIS:バッチと系列次元から活性化メモリを完全に分離する新しい逆伝播アルゴリズム
← 一覧に戻る
LLM研究生成AI

BASIS:バッチと系列次元から活性化メモリを完全に分離する新しい逆伝播アルゴリズム

速 報2026.04.21 09:30

正確な逆伝播に必要な活性化メモリがネットワーク深さ・文脈長・特徴次元に応じてO(L*BN)のスケールで増加する問題を解決するため、新しいアルゴリズムBASIS(Balanced Activation Sketching with Invariant Scalars)が提案された。このアルゴリズムは活性化メモリをバッチと系列次元から完全に分離し、誤差信号は正確に伝播させながら、重み更新は圧縮されたランク-Rテンソルを使用する。

正確な逆伝播(backpropagation)に必要な活性化メモリは、ネットワーク深さ、文脈長、特徴次元に応じて線形にスケールし、O(L*BN)の空間ボトルネック(Bは系列バッチ基数、Nは特徴次元)を形成している。この制約は歴史的に深いニューラルネットワークのスケーリングを阻害してきた。

ランダム化自動微分はこの問題を軽減する試みがなされてきたが、歴史的に壊滅的な分散問題に悩まされている。

PR / 広告

すべてのWebサイトに AIアシスタントをつけよう。

  • YouTubeの要約やウェブサイトの分析など、使い方は無限大
  • 最新AIモデルを1つに統合しコストを削減
  • 500万人以上が利用する信頼のブランド
無料で始める
クーポンコードMERLIN20で20%オフ

本論文では、効率的な逆伝播アルゴリズムであるBASIS(Balanced Activation Sketching with Invariant Scalars)を導入する。BASISは活性化メモリをバッチと系列次元から完全に分離する。BASISは正確な誤差信号(dX)を伝播させ、完璧な勾配流を保証する一方で、重み更新(dW)は大規模に圧縮されたランク-Rテンソルを使用して計算される。

スケッチされた勾配の根本的な不安定性を解決するため、バランスハッシング(Balanced Hashing)という2つの新しいメカニズムが提案されている。これは厳密に不安定性を排除する。

関連記事

膝関節症の構造的損傷と症状の不一致に対応するマルチモーダルAIフレームワーク
研究LLMビジネス

膝関節症の構造的損傷と症状の不一致に対応するマルチモーダルAIフレームワーク

2026.04.21 09:31
UniMamba:状態空間モデルと注意機構を統合した時系列予測フレームワーク
研究LLM

UniMamba:状態空間モデルと注意機構を統合した時系列予測フレームワーク

2026.04.21 09:30
GitHub Copilot個人向けプラン、新規登録一時停止と使用量制限強化を発表
Microsoft生成AIビジネス

GitHub Copilot個人向けプラン、新規登録一時停止と使用量制限強化を発表

2026.04.21 09:30