オープンソースAIがビッグテックのコード支配にどう挑んでいるか

Nous Researchの「NousCoder-14B」が、AI開発の覇権を巡る戦いで「Claude Code」に挑む

世界中の開発者が、Anthropic社の「Claude Code」と、単純な説明文からアプリケーション全体を構築するという魔法のような能力について話題にしているまさにその時、オープンソースAIスタートアップのNous Research社が、独自の「コーディング界の衝撃」を放った。同社の新しいモデル「NousCoder-14B」は、はるかに大規模な独自システムに匹敵、あるいはそれを上回る性能を約束しており、しかも最先端のハードウェアを用いてわずか4日間で構築されたものだ。AI開発ソリューションを検討している企業にとって、これはオープンソースの代替手段が、AIを活用したコーディングツール分野におけるビッグテックの支配に本格的に挑戦し始めている、非常に興味深い局面と言える。

これ以上の劇的なタイミングはないだろう。ソーシャルメディア上では、開発者たちがClaude Codeの性能について息をのむような体験談を次々と投稿しており、GoogleのJaana Dogan氏は、このAIが自身のチームが1年かけて取り組んだ分散システムプロジェクトをわずか1時間で再現したと述べ、話題を呼んでいる。今、Nous Researchは、透明性とオープンソース開発こそが、こうしたクローズドなシステムと真っ向から対抗できると確信している。

オープンソースAIコーディングモデルの新たな基準

NousCoder-14Bは、競技プログラミングの問題を用いてAIモデルを評価する厳格なベンチマーク「LiveCodeBench v6」において、67.87%の精度を達成しました。これは、そのベースモデルであるアリババのQwen3-14Bと比較して、7.08ポイントという大幅な向上を示しています。しかし、真に注目すべきはパフォーマンスそのものではなく、この成果をどのようにして達成したかという、その過程における徹底的な透明性なのです。

企業が最終結果のみを公開する一般的なAIモデルの公開とは異なり、Nous Researchは、強化学習環境の全容、ベンチマークスイート、トレーニングハネス、さらには同社のAtroposフレームワーク上に構築されたインフラストラクチャのコードに至るまで、すべてを公開しました。これにより、十分な計算能力を持つ研究者であれば、誰でもこの研究を再現、修正、あるいは拡張することが可能になりました。

このプロジェクトを率いた研究者ジョー・リーは、開発に独自の個人的な視点を持ち込んだ。自身もかつて競技プログラマーだった彼は、モデルの成長曲線を、プログラマーがコンテストの成績に基づいてレーティングを獲得するプラットフォーム「Codeforces」での自身の歩みと比較した。モデルのレーティングが約1600～1750から2100～2200へと飛躍したことは、リー氏自身の2年間にわたる成長曲線と重なるものであった――ただし、AIがそれを達成したのはわずか96時間だった。

人間と機械学習の効率性の格差

ビジネスや日常生活におけるAIの役割について考えている人にとって、ここからが興味深い点だ。このモデルは学習にかかる時間は短縮されたものの、必要な学習データの量は劇的に増加した。Li氏は2年間の学習期間中に約1,000の問題を解いたのに対し、NousCoder-14Bが同程度の進歩を遂げるには24,000の問題が必要だった。少なくとも現時点では、人間の方がはるかに少ないデータで学習できることが明らかになった。

AIによるプロセス自動化を支えるトレーニングプロセスの内幕

NousCoder-14Bの技術的アプローチは、現代のAIシステムが複雑な問題について推論する方法をどのように学習しているかについて、新たな知見を提供しています。このトレーニングは「検証可能な報酬」に依存しています。つまり、モデルがコードによる解決策を生成し、その解決策がテストケースに対して実行され、システムは単純な「合格／不合格」というフィードバックを受け取ります。この二値的なシグナルは、概念的には単純ですが、大規模に実行するには高度なインフラストラクチャが必要となります。

Nous Researchは、Modalのクラウドコンピューティングプラットフォームを活用し、平均して数百のテストケースを含む24,000件のトレーニング問題に対して、サンドボックス環境下でのコード実行を並行して実行しました。このシステムは、生成されたコードが、15秒以内かつ4ギガバイトのメモリという厳しい制約条件下で正しい出力を生成することを検証する必要がありました。

このトレーニングでは、ダイナミック・サンプリング・ポリシー・オプティマイゼーション（DAPO）が採用された。その主な革新点は「ダイナミック・サンプリング」と呼ばれる手法であり、モデルがすべての試行で正解したか、あるいは完全に失敗したトレーニング例は、有用な学習シグナルを提供しないため除外される。また、研究者らは「反復的コンテキスト拡張」も採用した。これは、32,000トークンのコンテキストウィンドウから開始し、トレーニング中に40,000トークンへと拡張し、評価時には最適な結果を得るために80,000トークンまで拡大するという手法である。

AIの進展を遅らせる恐れのあるデータ不足の問題

Li氏の技術報告書には、AI開発の将来に重大な影響を及ぼす発見が記されている。すなわち、彼らは実質的に、世界にある高品質な競技プログラミング問題の大部分を使い果たしてしまったのだ。彼らのトレーニングデータセットに含まれる24,000問の問題は、「標準化されたデータセット形式で入手可能かつ検証可能な、すべての競技プログラミング問題の相当な割合」を占めている。

このデータに関する制約は、AI業界全体で高まる懸念を反映している。計算能力は予測通りに拡大し続けている一方で、高品質なトレーニングデータはますます限られたものになりつつある。特に競技プログラミングにおいては、この課題が深刻である。なぜなら、この分野では、自動的に検証可能な正解が既知の問題が必要とされるため、他のAIアプリケーションに比べて合成データの生成が格段に困難になるからだ。

李氏は、一つの解決策として、単に問題を解くだけでなく、解ける問題を生成するようにモデルを訓練し、ゲームプレイAIシステムで成功を収めた手法と同様の「自己対戦」を可能にすることを挙げた。「合成問題生成の課題が解決されれば、自己対戦は非常に興味深い方向性となる」と彼は指摘した。

オープンソースAIの未来への6500万ドルの賭け

Nous Researchは、プロプライエタリな代替製品と競合するオープンソース製品の提供に注力する企業として、AI業界において独自の地位を確立している。同社は、暗号資産に特化したベンチャーキャピタルであるParadigmが主導する6,500万ドルの資金調達に成功し、AI開発における分散型アプローチへの関心の高まりを反映している。

これまでにリリースされたものには、コンテンツの制限がない状態でChatGPTを上回る性能を発揮したと報じられている「Hermes 4」や、ユーザーがオンデマンドで拡張された推論機能を有効にできる初の「トグル式推論モデル」とされる「DeepHermes-3」などがある。

同社のアニメ調のブランディングとコミュニティ重視のアプローチは、熱狂的な支持と懐疑的な見方の両方を招いており、スタイルが実質を覆い隠してしまうのではないかという指摘も一部から出ている。NousCoder-14Bが「エージェント型」のコーディングワークフロー向けに最適化されているのか、それとも単発の問題解決向けに最適化されているのかという技術的な議論が続いているが、この区別は実用的なソフトウェア開発において極めて重要な意味を持つ。この動きは、AIがこれまで解決不可能とされていたビジネス上の課題への取り組み方をいかに変革しているかという、より広範なトレンドを象徴している。

AI開発ツールの今後の展望

この研究は、AIコーディングツールがさらなる進化を遂げるために必要ないくつかの重要な進展を示唆している。その中でも特に重要なのが、マルチターン強化学習である。現在、モデルには最終的な「合格／不合格」というフィードバックしか与えられていないが、競技プログラミングの問題には通常、コンパイルエラーや部分的なテスト結果といった中間的なシグナルが含まれており、これらは反復的な改善の指針となり得る。

おそらく最も野心的なのは、プログラミング問題を生成する能力が、データの不足という課題を解決しつつ、真の自己学習型システムを実現できるという点だろう。Liが指摘したように、「人間は他の競技プログラマーのために興味深く有用な問題を生成するのが得意だが、創造的な問題生成という点では、LLMの能力には依然として大きな隔たりがある」。

NousCoder-14Bは現在、Apache 2.0ライセンスの下でHugging Faceにて公開されており、Atroposのトレーニングスタック一式も併せて公開されています。AIを活用した開発ツールを模索している企業や開発者にとって、これは強力な新たな選択肢であると同時に、人間と機械のプログラミング能力の境界線がますます曖昧になり、AIが単にコードを書くだけでなく、自ら学習して私たちが想像もしなかったほど優れたプログラマーへと成長していく未来を垣間見せるものです。

執筆：

オリバー・K・G

オリバー・K・Gは、米国のビジネスプロフェッショナルが不要な情報を排除し、チーム、ワークフロー、そして最終的な業績という、真に重要な分野でAIを活用できるよう支援するメディア「AI Meets Life」の創設者です。仕事の未来を形作るツール、トレンド、そして意思決定を追跡しています。

オープンソースAIが、ビッグテックのコード支配にどう挑んでいるか

Nous Researchの「NousCoder-14B」が、AI開発の覇権を巡る戦いで「Claude Code」に挑む

オープンソースAIコーディングモデルの新たな基準

人間と機械学習の効率性の格差

AIによるプロセス自動化を支えるトレーニングプロセスの内幕

AIの進展を遅らせる恐れのあるデータ不足の問題

オープンソースAIの未来への6500万ドルの賭け

AI開発ツールの今後の展望

オリバー・K・G

「オープンソースAIがビッグテックのコード支配にどう挑んでいるか」へのコメント1件

「AI Meets Life」について

クイックリンク

つながりを保ちましょう