Alibaba Qwen 3.5リリース──スマホで動く0.8B〜9Bのスモールモデル群がGPQA 81.7点
小さくても強い。エッジAIの本命がオープンソースで登場

Alibabaのクラウド部門は、オープンソースLLMシリーズの最新版「Qwen 3.5」をリリースした。0.8B、1.8B、4B、9Bの4つのサイズで提供され、いずれもスマートフォンやエッジデバイス上でローカル実行が可能だ。特に9Bモデルは、大学院レベルの知識を問うGPQAベンチマークで81.7点を記録し、はるかに大きなモデルに匹敵するスコアを叩き出した。
小型モデルの技術的革新
Qwen 3.5が高いスコアを実現できた背景には、いくつかの技術的革新がある。まず、知識蒸留の手法が大幅に改善され、大型モデルの知識をより効率的に小型モデルに転移できるようになった。また、量子化技術の進歩により、4ビット精度でもほとんど性能劣化なく推論が可能だ。0.8Bモデルは最新のiPhoneやAndroid端末で秒間30トークン以上の速度で動作し、4Bモデルでも実用的な速度が確保されている。
POINT
Qwen 3.5はApache 2.0ライセンスで公開。HuggingFace、ModelScope、Ollamaで即座に利用可能。日本語対応も含む100以上の言語をサポート。
AITAKE編集部の見方
Qwen 3.5のリリースは、AIの「ダウンサイジング」トレンドを象徴する出来事だ。クラウドの大型モデルだけでなく、手元のデバイスで高性能なAIが動く時代が本格的に到来しつつある。プライバシーの観点からもエッジAIのニーズは高く、医療や金融など機密データを扱う領域での活用が期待される。Alibabaがオープンソースで公開したことで、日本の開発者やスタートアップもすぐに活用できる点も見逃せない。Googleのon-device Geminiとの競争も含め、スモールモデルの進化は今後のAI業界の重要なテーマとなるだろう。
Source: Alibaba Qwen