たった4ステップで画像編集
Boogu-Image-0.1 徹底解説

Apache 2.0で公開された10B統一画像生成・編集モデルファミリーの全貌

2026年7月4日

1. はじめに:2026年夏、またしてもオープンソースに衝撃

2026年6月、AI画像生成のオープンソース界にまた1つ、注目すべきモデルファミリーが登場した。Boogu-Image-0.1 だ。

何が「衝撃」か。このモデルはたった10Bパラメータでありながら、GPT-Image-2Nano Banana Proといったクローズドな最先端モデルに匹敵するパフォーマンスを、1桁少ないデータ量で達成したと主張している。そしてライセンスはApache 2.0。商用利用も再配布も完全に自由だ。

「どうせまた誇大広告でしょ?」——そう思うなら、この記事を読んでほしい。10以上のソースから集めたコミュニティの評価、実測データ、そして開発チームが自ら認める限界までを包み隠さず伝える。

「Booguってどの会社?」という素朴な疑問

コミュニティで最も多い質問の1つだ。現時点でBoogu Teamがどこの組織に所属するのか、公式には一切明らかにされていない。中国のブログでも「モデルの出自が不明」「どの会社の製品か分からない」と困惑の声が上がっている。

開発元が不明という点は確かに引っかかるが、コードはGitHubで公開され、重みはHuggingFaceで配布され、ライセンスはApache 2.0と明確だ。つまりモデルの信頼性はコードとデータで判断できる——少なくとも技術的には、出自の曖昧さは実用上の障壁にはならない。


2. モデルファミリー——4つのバリエーションと使い分け

Boogu-Image-0.1は単一モデルではなく、用途に応じた4つのバリエーションを持つ。

モデルタスク推論ステップ推奨CFG解像度
Base文書生成(高品質テキスト)25-502.0-5.01K〜2K
Turbo高速フォトリアル生成3-41.01K
Edit画像編集(高品質)25-502.0-5.01K〜2K
Edit-Turbo高速画像編集41.01K〜1.5K

すべて100億パラメータで統一されており、FP8量子化版も提供されている。注目すべきはTurbo系がわずか3〜4ステップで推論を完了する点だ。ベンチ上では1秒未満での生成も可能。これはDMD(Distribution Matching Distillation)という蒸留技術によるもので、画質を保ったまま桁違いの速度を実現している。


3. ベンチマーク——オープンソース最速・最高は本当か

Qwen-Image-Bench 総合スコア

モデルパラメータ数総合スコアライセンス
Boogu-Image-0.110B53.58Apache 2.0
Qwen-Image-251220B52.06Apache 2.0
HunyuanImage-3.080B50.81Apache 2.0
GPT-Image-2非公開62.31クローズド
Nano Banana 2.0非公開60.15クローズド

オープンソースモデルとして総合1位。パラメータ数はQwen-Imageの半分、Hunyuanの8分の1だ。

ImgEdit_O(画像編集ベンチマーク)

モデルスコア
Boogu-Image-0.1-Edit4.64
Nano Banana Pro4.37
Seedream 4.54.32

ここではクローズドモデルを含めて全モデル中トップ。ただしBooguチーム自身が「ImgEditの評価は人間の視覚判断と必ずしも一致しない」と注釈をつけており、割り引いて見る必要がある。


4. コミュニティの声——実際に使った人の本音

「Boogu is fun!」——Redditコミュニティの反応

好意的な声:

厳しい声:

中国コミュニティからの詳細な実測レビュー

博客園(cnblogs)のユーザーによる10組のプロンプトでの徹底比較が非常に貴重だ:


5. 技術の核心——「データ効率」の謎を解く

Booguチームの最大の主張:「我々のトレーニングデータ規模は、既存のオープンソースモデルより約1桁少ない」。これがなぜ可能なのか。

  1. 統合理解&生成アーキテクチャ:別々の視覚エンコーダと拡散バックボーンをペアにするのではなく、同じモデル内で理解と生成を同時に扱う。これにより「何を生成すべきか」の理解精度が向上し、無駄な試行が減る
  2. データ品質への集中:「データ量」ではなく「データの質」と「トレーニングパイプライン」の体系的な改善が、閉域モデルとのギャップを埋める鍵
  3. 蒸留(Decoupled DMD):Turbo系はBaseからの蒸留により3-4ステップで同等品質を達成。10Bスケールでの実装は注目に値する

Booguは「より多くのデータでより大きなモデルを」というスケーリング則とは別のベクトルで最適化を進めている。


6. 強みと弱み

強み

弱み(Booguチーム公認)


7. ライバル比較——2026年夏のオープンソース画像生成マップ

モデルパラメータ速度編集テキスト品質ライセンス
Boogu-0.1 Turbo10B⚡超高速⭕中英文良好Apache 2.0
Qwen-Image-251220B普通⭐英文最強Apache 2.0
Z-Image-Turbo非公開⚡高速独自
Flux12Bやや遅いApache 2.0

Booguの最大の差別化ポイントは「編集+高速+テキスト+オープンライセンス」の4つを同時に満たしていること。オープンソースのニュースタンダード候補として最右翼と言える。


8. まとめ

Boogu-Image-0.1が示した最も重要なメッセージは、「データの量より質」がオープンソース画像生成の次のフロンティアだということ。10Bパラメータ、約1桁少ないデータ、Apache 2.0——これらの制約の中で、彼らはQwen-Image-Benchでオープンソース1位を獲得し、ImgEdit_Oではクローズドモデルすら上回った。

「0.1」というバージョン番号を考えれば、ファーストリリースとしては驚異的な完成度だ。

「遊んでるだけだけど楽しい」(Redditより)。その「楽しさ」が、次のイノベーションを生む土壌になるのかもしれない。


本記事は2026年7月時点の公開情報に基づきます。ソース:GitHub (boogu-project/Boogu-Image, 666 stars), HuggingFace (Boogu), Reddit r/StableDiffusion・r/LocalLLaMA, 博客園, AI FILMS Studio Blog, YouTube, Trendshift, boogu.org