Apple は機械学習研究グループの公式サイトで、AI ベースの画像圧縮コーデック「PICO (Perceptual Image Codec)」を公開した。AV1 と比べて最大 3 分の 1、JPEG-AI など既存の学習型コーデックと比べても 20〜40% のビットレート削減を、ほぼ同等の主観品質で達成したという。iPhone 17 Pro Max 上で 12MP 画像のエンコードが約 230ms、デコードが約 150ms と、サーバ送信前提でないデバイス内処理として十分実用域に入った。
既存コーデックを置き換えうる「主観品質ベース」の最適化 #
PICO の特徴は、PSNR や MS-SSIM のような数値指標ではなく、人間の主観評価をターゲットに学習している点にある。Apple は CLIC 2020・Kodak・DIV2K を素材に、610 名の評価者から 74,925 ペアの比較を集めて学習・検証した。さらに、文字や境界線などニューラル圧縮が苦手な領域を抑制するための独自損失と、GAN 系の知覚損失を組み合わせている。デバイス上で動かす制約から「数百万のモデル構成」を探索したとも明かしており、研究プロトタイプというより iOS への組み込みを射程に入れた最適化に見える。
ハッカー視点で気になる 2 つの宿題 #
ただしセキュリティ屋として見ると、学習ベースコーデックには固有の課題が二つ残る。
ひとつは 敵対的入力。NN ベースの decoder は、悪意ある bit ストリームに対して攻撃者が意図したアーティファクト (人物の顔の置換、文字の差し替えなど) を再現させ得るという研究が以前から指摘されている。決定論的でクロスデバイス互換とはいえ、reference 実装に脆弱性が出ればパッチ伝搬は標準コーデックより難航しやすい。
もうひとつは 隠しチャネル。学習圧縮はビット配分が image-content-aware なので、ステガノグラフィや電子透かしが従来コーデックより検出しづらくなる。プラットフォーム横断の検証ツールが未整備なまま実装が広がると、SNS 経由のフィッシング素材や AI 生成画像の出所追跡で死角になりかねない。
PICO 自体はモバイル写真の容量・帯域問題への筋の良い解だが、画像が「重み入りの decoder を介してしか開けない」時代に入るなら、検証性とサプライチェーンの透明性も同じだけの議論が必要になる。
COMMENTS 0
No comments yet — be the first to leave one.