Apple が AI 画像コーデック「PICO」発表 — AV1 比 1/3 容量を iPhone 上で 230ms 処理、ハッカー視点で気になる宿題

Apple は機械学習研究グループの公式サイトで、AI ベースの画像圧縮コーデック「PICO (Perceptual Image Codec)」を公開した。AV1 と比べて最大 3 分の 1、JPEG-AI など既存の学習型コーデックと比べても 20〜40% のビットレート削減を、ほぼ同等の主観品質で達成したという。iPhone 17 Pro Max 上で 12MP 画像のエンコードが約 230ms、デコードが約 150ms と、サーバ送信前提でないデバイス内処理として十分実用域に入った。

既存コーデックを置き換えうる「主観品質ベース」の最適化 #

PICO の特徴は、PSNR や MS-SSIM のような数値指標ではなく、人間の主観評価をターゲットに学習している点にある。Apple は CLIC 2020・Kodak・DIV2K を素材に、610 名の評価者から 74,925 ペアの比較を集めて学習・検証した。さらに、文字や境界線などニューラル圧縮が苦手な領域を抑制するための独自損失と、GAN 系の知覚損失を組み合わせている。デバイス上で動かす制約から「数百万のモデル構成」を探索したとも明かしており、研究プロトタイプというより iOS への組み込みを射程に入れた最適化に見える。

ハッカー視点で気になる 2 つの宿題 #

ただしセキュリティ屋として見ると、学習ベースコーデックには固有の課題が二つ残る。

ひとつは 敵対的入力。NN ベースの decoder は、悪意ある bit ストリームに対して攻撃者が意図したアーティファクト (人物の顔の置換、文字の差し替えなど) を再現させ得るという研究が以前から指摘されている。決定論的でクロスデバイス互換とはいえ、reference 実装に脆弱性が出ればパッチ伝搬は標準コーデックより難航しやすい。

もうひとつは 隠しチャネル。学習圧縮はビット配分が image-content-aware なので、ステガノグラフィや電子透かしが従来コーデックより検出しづらくなる。プラットフォーム横断の検証ツールが未整備なまま実装が広がると、SNS 経由のフィッシング素材や AI 生成画像の出所追跡で死角になりかねない。

PICO 自体はモバイル写真の容量・帯域問題への筋の良い解だが、画像が「重み入りの decoder を介してしか開けない」時代に入るなら、検証性とサプライチェーンの透明性も同じだけの議論が必要になる。

COMMENTS 0

No comments yet — be the first to leave one.

既存コーデックを置き換えうる「主観品質ベース」の最適化 #

ハッカー視点で気になる 2 つの宿題 #

COMMENTS 0

Post a comment

RELATED

AppleがOpenAIを提訴 元社員2人が機密ハード情報を持ち出したと主張

Apple、OpenAIを提訴――元従業員が24年分の設計機密を持ち出した「採用スパイ」の実態

iPhone 17 ProでQwen3.6-27Bが動作：端末LLMが「クラウドゼロ」時代を拓く

checkm8 の再来か、A12/A13 にパッチ不可能脆弱性「usbliter8」— iPhone XS〜11 が壁の薄い端末に

AppleがOpenAIを提訴元社員2人が機密ハード情報を持ち出したと主張