内閣府が運営する NPO 法人ポータルサイトで、本来「黒塗り処理」されているはずの事業報告書から、役員や社員の住所が「一定の電磁的操作」で読み取れる状態になっていたことが明らかになった。対象は 974 法人中 866 法人分の文書で、役員 6,480 人および社員 9,815 人分の住所情報が漏えいした可能性がある。内閣府は 5 月 7 日に公表、対象法人へは 5 月 20 日に通知し、当面は該当書類をポータルから削除して紙媒体での閲覧に切り替える方針だ。
「電磁的操作」とは要するにコピペである #
公式発表は「電磁的操作」とぼかして書いているが、PDF 業界の人間にはこの種の事故は完全に既知のパターンだ。黒塗りに見えるが中身が抜けてしまう失敗の典型は次のいずれかである。
| 失敗パターン | 見た目 | 復元方法 | 頻度 |
|---|---|---|---|
| テキストの上に黒い矩形を重ねただけ | 黒塗り | 選択してコピペ / テキスト抽出 | 非常に多い |
| 文字色を黒背景上で黒に変更 | 真っ黒 | 全選択→別アプリへ貼り付け | 中 |
| 注釈ハイライト (黄→黒) で塗りつぶし | 黒塗り | 注釈を削除 / 別ビューワで開く | 中 |
| レイヤー化された PDF で黒レイヤー非表示 | 黒塗り | レイヤーパネルで OFF | 低 |
いずれも テキストレイヤー自体は無傷で残っている。PDF は描画命令の列であって画像ではないため、上に何を被せても下のテキストは生き続ける。Acrobat の検索やコピペ、pdftotext のような CLI ツール、果ては OS のアクセシビリティ機能で読み上げを掛けても、住所はそのまま出てくる。
真のレダクションは「消す」しかない #
正しい黒塗り (redaction) は、見た目を黒くするのではなく、該当領域のテキストオブジェクトとフォント参照ごと PDF から削除する処理である。Acrobat Pro の「墨消し」ツール、mutool clean -d、各種行政向けのレダクションツールはこのために存在する。手早く済ませるなら一度ラスタライズ (画像化) して該当箇所を塗り直す方法もあるが、検索性は失われる。
今回のように「ポータルから削除して紙で閲覧」とする対応は、被害拡大を止める意味はあるが本質的な解決ではない。電子公開の利便性を捨てれば公開法人の透明性も落ちる。正しいレダクションフロー (テンプレート + 検査スクリプト + 公開前のテキスト抽出チェック) を整備し、`pdftotext` で全件機械チェックする運用に戻すのが筋だろう。
PDF レダクションの事故は米司法省、米軍、欧州各国の政府機関でも繰り返されている。「黒塗りに見えるかどうか」を目視で確認している限り、同じ事故は必ずまた起きる。
COMMENTS 0
No comments yet — be the first to leave one.