Yahoo!ニュース

戦争にも活用されるビッグデータ

木村正人在英国際ジャーナリスト

フェイスブックが提供認める

米国家安全保障局(NSA)が米通信大手ベライゾンのほかインターネット大手など9社から個人情報を収集していた問題がさらに波紋を広げている。

交流サイトのフェイスブックは14日、昨年後半にNSAなどから1万8千~1万9千のアカウントに関して情報提供を要請されていたことを明らかにした。いずれも犯罪捜査や安全保障に関するもので、情報提供を求める令状は9千~1万件にのぼっていた。

世界最大のコンピューター・ソフトウェア会社マイクロソフトも同日、昨年後半に3万1千~3万2千のアカウントに関して情報提供を要請されていたことを公表した。令状は6千~7千件だった。

フェイスブックの最高顧問弁護士テッド・ウリョット(Ted Ullyot)氏は「フェイスブックの活発なマンスリーユーザーは世界で11億人にのぼっており、情報提供の対象はごく一部にすぎない」と強調した。

単純に比較するわけにはいかないが、フェイスブック人口は中国の13.5億人、インドの12.2億人に次ぐ規模に膨らんでいる。フェイスブックに蓄積される個人情報がどのように活用されているのか、私たちにはまったくわからない。

国家のテロ対策や犯罪捜査のため、プライバシーが一定の範囲内で制限されるのは仕方がないとしても、データとして蓄積される膨大な個人情報に関して私たちがあまりに無関心すぎたことを今回の問題は浮き彫りにしている。

中国でも読まれる『1984年』

香港で問題を告発した米中央情報局(CIA)元職員でコンピューター技術者エドワード・スノーデン氏(29)は「米政府が世界中の人々のプライバシーやインターネットの自由、基本的な自由権を侵害しているのを許せなかった。そのため、自分の人生を犠牲にした」と英紙ガーディアンなどに話した。

サイバースパイへの国家関与が疑われている中国が米国に対する意趣返しのため、スノーデン氏の告発を仕掛けたとの観測もある。しかし、中国では英作家ジョージ・オーウェル氏(1903~50年)が49年に全体主義のディストピアを批判的に描いた『1984年』の中国語版が売れているという。

英紙フィナンシャル・タイムズによると、中国のオンライン通販アマゾンでは『1984年』の売れ行きは1日で61%も増え、36位にランクイン。他のオンライン書店では『1984年』は売り切れとなり、6月末に再版されることになった。

ちなみに米国では『1984年』の売れ行きは60倍に膨れ上がっている。中国の読者は毛沢東の文化大革命で苛烈な思想統制が行われ、今も公安当局による監視が続いていることを自覚している。

ソーシャルメディア、電子メール、動画投稿サイト、インターネット電話サービスの普及でデータ量が爆発的に増えた。今や、フェイスブックだけで国家を上回る情報を蓄積してしまったのだ。

米ハーバード大学のラタンヤ・スウィーニー(Latanya Sweeney)教授は「年齢、性別、ポストコード(日本の郵便番号)さえわかれば87%の個人は特定できる」と指摘している。

シリア内戦をビッグデータで解析

毎年2倍の急ピッチで増殖を続ける膨大なデータ(ビッグデータ)に注目が集まる中、ロンドンのシンクタンク、国際戦略研究所(IISS)で14日、「戦争とビッグデータ」と題した勉強会が開かれた。

講師はカナダで「セクデヴ・グループ(SecDev Group)」を主宰するラファル・ロホジンスキ(Rafal Rohozinski)氏。データ解析に詳しいロホジンスキ氏は自分の研究室でコンピューターに詳しい若者を使ってシリア内戦を分析した。

「オープンソースを使ってNSAがしていたことと同じようなことができるのです」と切り出したロホジンスキ氏の発表に、英国の現役外交官、英BBC放送のジャーナリスト、元英陸軍のアナリストも真剣な表情で聞き入った。

まず、地域と時間を特定して、ツイッターなどソーシャルメディアから発信される情報をフォローする。いろいろな情報をクロスオーバーさせると、匿名や仮名であっても個人を特定できる。

ソーシャルメディアやユーチューブで公開された映像を分析する。映像から使っている武器を分析すると、中国製なのか旧ソ連製なのか、どの地域から武器が流入しているのか突き止めることができる。

シリア政府がコントロールするサーバーを使っているのか、それとも、それ以外のサーバーを使っているのかを分析すれば、シリア国内での政府軍と反政府軍の勢力図が正確に把握できる。

通信頻度と戦闘の発生を調べて、通信頻度のパターンを分析すれば、どの地域で戦闘が始まり、いつごろ終わるのかを予測できるようになるという。

ロホジンスキ氏は「オープンになっているビッグデータを分析することで、巨額な無人航空機を飛ばして偵察するのと同じレベルの情報を収集できます」と胸を張った。

僕が「いったい、いくらぐらいの予算でできるのか」と質問したところ、氏は「20代の若者を集めてデータ収集ツールを開発、分析力のあるアナリストと協力すれば、数人のグループでできるのです」と説明した。

現場百回はもう古い?

「新聞記者は現場百回」と言われて、事件記者が長かった僕はとにかく現場を踏むことと当事者からの取材にこだわった。

事件記者と言えば、警察の御用聞きのように思われる方が多いかもしれないが、昔は現場での聞き込みに始まって、資料分析、警察と弁護士からの取材、逮捕前の容疑者本人からのインタビューもしてから報道するよう心がけた。

1カ月に1本の特ダネを目標にしていたが、「事件の神様」と言われた先輩の事件記者からは逆に「半年で1本でいい。各社が1面トップで追いかけてくるような記事を書け」と励まされた。

22歳から38歳まで事件一筋で過ごした結果、悟ったのは「ベタ(1段の見出ししかつかない小さな)記事の殺し(殺人事件)でも正確に書くのは難しい」ということだった。

しかし、24時間ニュース、インターネット時代が到来して、状況は一変した。

事件は世界中で起きる。ソーシャルメディアで発信場所を特定して検索をかければ、現場に居合わせた目撃者を瞬時に探し出せる可能性がある。スマートホンで撮影した写真や動画を電子メールで提供してもらうことができれば大きなスクープになる。

日々、公開される膨大なデータをコンピューターで解析、グラフィックにして読者に視覚的に訴えることも効果的だ。英国では戦地のデータ解析で「大本営発表」のウソを見抜いたスクープもある。データ・ジャーナリズムの重要性はますます増している。

「なぜ?」にこだわらないリスク

日経平均株価が前日比1千円以上急落した5月23日、「高速・高頻度取引(HFT)」が話題になった。HFTとはコンピューターが1秒間に何百回も自動売買を繰り返す手法のことだ。

今年1月の日銀レビューは「わが国の HFT 比率は昨年9 月下旬から10 月にかけて5 割を超える日もみられるなど、HFT で先行していた米国(60~70%)や欧州(40~50%)と肩を並べる水準にまで拡大している」と指摘している。

その上で、「HFT は市場流動性の向上とボラティリティ(予想変動率)の低下に寄与していることが示唆された。ただし、HFT 拡大に伴うプログラムの暴走リスクや人的ミス発生を狙うプログラムの存在などへの対応が課題として残されている」と注意を喚起している。

バーナンキ米連邦準備理事会(FRB)議長の片言隻句、米雇用統計の発表などを受けて、コンピューターが瞬時に売りか買いかを判断するため、売買が殺到して相場が暴走するリスクに備えておく必要がある。あるキーワードに反応して、相場が過剰に動くリスクがHFTには潜んでいる。

ビッグデータの時代、私たちは相関関係と因果関係の違いにもう一度、こだわってみる必要がある。

アイスクリームの売り上げが伸びると、水死者数も確実に増えるという相関関係を見てみよう。ビッグデータを元にしたアルゴリズム取引では「アイスクリームが水死の原因」と判断して大量の発注を行ってしまうリスクを否定し切れない。

暑い夏だからアイスクリームがよく売れ、水死が増えるのであって、アイスクリームの販売が増えることと、水死者の増加の間には何の因果関係もない。ところが、ビッグデータは「なぜ?」にはまったくこだわらない。

米大手世論調査会社ピュー・リサーチセンターの調査では、56%のアメリカ人がNSAの監視は「許容できる」と答えた。「許しがたい」と回答したのは41%にとどまった。

まだ、私たちはビッグデータ時代の夜明けを迎えたばかりだ。『1984年』には有名なフレーズがある。「ビッグブラザー(市民の前には姿を見せない独裁者)があなたを監視しています」。

ビッグデータが制御不能なまでに巨大化する前に、私たちはビッグデータの功罪について真剣に、そして徹底的に議論した方がいい。

関連記事:忍び寄るビッグデータの影

(おわり)

在英国際ジャーナリスト

在ロンドン国際ジャーナリスト(元産経新聞ロンドン支局長)。憲法改正(元慶応大学法科大学院非常勤講師)や国際政治、安全保障、欧州経済に詳しい。産経新聞大阪社会部・神戸支局で16年間、事件記者をした後、政治部・外信部のデスクも経験。2002~03年、米コロンビア大学東アジア研究所客員研究員。著書に『EU崩壊』『見えない世界戦争「サイバー戦」最新報告』(いずれも新潮新書)。masakimu50@gmail.com

木村正人の最近の記事