実験やめたった シマエナガ編

劇団「実験やめたった」の活動報告

2015年を振り返る:Deep Learning編

 2015年のキーワードといえばDeep Learningである(筆者しらべ)。この記事では筆者の一年をDeep Learningを軸に振り返る。またこの技術に関する筆者個人の所感を適当に述べる。

 

Deep Learning 2015

 筆者にとって2015年とはDeep Learningを追い続けた一年であったといえる。筆者は素粒子原子核宇宙物理のポスドク(3年目)であるが、今年の進捗は思ったほどのものでもなく、しかもプロジェクトは炎上しっぱなしで毎日が絶望の連続であった。最近感情の起伏も乏しくなって何かをやろうという気力もなくなってきた。そんな中、筆者がDeep Learningとは何かを追い求めていた今年の前半は、筆者はまだ希望があり具体的な目標に向かって生きていた。そしてDeep Learningが目の前のコンピュータ上で動き、その仕組みが理解できた瞬間というのは近年まれに見る感動であった。

 筆者はテンションが上がり「Deep Learningを普及させるためにこの経験をまとめよう」といって本ブログで記事を公開した。このブログは元々筆者の音楽活動を紹介するために開設したのだが、この記事によっていきなり人工知能に関する技術系のブログとなった。この記事はその後多くの方々に読んでいただいており、公開から半年経った今でも一日に平均30件ほどのアクセスがある。筆者はDeep Learning界の最先端に触れ、微力ながらも社会のみなさんに有益な情報を発信することができた。この事はDeep Learningが理解できたという体験とともに今年を代表する印象的な出来事である。

 

jikkenyametatta.hatenablog.com

Deep Learningへの道のり

 思えば筆者がDeep Learningなるものを始めて知ったのは2014年の1月であった。英国企業のDeepMind社が、Googleに5億ドルで買収されたと報じられた。そしてこの技術を扱える研究者は世界に数十人しかいなくて、大手IT企業がそういった人材をめぐって熾烈な争奪戦をしているというのであった。筆者は世界でも20人程度しかやらないようなマニアックな技術で実験をやっているのだが、何かの拍子にこの研究がカネに結びついついて富豪になれやしないかと常々願っているのである。だからDeep Learningの研究者はまさにそういう筆者の願いを具現化した人々:金の鉱脈を掘り当てた人々として、筆者の目には華々しく映ったのである。

 その後筆者はDeep Learningの基礎となる機械学習という分野があることを知り、後輩のよこやま君の勧めで広島大の玉木氏のオンライン講義を受けたのであった。この講義はSimon Prince氏の教科書、"Computer vision: models, learning and inference"を読み進めるものであった。筆者はもともと画像処理の経験があり、自分はすでに画像認識に関する知識をかなり持っているもんだとタカをくくっていた。ところが講義が始まって出てきたのは確率・統計に関するディープな話題で、自分の理解がコンピュータビジョンのごく表層のみで留まっていたことにショックを受けたのである。画像認識の目的とは画像を基に何かしらの判断を下すことである。それまで筆者がコンピュータビジョンライブラリ(OpenCV)のおまけだとばかり思っていた機械学習に関する機能こそが、実はコンピュータビジョンの主役だったのである。

 

www.udemy.com


人工知能の正体

 

 こうして今年の7月ごろにはDeep Learning、ひいては(現在の)人工知能とは何であるかが見えてきた。それと同時に分かってきたことは、Deep Learningの正体というべきものが、世間一般の持つイメージとかなりズレているということである。

 多くの人々は人工知能を黒魔術か何かだと思っている。人間の脳を模した「何か」を用意し、これに色々な刺激を与えてやると、その「何か」は勝手に世の中の仕組みを理解して、しまいには人知を超えた神託をアウトプットしはじめる。実際筆者もはじめは人工知能に対して、「よく分からないけど凄い力が問題を解決してくれる」と誤った認識を持っていた。もしかしたら今後コンピュータの発展によって人工知能が本当の黒魔術になる日が来るかもしれないが、現在我々が扱える人工知能技術は、なんというかもっと基本に忠実なモノである。

 だから筆者は人工知能に関して、実際の問題解決にどう生かすかという現実的な情報がもっと増えて欲しいと思う。筆者は人工知能とは「大量のデータから傾向をよく分析して、意思決定の材料に使いましょう」という一つのツールだと認識している。ネット上に溢れる人工知能の話題は、「人工知能がいかに凄いか」とか、はたまた「人類はどうなるのか」というSFチックな話が多いのだが、この技術を正しく普及させるにはもう少し現場に即した話:どんな問題に威力を発揮して、いっぽうどんな問題には不得手なのかという情報が必要である。

 

筆者が研究にDeep Learning導入した結果

 筆者がDeep Learningを本業に導入することでご利益があったのかなかったのか。その答えは「一部はご利益があったが、費用対効果で考えればまだペイしていない」である。

 筆者の研究では、大量に撮影した画像の中からレアな物理現象を探している。その物理現象はこれまで世界で10例程度しか発見されておらず、新しいものが1例出るだけでも(この業界で)大騒ぎするシロモノである。これを見つけるために直線検出とか形状認識を組み合わせて候補を抽出するのだが、もともと撮った写真には似て非なるものが大量に映っているのでゴミばかりが抽出される。これを目視で選別する作業が細大のボトルネックであった。筆者がDeep Learningに手を出した直接のモチベーションは、このレアイベント検出の高速化である。

 現在我々がやっているDeep Learningの使い道はこうである。まず抽出画像をDeep Learningでラフに分類する。こうして選ばれた画像を人間が見る。Deep Learningによっておおまかな分類が既に済んでいるので、多くの画像は「この形はAかBかCか」という多肢の分類から「この形はAかそうでないか」という二択に落とし込むことができる。この工夫によって人間の負担は以前よりも軽減された。

 ところがDeep Learningは、「レアなイベントを大量の画像の中から確実に抽出しろ」というタスクを直接的に実行できない。そういう画像を豊富に用意できない対象についてはDeep Learningはそのメリットを生かせないのである。Deep Learningは残念ながら、まだ筆者の研究のブレイクスルーをもたらすまでには至っておらず、本命のレアイベントも未検出のままである。 そしてさらに悲しいことに、本命のレアイベントが見つかっていない以上、Deep Learningの導入を大々的に自慢できないでいる。この手の話は実績がすべてで、「導入したんだけどまだ実績が出ていません」では学会等で発表する意味が無い。また物理の業界には人工知能の類を嫌う人々がいて、恐らくそういった人々は人工知能というオカルトじみた印象にアレルギーがあるのであろう。また多くの学生が今流行りの技術だといって手を出したものの、結局モノにならなかったというケースがゴマンとあるのではないかと思う 。

 とにかく、Deep Learningのご利益を最大限に生かしつつ、本来の目的であるレアイベントの検出を一刻も早く実現したい。

 

筆者とDeep Learningの今後

 さて、このように筆者は「実験がんばります」とポジティブな事を言っているが、本音を言うと物理学に興味が無くなってしまい実験を辞めたくて仕方がないのである。もともと筆者は物理学を社会の役に立てて人々の生活を豊かにしたいと思ってやってきた。しかし、物理学を追究してきた現在の筆者の生活(収入)は全然豊かではなくて、筆者は物理学を人類の生活どころか自分の生活の役にも立てられていないという矛盾に気づいてしまったのである。

 Deep Learningはこの先発展期をむかえ、ここ数年のうちに多様なサービスに応用されていくであろう。その応用先としてはWebサービスや医療・産業、それにとどまらず子供向けのおもちゃにまでさえ広がっていくと思う。こうした技術の変革期において、Deep Learningの展望は現在の物理学の行く末よりもよほど夢があるように見えてしまう。

 もう正直に言うが、筆者はこの物理業界を抜けて別の業界へ転職したいと思っている。中でも筆者が注目しているのがアダルトコンテンツ業界である。

 まずDeep Learningを使ってAVのモザイク処理を自動化したい。現在AVの局部に対するモザイク処理は大勢の人が手作業で人海戦術でやっているのだが、ち●こやま●この認識をコンピュータにやらせればこの作業は桁違いに高速化される。またキネクトのようなものを使って体の姿勢の情報を付与してやれば、局部箇所の検出精度はかなり上がるだろう。

 それからこの世からパケ写詐欺をなくしたい。パケ写詐欺とは、女優さんの顔がAVのパッケージ写真と本編で全然違ってがっかりさせられることである。これは製作会社がDVDを売るためにフォトショップのようなものを使ってパッケージ写真だけを手作業で修正しているからである。こういう悲しいことを無くすためには画像処理によって顔のパーツをいじるという修正作業を、動画中の全てのフレームに対してコンピュータにやらせればよい。

 

で、結局筆者はどうする?

 ・・・と散々愚痴のようなものを言いつつ、筆者はまだこの物理業界に残ると思う。なぜなら知人に道端で会ったとき、「実験やめたったわー」というギャグが使えなくなるからである。

(つづくのか)