実験やめたった シマエナガ編

劇団「実験やめたった」の活動報告

FMラジオの話と、タブレット端末を録音専用機にした話

 

アブストラクト(概要)

 にわかFMラジオファンの筆者が、最近聴いている番組の中からおすすめベスト5を紹介する。また筆者がWindowsタブレット端末をネットラジオ録音専用機にする際に嵌った落とし穴について紹介する。

 

いきさつ

 最近の筆者の趣味はFMラジオの番組を聴いたり録音しまくることである。

 先の年末の頃から筆者は過労で神経系をやってしまって、筆者は神経科の先生に「何も考えない、リラックスした時間を作ってください」と言われていたのであった。そういえば筆者は実験の策を考えようと、現在のプロジェクトの今後を脳内シミュレートしていくと、どう見積もっても爆死エンドに行き着いてしまい、いつも動悸がしてきて意識がなくなるのであった。

 そんな中、せめて通勤途中は何も考えずに楽しく行こうということでFMラジオを聴き始めた所、色々な音楽が流れていて自分の音楽の知識が膨大な勢いで溜まっていくのが非常にたのしく感じられた。そしてこういう素晴らしい音楽を一曲でも多く聴きたいと思い、自宅のPCを使って気になる音楽番組を録音しまくることにした。録音にはWindowsフリーソフトのRadikoolというやつを使った。

Radikool - radiko録音ツール

 

筆者おすすめの番組ベスト5

 というわけで、にわかFMラジオファンの筆者が、最近聴いている番組の中からおすすめベスト5を紹介する。

第5位 モーニングチャージ (Zip-FM 月-金 8:50)

 朝の8時50分ごろからMCの小林たくいちろうさんが、リスナーの記念日や誕生日をお祝いしてくれるコーナーがある。そのリクエストというのが、「えろいアムロレイとマスオさんとふなっしー波動砲を発射するモノマネで誕生日を祝ってください」とか目茶振りが過ぎるのに、たくいちろうさんはそれにちゃんと応えてくれるのでたのしい。ちなみにぜんぜん関係ないが、筆者の後輩にサンシャインこばたくというボーカリストがいる。

第4位 日本の民謡系 (NHK 朝5時台とか土日の11時ごろ)

 図1に示すように、実は筆者は民謡バンドのドラムをやっている。民謡というのは誰かが明確な意図をもって設計した曲とは違って、自然発生的に生まれて口伝によって伝えられてきた音楽で、繰り返しの回数とか歌詞の抑揚がその土地の独自の感覚で作られているのが面白い。筆者は民謡の伝承者として、民謡系番組、ひいては民謡の素晴らしさを広めていきたいと思う。

第3位 ザ・ソウルミュージック (NHK 木 23:00)

 オダイジュンコさんのMCで、ソウルの新譜や名曲を幅広く紹介してくれる。惜しくも今年はモーリスホワイト氏、プリンス氏といったソウル界の偉人が相次いで亡くなり、彼らの追悼特集が組まれた。こうして改めて彼らの音楽を聴くと、ソウルミュージックを世界中で愛される普遍的な芸術へ昇華させた彼らの業績の偉大さに敬服せざるを得ない。

第2位 ユキ・ラインハートさんのA・O・R (JFN 月-木 20:00)

 ユキ・ラインハートさんのMCで、曜日ごとに色々な音楽が紹介される。筆者は特に月曜日の洋楽ロック特集が楽しみで、毎回とあるアーティストを取り上げ、その生い立ちから現在までの軌跡が辿られる。人生を音楽とともに生きたスターたちの光と影を知ることができ、彼らの音楽によりいっそう深い理解を与えてくれる。

第1位 音楽遊覧飛行 (NHK 月-木 9:20)

 「音楽の翼にのって、心の旅に出かけましょう」ということで、4人のMCの方々がローテーションで音楽を紹介してくださる。特にダ・カーポの榊原広子さんの回は、懐かしい歌、童謡、合唱曲、愛唱歌の特集で、榊原さんの語り口と流れてくる曲が綺麗すぎて筆者は毎回心が洗われる。またリスナーからのお手紙も、「何十年も前に聴いた思い出の曲です。ぜひ、もう一度聴きたいです。」という御年輩からのリクエストが多く、音楽を聴くという事は一期一会で本当に貴重な体験なのだなと改めて認識させられる。民族音楽が好きな方はサラーム海上さんの回もおすすめである。

 

 

f:id:jikkenyametatta:20160615195647j:plain

図1.筆者

 

 

タブレット端末を録音サーバーにしよう

 こうして筆者は自宅のPCを常時稼動させて毎日5番組くらいを録音しているのであるが、タブレットPCを使えば今より消費電力が抑えられるし、夏場に落雷でPCが死ぬ心配もなくなってさらにハッピーになれるんだろうと考えた。そこで筆者は近所のPC屋に行って、中古だけどほぼ新品のWindowsタブレットを約1万7千円で購入した。

shopap.lenovo.com

 ところが筆者はタブレットPC初心者だったので、タブレット端末特有の落とし穴にはまりまくった。

 

勝手にスリープ状態になって録音がされない

 Radikoolの「録音のX分前にスリープを解除する」という機能が効かずに録音がされない。たぶんこの機能はタブレットには対応していないのであろう。またWindowsのコントロールパネルの電源オプションで、「X分後にディスプレイの電源を切る、だけど、スリープ状態にはしない」という設定にすると、「X分後にスリープ状態にする」と勝手に解釈される(参考サイト:価格コムの掲示板)。仕方がないので筆者はスクリーンセーバーで黒い画面を出すようにしているのだが、これは黒い画面を表示させ続けているわけで、消費電力とハードウェア的には負荷である。

 

解像度が高すぎてVNCで見るとはみ出まくる

 指のタッチによる細かい操作がやりづらくてVNC経由で別のPCから操作しようとしたのだが、タブレット端末の画面の解像度が1920*1200とやたら高く、1280*800のノートPCでは画面がはみ出まくった。

 

ビットレートが1kbpsになる

 mp3のビットレートを196kbpsという設定にすると、なぜか勝手に設定が1kbpsになってしまう。仕方がないので筆者はデフォルトの128kbpsのままにしておいた。 とここで、「果たしてオリジナルの音声はどれくらいのデータサイズで配信されているのだろう?」と疑問に思ったので調べてみた。すると、HE-AACなる方式でなんと48kbpsというビットレートらしい。というわけで、原理的にデータ量は48kbpsでよい。サンプリングレートは8.2kHzの2倍で16.4kHzっぽい。(参考サイト:オーディオの科学

 

 

まとめ

 また色々設定をためしていきたい。なお、筆者は最近またあんまり家に帰っていなくて録音した番組が溜まる一方なので、遠征にいくときなどにまとめて聴きたい。

 

 

謝辞

 6月中に3回以上のfabまたはRTをしてくれたバンドサークルの後輩のみんな:ぐっさん、ちっさん、まゆかちゃん、しゅんちゃん、でってゆ君、ないとう君、おおもり君、さきちゃん、ロペス君、いつも筆者の健康状態を心配してくれてありがとう。筆者は抗不安薬を服用するのをやめたせいで日中は動悸がして意識が朦朧として一見病状が悪化しているようなのだが、でも何故か文章はすらすら書けて、薬の副作用で眠くならなくなって、夜も眠れないので、一日中業務が可能で、先週より業務の効率が上昇している。だから筆者がツイッタ等で何かを発言している限り、ちゃんと物理学は進歩している。是非安心してほしい。芦田くんは就職決まっておめでとう。

某バンドサークルのコンピアルバムにOBからのコメント

 

いきさつ

 筆者が活動していたバンドサークルの後輩の皆さんが、オリジナル曲を作って集めてコンピレーションアルバムを作った。今回のアルバムは去年に引き続き2作目であり、筆者は第1作目の出来が良かったので今年のアルバムの出来を楽しみにしていた。というわけで筆者は先週の土曜に集会に顔を出してそのCDを手に入れた。取り計らってくれたおおもりくん、サークル長のかいせいくんに感謝したい。

  筆者はこのアルバムを大学への道中の車内で流しているが、なかなかの出来栄えで後輩のみなさんの努力が感じられた。各バンドのメンバー、そして編集に携わったkzくん、おおもりくん、ないとうくん、たいへんお疲れさまでした。

 

 この記事では、OBである筆者が、このアルバムを聞いた感想やコメントを述べる。

 

なぜオリジナル曲を作るのか

 音楽制作にはかなり多くの苦労をともなうものの、それらを経て完成した作品というのは一生の思い出に残る。その時々で自分の持つ技術を総動員して作った作品は、後から振り返ったときに自分の音楽家としてのステップアップの記録となる。また一緒に苦労して製作したメンバーは必ずこの先も長い付き合いになる。筆者も過去に何枚かオリジナルアルバムを作っているが、筆者が学部生の頃に作ったアルバムの製作メンバーとは今も交流があり、いまだにいつも「あれほどのものをよく作ったなぁ」という話になる。

http://sound.jp/himo/top.html

 

 また自分で音楽を作るという道のりを経ることで、音楽を楽しむ観点が増える。我々バンドで楽器をやっている人間は、音楽の中で様々なパートが音楽の全体を構成していることを知っている。それと同じく、作曲、編曲、レコーディング、ミキシングの経験を実際にやると、市販されている音楽が実は職人の技術によって製作されていることがわかる。音楽を聴いていて「ここはなんでこのメロディなんだろう?」「なんでこの歌詞で、コード進行で、この表現なんだろう?」と思ったとしても、考えた結果「やはりこれがベストだ」と納得させられてしまい、これがプロの技なのだと感服する。こうした曲の魅力がわかるのは音楽家の特権である。

 

 というわけで、ちょっとでも「曲をつくりたいな」と思っている若手のみなさんは、是非オリジナル曲の製作に挑戦してもらいたい。重要なのは羞恥心を取り払い、一発でも曲を形にして人目に晒すことである。表現したいものがなかなか決まらないという場合は「おっぱい揉みたい」でも「教授○ね」でも適当に決めればいい。まず何でもいいから何かデモ音源を作って、何人かで何かやっていると何かができてくる。音楽理論などを勉強するのはそういった曲を数曲作ったその後でいい。

 

筆者がコメントを公開する理由

 筆者がこうしてコメントをするのは、テンション的にコメントをしたくてしょうがなくなっている為であるが、わざわざネット上で見える形で公開するのは、実際に曲を仕上げた後輩のみなさんのステップアップを願ってのこと、また筆者が言ってることがおかしかったら遠慮なく反論とか指摘を頂きたいという理由である。音楽とはコミュニケーションであり、曲を聴いた人からのコメント、フィードバックが不可欠である。音楽家としての成長とは、こうした意見を取捨選択して、最善の表現を追究することでなされていくものだと思う。筆者はつねづね「自分の音楽には何かが物足りない」という「何かとは何だ」と問いかけを持ちつづけ、様々な実験を重ねて音楽の理解を得てきたつもりである。筆者は今回、極力コメントの内容を具体的にしたつもりで、この意見が後輩の皆さんの何かしらの助けになればと思う。これは若手の意欲を削ぐかもしれないリスキーな事であるが、これも(最近ほとんど楽器を触っていないけど)筆者の音感の鍛錬、音楽活動の一環だと思ってやる

 

 以下、各曲に対するコメントである

 

ラボ

 もうこれはすばらしい完成度である。曲の雰囲気もしばくんのボーカルと相まって爽快な感じが良い。アルバムの1曲目として最適である。各パート全部すばらしいが筆者はドラマーなので特にドラムを褒めたい。イントロから古賀くんのアクセントの効いたタムがよく鳴って曲がシャキっとする。ドラムの一つ一つの音がクリアでリズムが正確に叩けているのがよくわかる。サビのコード進行が洒落ていて、ともすれば和音が微妙に変な感じになってしまうところが、音作りと音符の積み上げ方がしっかりしているので良くまとまっている。

 ただ、Bメロ(♪1,2,3で飛び出して)、サビ(♪見たことも無い)が良いフレーズなのに曲の中で一回しか登場していなくてもっとききたいなという気分になる。曲の長さをまだ長くしても良さそうなのでもうちょっと繰り返しがあってもいい。そして筆者はかなたむが卒業してしまったので非常に悲しい。しゅんちゃんは博士課程がんばれ。

 

カルネ

  このバンドは男女ツインボーカルという構成で歌のメロディーもかっこよく、バンドとしての特徴が出せていると思う。しかしイントロの和音がちょっと難解すぎないかなと思う。この曲は冒頭からしばらく聴いていてAメロの最初のコードのFmが聴こえたところでやっと曲の調がファを主音とするへ短調であることがわかる。なぜイントロの調性が分かりにくくなっているかというと、曲の一番最初の音がファ#(ファに対して短2度)で、さらに2番目の音がシ(増4度、トライトーン)で、いきなり要取扱注意の音から始まるからである。というわけで少なくとも最初の音をファにする。そしギターの音色をクリーントーンからディストーションをかけて音の厚みを増し、ファ→シ→シb→ラbの動きを明確にするのがよいのではないかと思う。

 

きつね

 インスト曲でこれだけフレーズを多彩に展開していけているのはさすがである。またまたドラムを褒めると、いとけんくんのドラムが細かいフレーズであってもちゃんと叩けていてすばらしい。もし可能なら、曲が盛り上がって来たところでバスドラムがサンバキックになると、多分筆者は感激のあまりしぬ。

 注文をつけるならば、0:35くらいからのピアノがモチーフを弾くところは1オクターブ高くてもよくて、またギターメインの場所は、初めはこのモチーフを基本にしたフレーズにして、徐々にアレンジを加えて発展していくと主題がはっきりすると思う。

 この曲のようにギターとピアノが共存する曲は特にギターの音作りが難しい。ギターの音色をフレーズ単位で細かく調整して、そのときどきで音が細くならないよう、出しゃばりすぎないように気をつけたい。

 

Boars

 もはや貫禄すら感じられる演奏である。演奏のテンポ的な意味でも、表現したい事の方向性が去年からぶれてないという意味でも安定している。ちょっとだけ注文をすると、もっとボーカルを前に出すためにリバーブをややひかえて音量を上げてもいいとおもう。

 

アイス

 筆者はこういうノリは大好きである。アイス好きが度を越して人としての枠をはみ出ている感じがいい。ただ名曲としてのポテンシャルが素晴らしく高いだけにいくつかコメントがある。

 Bメロのコード進行にやや不自然さが感じられる。サビの2小節前、「♪この思いだけは」の所にトニックコードであるCが配置されていて、サビへの盛り上がりが停滞する印象を受ける。ここは例えばBメロコード進行を

 F... G... Em... Am...

 Dm7... G... C... C7... (20160501修正)

 F... G... Em... Am...

 F... FonF# ... Gsus4... G...

 というにして、「♪僕の名前を」をラの音から始めるのはどうだろうか。となるとBメロの頭のFにつなぐために、Aメロのラップの部分の最後はC…C7…とする。また、「♪僕のー名前をー呼ぶ」の箇所に曲中最高音のラの音が登場していて、サビが登場する前にピークを迎えてしまっている。ここでさらに「♪僕の名前を」をラの音から始めてしまうと、その問題が余計増強されてしまう。となると、せっかくサビがチャッチーなので、サビを冒頭にもってくるという編曲もあるとおもう。

 この曲はパーティ会場でみんながぴょんぴょんしながら楽しむ曲だとおもうので、最近の流行りの音作りを参考にして、跳ねずにはいられないような演出を追究してほしい。なお筆者はシンセの音はもっと矩形波っぽい高周波を含んだ音のほうが好みである。

 

ののトリオ

 もう3人とも音がすばらしい。完成度が高くて聴かせる曲になっている。メッセージもストレートで良い曲である。 ここまで技術的に色々できるとバンドとしてのキャラ作りもかなり自由にできる。苦労を多く経験した先輩が、生き急ぐ後輩に対して「Take it easy」と言っているような一面や、大学生として「自分らしく生きよう」と決意をあらわにしている一面など、色々な意味を含んだ表現にできる。演奏が上手いので歌詞に説得力が出るのである。

 この曲は冒頭が英語で始まるが、英語の歌詞を歌うときには「t」や「s」など子音の発音を大げさ目に発音すること、またマイクでこれを録音するときには音量のレベルに注意することを気をつけてほしい。この際、DeEsser というコンプ系のエフェクタがあるので適当に必要に応じて使ってほしい。

 

castella

 編曲、各パートの動き、音作りはすごく良い。間奏のバリエーション豊かで工夫が感じられた。ただボーカルの音域が一番歌いやすい高さよりやや低めなのではないかと思うのと、またサビの音域は曲中で一番高くなるようにすることを考えてメロディを設計してほしい。サビの出だしにシンコペーションを使っているが、これが唐突な印象を与えてしまっているので、小節の中でどの拍にアクセントを置くかも全体を見据えて設計してほしい。イントロのギターはタイミング、休符の入れ方をもっと厳密にするといいと思う。

 

2年同期

 この曲は「これまでネガティブな生き方をしてきたが、開き直って変わっていく」という決意をあらわにした曲である。だから、リスナーとの間に交わされるコミュニケーションは「共感した。自分も変わりたい。」や「その決意、しかと見届けた。」とあるべきである。歌詞の内容は過去の自分を強烈に曝け出したものであり、その覚悟が相当なものであると見受けた。今後もその決意で精力的にやってもらいたい。

 編曲はとても良いとおもう。ギターの動きは基本ができていてリフも良いので、もう少し前に出してもっとコード感が出せるといいと思う。ボーカルの音域が せっかく最高ラの音まで出せるので(2:15のあたり)、全体的にメロディをもっと高めに設定できる。ベースは基本に忠実に音を選んでいっているが、もう少し動いてもいいとおもう。ここでさらに「俺は殻を破ろうとしていま限界ギリギリで生きている!」ということがよく分かるような表現がもっと盛り込まれていたら、リスナーの「自分もこうありたいという共感」、「その覚悟は技術的にも裏打ちされているなという安心感」が得られると思う。(20160429加筆)

 

マカロニ

 この曲のサビはマクド○ルドのポテトのCMにそのまま使えそうなキャッチーな曲である。この「CMに使えそうか」、「テレビの歌番組でサビの1フレーズだけ流れてきただけで記憶に残るか」という観点は重要である。是非よさそうなフレーズを思いついたらこうした想像をしてみて、曲のポテンシャルを評価してほしい。

 ミキシングに関して、実は男女の声を共存させるのは難しくて、この曲の場合声の中音域(1kHzくらい)をもっと出して女声が自然な感じになるとよかった。また、ないとうくんはこの曲の中で語りを入れているが、その技はBoarsでも使っていて、もう少し別の歌い方をしたら技の多彩っぷりを印象付けるのに一役買ったのではないかという点で惜しい。

 

SD

 この曲は演奏の技術面が高いだけに、繰り返しが少なくてなおかつ変化が激しいので曲が難解になってしまっているのが惜しい。例えばほぼ同じ構成で歌詞の2番をつくり、シンプルに繰り返すだけで、だいぶん曲が記憶に定着しやすくなるのではないかとおもう。

 

温スト

 まさに王道をいく曲作りで、テーマの選び方、各パートの動きも基本をしっかり押さえている。どんどんこの調子で作曲、楽器の練習をやっていってもらいたいとおもう。

 この曲のAメロのコード進行は

A....... ........   A....... ........ 

A... C#m... D... A... D... E... A.......

で、パンクロック的にシンプルなコードでいくというのならこれで全くOKだと思う。ただ蛇足かもしれないが他にもコード進行はありえて、例えば

A... Bm... C#m... D...     A... E... D... Dm...

A... C#m... F#m7... F#m...   D... E... A... A7...

ともできそうなので、いくつか考えてみてほしい。(20160430コードの表記が間違ってたので修正)

 

ボーカルの会

 春らしいさわやかな景色が思い浮かぶ曲である。ゆったりしたテンポと着実なリズムの刻みは、これまで歩いてきた道、未来へ続く道を一歩一歩を踏みしめるような表現でいいと思う。何人もの声が重なったサビは迫力がある。しかしこの曲もイントロで曲の調性(変ロ長調)がすぐわかるような和音の構成だったらもっとよかったとおもう。

  

 

 

ちなみに

 以下は去年のコンピアルバムに収録されたとある1曲(ねぇねぇネオン)を、筆者がハワイ風にアレンジしたものである。筆者は自称ウクレレ奏者で、このアルバムの他の曲もハワイアレンジのカバーを作りたいのであるが、なにせ本職の実験がアレなので手が出せずにもどかしい思いでいる。また今後いくつか作ってみようと思う。

 

soundcloud.com

 

 

いっぽう筆者の若いころは・・・

 筆者の若いころ(学部3年、2004年)に作った曲を載せておく。

 

曲名:尿検査再診のお知らせ

作詞:エーちゃん(ドラム、筆者らの代のサークル長)

作曲:tyuiop(昔の筆者)

収録アルバムのタイトル:内部がナイーブ(筆者プロデュース、5曲で15分くらい。)

ジャケ絵:からあげ師匠(現在もお世話になっております)

 

soundcloud.com

OpenCV3.1のcv::dnnを使ってCaffeModelを使った画像分類をWindows上でやる

 

アブストラクト(概要)

Windows7 + Visual Studio 2013 Community + OpenCV3.1 + cv::dnn の環境を作りました。

・CaffeNet、GoogLeNetによる画像分類が動きました。

・自作学習データを使うにはどうしたらいいかという記述がネット上にありませんでしたので、苦労しましたが、がんばって調べた結果、一応動くようにはなりました。

・しかし、挙動がまだ完全に理解できていないので、 cv::dnnのユーザーが増えて誰か筆者にそこのところを教えてくれないかなあと思っています。

 

はじめに:いきさつ

 筆者はつねづねDeep Learningの定番ライブラリ:Caffeの画像分類を、Windows + OpenCVでもやりたいと思っておりました。筆者の職場の計算機はほぼすべてWindowsで、これまでは、(1)OpenCVで作った物体抽出器で画像中の候補箇所をトリミングし、(2)その画像をLinuxに転送してCaffeで画像分類・・・というまわりくどいことをしていました。もしCaffeの画像分類がOpenCVの枠組みで実現できるとしたら、工程が減るので使い勝手がよいわけです。そんな状況のなか苦戦の末、OpenCVのcv::dnn(ディープ・ニューラル・ネットワーク)モジュールの使い方がわかったので、その方法を紹介します。

 

OpenCV3.1+opencv_contribを自前でビルド

Q.えー、ビルドとかやったことないですー。いつもここからダウンロードしたものを展開して使っているのですが・・・。

A.いまのところ、プレビルト版にはdnnモジュールは入っていません。dnnモジュールを使いたかったらこれを含めた版を自前でビルドする必要があります。(探せば誰かがビルドしてくれたバイナリ版もなくはないですが、CPUとかライブラリの構成を最適にするには自前で設定してビルドするのが良いと思います。:20160412加筆)

 

というわけで若干ハードルが高いですがやってみましょう。なお、ビルドに関して筆者が参考にしたサイトはこちらです。

OpenCV3.1のビルド - AkiWiki

OpenCV 3.0がリリースされたので導入してみた - Qiita

OpenCV: Build opencv_contrib with dnn module

 

まずインストールすべきもの

・CMake。ビルドに関する諸設定をして、ビルドのためのVisual Studioのファイル(ソリューションと言う)を生成する。

Visual StudioVisual Studio Communityという版は個人用利用だったらフリーで使用できる。ちなみに筆者は2013を使った。

 

ビルドの手順の概要

Githubから、opencv本体、opencv_contribのソースコードをダウンロードし、適当な場所に配置。

・CMakeでビルドの設定をし、Visual Studioソリューションファイルを生成。

Visual Studioでビルド。

・できたバイナリファイル(*.libファイルなど)やincludeファイルなどを、適当なフォルダに配備してPATHを設定する。

 

うごかしてみよう

 こちら↓に詳しい解説の記事があります。実際に動かしてみたとき、caffenetがねこの識別結果を出してきたら成功です。ただし落とし穴があって、「"caffe.LayerParameter" has no field named "input_param"」というエラーが出てきた時はprototxtの記述が対応していないので変更する必要があります。

 

qiita.com

 

prototxtの記述の変更の方法:

OpenCVでニューラルネットワークのcaffeモデル読み込み | MOGINOメモ

 

こちらは公式のチュートリアルです。GoogLeNetスペースシャトルの識別結果を出してきたら成功です。

OpenCV: Load Caffe framework models

 入力画像を指定する際にnet.setBlob(".data", inputBlob)と記述します。このdataの前のドットは何を意味するのかが不思議だったのですが、このチュートリアルに書いてありました。この引数では"name_of_layer.name_of_layer_output"と記述します。ここで、最初レイヤーには名前がないので".data"とするそうです。

 

自作学習データで動かしてみよう

 筆者の手元にDIGITSで生成したAlexNetの学習データがあります。これを利用するには、cv::dnn::createCaffeImporter() の箇所やその他特定のファイル名を、自作学習データのファイル名に変えてやります。しかしまたここにも落とし穴があって、平均画像(mean.binaryproto)を差し引く処理を自分でやらないといけないようです。(本家Caffeだったらprototxtの中で、layer.transform_param.mean_file: "mean.binaryproto"・・・と指定できるのだが、現在は多分対応していない。)

 以下が筆者の書いた画像を差し引く処理です。このときMatの輝度値が負の値になることがあるので、データの型はCV_16S(符号付16bit整数)としています。(20160411一部修正)

 

 

 こうして一応はそれらしい識別結果が出るようになりました。しかし検証のためにこの結果とDIGITS経由で識別させた結果を比較してみると、softmaxの出す確率の値が違っています(要するにまだ完全に挙動が理解できていない。)。何が原因なのか、どなたか詳しい方、筆者に教えてやってください。筆者もひきつづき調査をすすめていきたいとおもいます。

 

DIGITS経由の識別の結果(A,B,T,Vの4カテゴリー)

00001.png Predictions
    81.77% A
    17.22% V
    0.93% T
    0.08% B

 

同じファイル、学習データをcv::dnnで識別させた結果

00001.png
V : 53.5173 %
A : 23.9567 %
T : 22.1351 %
B : 0.390848 %

_人人人人人人_
> なんか違う!<
 ̄Y^Y^Y^Y^Y^Y^ ̄

 

謝辞

 kibo35さん、いつも筆者の研究を応援してくださりありがとうございます。最近筆者はPETやSPECTなど、物理学が人々の健康に役立っているのを見ると物理屋としての誇りを感じます。DeepMindのハサビス氏は「人工知能技術を素粒子物理の分野などで科学をより発展させるのに使いたい」とコメントしておりますが、筆者も同感で、この技術を(AVの次に)物理学に生かすことが出来たら、と思っております。

www.theverge.com

オリジナルの手帳を作ろう

 最近筆者の仕事の能率がぜんぜんよくないのはなんでかと考えたところ、予定帳を持っていないからであるという結論にいたりました。一年の計は元旦にあり。というわけで筆者は書店に新しい予定帳を買いにいったわけですが、月間ブロックとか週間レフトとかヴァーティカルとか色々な種類がある割には筆者のほしいようなタイプのやつがないのです。

 

<筆者のほしいような手帳のタイプ>

・見開きB5サイズで薄い

・変な汁がついても染みにならない素材が表紙に使われている

・予定を書くところが時計の形をしている(図1)

・今週見たAVの感想を書く欄がある

 

f:id:jikkenyametatta:20160103003844j:plain

図1:予定を書くところが時計の形をしている

 

 

 無いものは自分で作りましょう。一週間7日ぶんの24時間時計が見開きで一覧できるようなデザインの手帳をつくります。pythonのcalendarモジュールとPDF出力をするためのreportlabモジュールを用います。

 

gist0bf85e2cebfb68be28f9

 

 これを実行すると、同じフォルダの中に以下のようなPDFができます。2016年1月の5週間分が一度にできます。よろしかったらみなさんも是非使ってみてください。評判がよければクラウドファンディングでお金をあつめて商品化しようと思います。

f:id:jikkenyametatta:20160103004648p:plain

 

 

 なおpythonの環境の構築ですが、Windowsをお使いの方はpython(x,y)というのを使うと必要なものが全部一発でインストールされます。

Python-xy.GitHub.io by python-xy

2015年を振り返る:人工知能はコンピュータウィルスで暴走するのか?

 

2015年の筆者はコンピュータウィルスと戦っていた。この記事ではその戦いの様子と、人工知能やIoTが普及しているであろう未来のウィルス対策について考えたことを述べる。

 

8月の騒動

 最初のウィルス騒動は8月に起こった。筆者が朝大学にやってきてしばらくするとネットが繋がらなくなっていた。そうこうしているとすぐに「ネット繋がってませんよね?」と色々な人が筆者のところにやってきた。そして出張中のボスから「管理部局がネットを遮断したというので事態を調査せよ」との指令が来た。

 

 管理部局から送られてきた情報によると、ウチのネットワークから異常な量のpingが特定のサーバに向けて送られまくっているらしい。pingとはネットワーク上にあるコンピュータに対して信号を送り、相手から応答があるか、ひいてはネットワークが疎通しているかを確認するものである。このping信号自体は無害であるが、一気に大量のpingを特定のコンピュータに送り高い負荷をかけることで、そのコンピュータを機能不全に陥れることができる。ウチから出ていたというpingの送り先のIPアドレスを調べてみるとGoogleとかYahooのサーバだった。つまり、現在我々の中の誰かのPCが何らかのウィルスに感染しており、知らないうちにサイバー攻撃(いわゆるDDos攻撃)に加担させられているのであった。

 

 筆者はフロアの全員に自分のPCのウィルスチェックを頼んだのだが、それらしきウィルスは出てこなかった。その日はボスがいなかったのでアクセスログを解析する方法(を書いた書類の所在)が分からず原因は特定できなかった。

 

 翌日ボスが戻り、筆者がアクセスログを解析したところ、pingを出しまくっていたのはM1のN君のPCだと判明した。前日のウィルスチェックでN君のマシンからは何も検出していなかったのにも関わらず、である。運の悪いことに原因が分かったのは金曜日の夕方で、ネットワークの復旧は早くても週明けの月曜日を待たねばならなかった。

 

 筆者はそのウィルスの素性を調べるために、N君のPCをネットワークから隔離して色々実験をやってみた。その結果分かったことはこんな性質である。

Windows System Center Endpoint Protectionには検知されない。

GoogleやYahooのサーバに、毎分10発のペースでpingを送る。

・PCをしばらく放置しておくと活動を始め、キー入力があると止まるようである。

 

 筆者はさらにPCのどのプロセスがpingを出しているのかまでを突き止めたかったのであるが、筆者もN君も本業のほうを進めないといけなかったのでこれ以上の調査は打ち切りにした。2015年で最も悔しい出来事だった。そして筆者らはN君のマシンを工場出荷状態に戻した。

 

 しかし事態はこれでまだ終わらなかった。N君のマシンをひきつづき監視していたら何も変なフリーソフトはインストールしていないのに、例のpingが出ていた。これはもはやDE●Lの工場出荷状態の時点でその挙動が入っていたとしか考えられない。結局筆者らは、工場出荷状態よりも前の、素のWindowsを入れたのみの状態にまでPCの状態を戻す羽目になった。それ以降N君のマシンからは変なpingは出ていない。

 

11月の騒動

 二度目の騒動は11月に起こった。筆者のいるフロア全体がまたインターネットに繋がらなくなった。今度の遮断の原因は、とあるPCがcommand&controlサーバにアクセスしていたのが検知された為だという。これはつまり、誰かのPCがウィルスに感染して、遠隔操作で乗っ取られそうになったという事である。またここ一ヶ月ほどの間も怪しい通信(url schemeを悪用した攻撃かもしれない通信)がちょろちょろと出ていたらしい。また筆者に調査の指令が出された。

 

 ログを見てみると、原因はつい数日前に海外からやってきた外国人研究者のWさんのマシン、それから留学生のGさんのマシンだった。

 

 Wさんに話を聞くと、日本に着て早々"なんとかリペアー"なるフリーソフトをインストールしたらしい。そのフリーソフトか、または同時に出てきた変な公告のリンク先がウィルスであった。そのPCにはカスペルスキーがインストールしてあって問題の通信があった直後にウィルスを検知して削除していた。しかし、管理部局が「一度でもウィルスに感染したPCはOSから再インストールすべし」と言ってきたのでやむなく再インストールをすることにした。

 

 またGさんのマシンのOSを再インストールをしようとしたところ、実はWindowsが非正規品だったことが判明した。Gさんは発展途上国からの留学生であるが、そこではそういう品がさも普通に売られていて、Gさんは自分のPCが海賊版だとは認識していなかった。Gさんは泣く泣く正規品のWindowsを買いに行った。なお日本におけるWindowsの価格は、Gさんの国の平均的な1ヶ月分の給料に相当する。Gさんは「国に病気の母がいるので、少しでも仕送りをしたいところなのに・・・」と言っていた。それがあまりに可哀想だったので、ボスがその費用を出してあげたらしい。

 

犠牲者

 こういう事件が起こると関係者全員が不幸になる。同じフロアにいる助教のN先生は気の毒なことに、「学会のプログラム編成をやらなきゃいけないのにネットが使えないのは困るなぁ」と言っていた。そして最も気の毒なのは筆者自身で、事態を調査し皆さんのPCの面倒をみていたせいで週末と勤労感謝の日がつぶれた。それからこの一連のやり取りの中で、我々は管理部局から「またあなたがたですか」と眼の敵にされているような印象を受けた。確かに我々に非があるのは確かだが、そういうライフラインを握っている者が「こちらの条件を受け入れないとネットワークを復旧させない」とけしかけてきたのはもはや脅迫なんじゃないかと思った。

 

 ところで、筆者のいるフロアでは、各人は自分のPCで固定IPを設定して、有線LANでないとインターネットに接続してはできないことになっている。当初筆者はそんなアナクロなことが本当にあるのかと思っていた。しかし情報セキュリティに力が入れられない団体や企業は、トラブルを未然に防ぐためにこういう厳しい条件を課さざるをえないのであろう。ネットワーク利用の利便性にも世の中には大きな格差が存在するのである。

 

 そしてやはり一番許せないのは、ウィルス作成者である。こうした我々一般市民を巻き込んだサイバー攻撃は無差別テロとかと同じである。そのために我々はウィルス対策ソフトを買わねばならなくなり要らん仕事を増やされる。筆者はそういった脅威が消え平和が訪れることを切に願っている。

 

人工知能とIoT時代のウィルス対策

 このようにサイバー攻撃の手口は多様になってきているいっぽう、人工知能が社会に普及し、IoTと呼ばれるように多くの機器がネットで接続される将来、ウィルス対策というのはどうなるのか。正しく動作している人工知能が何者かの悪意によって予期しない挙動をしてしまうことがあるのか。また賢くなりすぎて人類に危害を与えるようになった人工知能を(ID4のアレやナポギストラーやメタルギアのGWのように)ウィルスを感染させて葬ることはできるのか?

 

 最近筆者は、大学に泊まる日の夜に銭湯に行った際、毎回マッサージチェアに揉まれることにしている。マッサージチェアに揉まれていると、あと数年もすれば人工知能技術がマッサージチェアにも搭載されるようになるんだろうなと想像する。例えば、体をもむ装置に体の弾力を測定するセンサーがついていて、凝っている部分を集中的に揉んでくれる技術が付くとおもう。また心拍数とか「あぁー」とか言う声によってリラックス具合を検知し、その人が一番気持ちいいと思う箇所を長いことやってくれるようになると思う。筆者の場合はア●ルへの振動が心地よくてどんどんフィードバックがかかった結果ア●ルばかりが開発されていくだろう。そしてその情報はメーカーにネット経由で送信され、現在日本人がどんな筋肉の凝りに悩まされているか(またはア●ルの開発が進んだか)を調査するデータとなるだろう。

 

 こうした未来において、どんな脅威がありえるかを挙げてみる。揉む力を最大限にして揉まれている人間を骨折させる、また何か回路に変な大電流を流して発火させるなど。これはシステムの制御系に作用する攻撃である。また情報を抜き取るスパイウェア的な脅威としては、筆者の身体的特徴だとかア●ルがどれだけ開発されたかと言う個人情報の盗聴というのもあるだろう。

 

 で、筆者でも思いつくようなこういった簡単な攻撃は、多分メーカーがすでに対策をとっていて心配しなくてもよいのではないかと思う。各出力装置にはハードウェア的に出力の制限を設けておき暴走しないようにする。情報は内容を暗号化して特定のコンピュータとの間でしか通信しないようにする。で、結局システムの要素を細かく見ていけば、「狭義の意味での人工知能」の仕事とは分類とか回帰とか推定であるので、そこに作用する攻撃としては、オンライン学習を上手くいかなくすることで、また、最適化された学習結果を改ざんすることで、ぜんぜん気持ちよくないマッサージ器にしてしまう、程度の攻撃にしかならないんじゃないかと思う。もちろんそういった学習データやデータIOの部分はネットワーク外部からのアクセス権が無い所で守ってあるはずで、(狭義で)人工知能をバグらせるという事自体難しく地味なものであろう。

 

 筆者の意見をまとめる。ここ数年の間に人工知能搭載を謳った家電が続々登場してくると思う。それはメーカーが自社の研究室でチューニングしたパラメータによって動作するのではなく、実際のユーザーとのインタラクションの中で最適なパラメータが更新されていく、そういう意味の学習機能=人工知能を持った製品である。こういう製品は外部から不正に操作されないよう、標準化されたインターフェイスを持つモジュールを組み合わせて出来ているとおもう。だからよほどの事がない限り、外部からウィルス的なものを感染させて暴走させることは出来ないと思う。我々ユーザーは普通に使っていればウィルス感染の心配はしなくてもよい・・・ようにメーカーと法体系がしてくれるはず。

 

 ただこれは素人の想像であって実際に何が起こるかわからない。それから真の意味での人工知能が現れた時はどうなるのかはなおさら分からない。みなさんのご意見はいかがだろうか。(なげやり)

 

とりあえず筆者は、IoT時代のスタンダライゼーション権はどこが獲っていくのかに興味がでてきた。

2015年を振り返る:メタルギアソリッド編

 

 先日のこと、筆者はふとしたきっかけでメタルギアソリッド(MGS)のプレイ動画を見た。  

 

 MGSが発売された当時、筆者は中学3年だった。その頃の筆者はバイオハザードのようなアクションゲームにはまっていて、サバイバルゲームと称してエアガン片手に野山を駆け回っていた。ある日筆者がテレビを見ていると、コナミが発売したゲームが大人気で売り上げランキングの1位を獲り続けているという。そのゲームはテロリストの基地の中へ単独潜入して敵と戦うというもので、ゲーム画面は空間が全部3Dで描かれており、カメラの視点がキャラクターの移動にともなって流れるように切り替わっていた。筆者はその映像の凄さに「これは本当にプレステのソフトなのか?」と、また「ウチにあるこのプレステでこんなゲームが動くのか?」と衝撃を受けた。それはまさに筆者が思い描いていた究極のアクションゲームそのものだったのである。  

 

 筆者はこのゲームを中学生の頃にかなりやりこんでおり、プレイ動画を「懐かしいな」と思って見ていた。ところが筆者がその全編を見終えて抱いた感想は、中学生当時の筆者が感じたそれと全く違うものだった。

 

 2015年を振り返ってみると、「中学生の頃に見た作品を今見たら印象が全く違っていた」という経験は多かったように思う。例えばジャッキーチェンの「酔拳2」は中学生の筆者が一番好きだった映画であるが、最近見たらスタントが危険すぎて楽しく見ていられなかった。また筆者は映画館で(一人で)「ジュラシックワールド」を観たが、哀しいことに「この企業のコンプライアンスは大丈夫なのか?」というエンターテイメントと関係ないところが最も印象に残った。また最近ふとしたきっかけでGLAYの音楽を聴いたら「GLAYはこんなにも人生というテーマについて歌っていたのか」と驚いた。作品の受け止め方というのは受け手の経験によって全く変わるという事を改めて感じた。なおGLAYが「pure soul」を発表した1998年、これらの楽曲を作詞作曲したTAKUROさんは当時若干27かそこらだった。いっぽう筆者が27の頃というと、一ヶ月の収入が8万円で(うち5万が学費として消える)、筆者は実験室でう●こを漏らしながらち●この歌を書いていた。申し訳ない限りである。

 

 以下MGSにフォーカスして印象に残った箇所を挙げていく。なおこの記事の内容の大半は、自分自身への反省である。

 

ゲームとしての完成度の高さ

 MGSはプレステのハードウェアの性能をほぼ最高レベルで引き出している。環境の作りこみがすばらしい。

 

 シナリオも今見ると「こんな重い話だったのか」と驚く。主人公のスネークは伝説的な兵士で、世界を核戦争から救うためにはこの男しかいないと戦場へ単独で投入される。ゲーム中のやりとりをみると半ば強制的に連れてこられた感じである。そんな理不尽で極限的な環境におかれながらもスネークは任務を遂行する。極限状態の中で深い愛憎劇が織り成される。無線という一見疎な通信手段を介しながらも、登場人物の人生、歴史、未来が濃密に交錯する。まさに映画のようである。

 

 もし筆者がこのような状況に置かれたらどうするだろうか想像してみる。いや、もしかすると程度は桁違いにしょぼいながらも、人は誰でも同質の状況に置かれているのかもしれない。筆者は研究費の申請書に「この実験は筆者の持つ技術と経験なくして成立しない」とか「この実験は物理学の進歩に不可欠である」と書いた。額面どおり読めば、筆者がこの実験をやめれば実験は失敗に終わり物理学の進歩は途絶える。しかし最近「この実験はどうやっても成功しないだろう」と絶望するばかりで、「もう筆者が出来ないと言っているので不可能ってことでいいだろう」とさえ思うようになっている。ゲームオーバーである。  

 

 なぜスネークはこんな重圧を背負って孤独に任務を遂行するのか。その理由とは、次の世代に未来を託す為だという。この作品を通じて示されているテーマは、遺伝子や生命の意義、さらに、生きる意義とは何かであった。中学生当時の筆者はこのテーマの重要性について理解できなかったが、今ならそれが少し分かる気がする。そういえば中ボスを倒すと「褒美にこれをやる」とアイテムを手渡され、以前は「なんで自分を倒したやつにそういうものをあげるのか?」と不思議に思っていたが、これは死ぬ前に何かを残したいというヒトの本能がそうさせているのであろう。我々も次の世代を育てていかなければならない段階になってきている。ちょうど今月の頭に筆者の友人の井上君に娘が生まれた。筆者は次の世代のために命を懸けて仕事をしているだろうか?いや、筆者は本業のほうに力を入れずAVの研究しかしていない。申し訳ない限りである。

 

オタコンの凄さ

 オタコンが凄い。まず彼の経歴であるが、MITに独学で入学し若くして博士号を取得した。そして次に、メタルギアの開発責任者として実際にメタルギアを完成させた。  

 

 プロジェクトの責任者たるもの、どれだけの予算を使い、どの開発チームにどんな仕事を振れば、いつまでにモノが出来るかを見極める能力が必要である。さらにプロジェクトの責任者たるもの、開発の経緯をつねに把握し、物事が予定通り行かないとなったら方針を適切に転換するなどしてプロジェクトを完遂まで導かねばならない。メタルギアは二足歩行をする巨大ロボットで、さらに光学迷彩やVR技術と多岐にわたる技術が詰め込まれている。そもそも人を乗せて動く乗り物というのは、(それはMRJの開発を見ていただくと実感してもらえるように)開発が難しい。それをやり遂げたというのは実績としてすさまじい。  

 

 ここで読者の皆さんは「そんなのはフィクションの中での設定だから」と思うかもしれない。しかしそういうフィクションみたいなとんでもない輩が実際に、ほんとうに現実に居るのである。自分が「こんなのは無理だろう」と思っていることを、さらには出来るか出来ないかすら想像したこともないような事を、実際に実現させてしまう人間がいるのである。だから最近の筆者はフィクションに登場する天才に対して、「こういう人間は実際に居る」という妙なリアリティを感じるようになっているのである。

 

空想科学読本

 筆者が中学生のころ、空想科学読本という本が流行った。この本は、ウルトラマンなどのSF作品の設定を真面目に計算すると実際にはとんでもないことになる、という本である。中学生当時の筆者はこの本を何度も読み、特に「ウルトラセブンがマッハ7で飛ぶと、衝撃波で裂ける」という挿絵に呼吸困難になるほど笑った覚えがある。なおこの本の著者の柳田氏に、筆者は4年くらいまえに実際にお会いしており(サイン会があったので)、その際に「夢に向かって進め」と激励のサインをいただいた。  

 

 架空の作品の設定を何故真面目に考証するのか。これは専門家の素人に対する揶揄だとか知識の誇示だとかと捉えられるかもしれないが、実際に数値をあてはめて試算してみるというのは理系にとっていわば生理反応なのである。その計算結果がとんでもないことになったらそれはそれで面白いし、別の手段を使ってなんとかならないかと考える。そのモチベーションの根底にあるのは作品に対する愛着である。

 

 筆者は最近になってSFの楽しみ方が変わってきたように思う。過去の想像力の天才が思いついた突拍子もないアイデアが、現在の技術でやっと実現味を帯びてきている例。現代の天才が、当時の人々が想像した形とは全く違う所で新しい発明を作ってしまったという例。SFにはそのどちらともがあるのでおもしろい。

 

 ところで、最近空想科学読本を今いちど読み返してみると、なんだか内容に物足りなさを感じてしまった。「作品の設定を実際に計算してみた結果はこれです」という文章が載ってはいるが、その計算のために使った基本的な方程式は何なのか、グラフは無いのかと論文を添削している気分になってしまう。やはり人は歳をとるにつれ物を見る観点が変わってしまうのである。

 

科学者の判断

 オタコンが本当に凄いのはさらにこの先である。彼はメタルギアが核攻撃に使われると知った途端、即それを破壊すると決断した。メタルギアの開発には(B2ステルス爆撃機が1ユニット20億ドル以上なので)日本円にしたら数千億円もの巨費が投じられたことであろう。これはいわば巨額な資産で、ジュラシックワールドの社長しかりで、生かせる所は生かしてなんとか穏便に収めたいと思うのが当然である。しかしオタコンは(メタルギアへの愛着もあったはずだが)戦争を抑止するという本来の目的のためにメタルギアの開発から破壊工作に転じるのである。科学者の真の能力とは、自分の仕事が世界にどう影響を与えるかを正しく想像する力なのである。

 

 さて科学者の英断といえば、宇宙線研の梶田所長の師、戸塚さんの対応も凄い。2001年11月、ニュートリノ観測装置、スーパーカミオカンデの光センサーが、突然轟音をたてて次々と破損した。この事故によって数分のうちに何億円という機器が損失し、また復旧のためには年単位で装置を停止せざるをえない状況になったのである。ここで普通なら何が起こったんだとうろたえ、もうおしまいだと絶望する。しかし戸塚さんはすぐさまスーパーカミオカンデを再起させると外部に向かって宣言した。これは彼の実験に対する信念、この実験装置が物理学の進歩になくてはならないという信念がなければできない業である。  

 

 話は変わるが、先日筆者が実験装置を動かしていたら30万円の部品が突然異音を立てて故障した。別に筆者は変な操作は一切していないのにも関わらずである。ところがその瞬間に筆者は「もう辞めよう」という発想に行き着いてしまった。筆者は自分の器のあまりの小ささに絶望するしかなかった。歴史に残る偉大な技術者や科学者はどんな心境で自分の仕事をしていたのだろうか。筆者は口では「長年の修行を積んでここまで来た」と言っているが、本物の実験屋として辿り着くべき境地にはまだ全然及んでいない。

 

メタルギアソリッド2

 筆者はこの続きでメタルギアソリッド2の動画も見た。メタルギアソリッド2ではスネーク、オタコンとともに、オタコンの義理の妹、エマ・エメリッヒも登場する。彼女は超多変量情報分析、まさしく現在で言う機械学習の専門家ということである。彼女はメタルギアの母艦に搭載されている人工知能の開発者であり、その暴走をとめることができる唯一の人間である。彼女は人工知能をコンピュータウィルスに感染させ、その動きを止めるという。

 

 

次回「人工知能はコンピュータウィルスで暴走するのか?」

2015年を振り返る:Deep Learning編

 2015年のキーワードといえばDeep Learningである(筆者しらべ)。この記事では筆者の一年をDeep Learningを軸に振り返る。またこの技術に関する筆者個人の所感を適当に述べる。

 

Deep Learning 2015

 筆者にとって2015年とはDeep Learningを追い続けた一年であったといえる。筆者は素粒子原子核宇宙物理のポスドク(3年目)であるが、今年の進捗は思ったほどのものでもなく、しかもプロジェクトは炎上しっぱなしで毎日が絶望の連続であった。最近感情の起伏も乏しくなって何かをやろうという気力もなくなってきた。そんな中、筆者がDeep Learningとは何かを追い求めていた今年の前半は、筆者はまだ希望があり具体的な目標に向かって生きていた。そしてDeep Learningが目の前のコンピュータ上で動き、その仕組みが理解できた瞬間というのは近年まれに見る感動であった。

 筆者はテンションが上がり「Deep Learningを普及させるためにこの経験をまとめよう」といって本ブログで記事を公開した。このブログは元々筆者の音楽活動を紹介するために開設したのだが、この記事によっていきなり人工知能に関する技術系のブログとなった。この記事はその後多くの方々に読んでいただいており、公開から半年経った今でも一日に平均30件ほどのアクセスがある。筆者はDeep Learning界の最先端に触れ、微力ながらも社会のみなさんに有益な情報を発信することができた。この事はDeep Learningが理解できたという体験とともに今年を代表する印象的な出来事である。

 

jikkenyametatta.hatenablog.com

Deep Learningへの道のり

 思えば筆者がDeep Learningなるものを始めて知ったのは2014年の1月であった。英国企業のDeepMind社が、Googleに5億ドルで買収されたと報じられた。そしてこの技術を扱える研究者は世界に数十人しかいなくて、大手IT企業がそういった人材をめぐって熾烈な争奪戦をしているというのであった。筆者は世界でも20人程度しかやらないようなマニアックな技術で実験をやっているのだが、何かの拍子にこの研究がカネに結びついついて富豪になれやしないかと常々願っているのである。だからDeep Learningの研究者はまさにそういう筆者の願いを具現化した人々:金の鉱脈を掘り当てた人々として、筆者の目には華々しく映ったのである。

 その後筆者はDeep Learningの基礎となる機械学習という分野があることを知り、後輩のよこやま君の勧めで広島大の玉木氏のオンライン講義を受けたのであった。この講義はSimon Prince氏の教科書、"Computer vision: models, learning and inference"を読み進めるものであった。筆者はもともと画像処理の経験があり、自分はすでに画像認識に関する知識をかなり持っているもんだとタカをくくっていた。ところが講義が始まって出てきたのは確率・統計に関するディープな話題で、自分の理解がコンピュータビジョンのごく表層のみで留まっていたことにショックを受けたのである。画像認識の目的とは画像を基に何かしらの判断を下すことである。それまで筆者がコンピュータビジョンライブラリ(OpenCV)のおまけだとばかり思っていた機械学習に関する機能こそが、実はコンピュータビジョンの主役だったのである。

 

www.udemy.com


人工知能の正体

 

 こうして今年の7月ごろにはDeep Learning、ひいては(現在の)人工知能とは何であるかが見えてきた。それと同時に分かってきたことは、Deep Learningの正体というべきものが、世間一般の持つイメージとかなりズレているということである。

 多くの人々は人工知能を黒魔術か何かだと思っている。人間の脳を模した「何か」を用意し、これに色々な刺激を与えてやると、その「何か」は勝手に世の中の仕組みを理解して、しまいには人知を超えた神託をアウトプットしはじめる。実際筆者もはじめは人工知能に対して、「よく分からないけど凄い力が問題を解決してくれる」と誤った認識を持っていた。もしかしたら今後コンピュータの発展によって人工知能が本当の黒魔術になる日が来るかもしれないが、現在我々が扱える人工知能技術は、なんというかもっと基本に忠実なモノである。

 だから筆者は人工知能に関して、実際の問題解決にどう生かすかという現実的な情報がもっと増えて欲しいと思う。筆者は人工知能とは「大量のデータから傾向をよく分析して、意思決定の材料に使いましょう」という一つのツールだと認識している。ネット上に溢れる人工知能の話題は、「人工知能がいかに凄いか」とか、はたまた「人類はどうなるのか」というSFチックな話が多いのだが、この技術を正しく普及させるにはもう少し現場に即した話:どんな問題に威力を発揮して、いっぽうどんな問題には不得手なのかという情報が必要である。

 

筆者が研究にDeep Learning導入した結果

 筆者がDeep Learningを本業に導入することでご利益があったのかなかったのか。その答えは「一部はご利益があったが、費用対効果で考えればまだペイしていない」である。

 筆者の研究では、大量に撮影した画像の中からレアな物理現象を探している。その物理現象はこれまで世界で10例程度しか発見されておらず、新しいものが1例出るだけでも(この業界で)大騒ぎするシロモノである。これを見つけるために直線検出とか形状認識を組み合わせて候補を抽出するのだが、もともと撮った写真には似て非なるものが大量に映っているのでゴミばかりが抽出される。これを目視で選別する作業が細大のボトルネックであった。筆者がDeep Learningに手を出した直接のモチベーションは、このレアイベント検出の高速化である。

 現在我々がやっているDeep Learningの使い道はこうである。まず抽出画像をDeep Learningでラフに分類する。こうして選ばれた画像を人間が見る。Deep Learningによっておおまかな分類が既に済んでいるので、多くの画像は「この形はAかBかCか」という多肢の分類から「この形はAかそうでないか」という二択に落とし込むことができる。この工夫によって人間の負担は以前よりも軽減された。

 ところがDeep Learningは、「レアなイベントを大量の画像の中から確実に抽出しろ」というタスクを直接的に実行できない。そういう画像を豊富に用意できない対象についてはDeep Learningはそのメリットを生かせないのである。Deep Learningは残念ながら、まだ筆者の研究のブレイクスルーをもたらすまでには至っておらず、本命のレアイベントも未検出のままである。 そしてさらに悲しいことに、本命のレアイベントが見つかっていない以上、Deep Learningの導入を大々的に自慢できないでいる。この手の話は実績がすべてで、「導入したんだけどまだ実績が出ていません」では学会等で発表する意味が無い。また物理の業界には人工知能の類を嫌う人々がいて、恐らくそういった人々は人工知能というオカルトじみた印象にアレルギーがあるのであろう。また多くの学生が今流行りの技術だといって手を出したものの、結局モノにならなかったというケースがゴマンとあるのではないかと思う 。

 とにかく、Deep Learningのご利益を最大限に生かしつつ、本来の目的であるレアイベントの検出を一刻も早く実現したい。

 

筆者とDeep Learningの今後

 さて、このように筆者は「実験がんばります」とポジティブな事を言っているが、本音を言うと物理学に興味が無くなってしまい実験を辞めたくて仕方がないのである。もともと筆者は物理学を社会の役に立てて人々の生活を豊かにしたいと思ってやってきた。しかし、物理学を追究してきた現在の筆者の生活(収入)は全然豊かではなくて、筆者は物理学を人類の生活どころか自分の生活の役にも立てられていないという矛盾に気づいてしまったのである。

 Deep Learningはこの先発展期をむかえ、ここ数年のうちに多様なサービスに応用されていくであろう。その応用先としてはWebサービスや医療・産業、それにとどまらず子供向けのおもちゃにまでさえ広がっていくと思う。こうした技術の変革期において、Deep Learningの展望は現在の物理学の行く末よりもよほど夢があるように見えてしまう。

 もう正直に言うが、筆者はこの物理業界を抜けて別の業界へ転職したいと思っている。中でも筆者が注目しているのがアダルトコンテンツ業界である。

 まずDeep Learningを使ってAVのモザイク処理を自動化したい。現在AVの局部に対するモザイク処理は大勢の人が手作業で人海戦術でやっているのだが、ち●こやま●この認識をコンピュータにやらせればこの作業は桁違いに高速化される。またキネクトのようなものを使って体の姿勢の情報を付与してやれば、局部箇所の検出精度はかなり上がるだろう。

 それからこの世からパケ写詐欺をなくしたい。パケ写詐欺とは、女優さんの顔がAVのパッケージ写真と本編で全然違ってがっかりさせられることである。これは製作会社がDVDを売るためにフォトショップのようなものを使ってパッケージ写真だけを手作業で修正しているからである。こういう悲しいことを無くすためには画像処理によって顔のパーツをいじるという修正作業を、動画中の全てのフレームに対してコンピュータにやらせればよい。

 

で、結局筆者はどうする?

 ・・・と散々愚痴のようなものを言いつつ、筆者はまだこの物理業界に残ると思う。なぜなら知人に道端で会ったとき、「実験やめたったわー」というギャグが使えなくなるからである。

(つづくのか)