ディープラーニングなカメラ翻訳から考えるパニックの原理のお話

こんばんわ。くらげです。

くらげは薄膜トランジスタTになった!

妻のあおが「贅沢な名だねぇ。 今からおまえの名前は薄膜トランジスタTだ。いいかい、薄膜トランジスタTだよ。」とかわけのわからないことを言っています。

いや、あおがGoogle翻訳アプリの新機能である「リアルタイム カメラ翻訳」にドハマリしていて、片っ端から色んな物を撮影しています。

で、手書きのボクの本名を書いたカードを撮影したところ、日本語を撮影したのにかかわらず、原型のない翻訳をされてしまいました。

で、あおが笑い崩れているわけです。

ディープラーニングの技術です

ディープラーニングとは

このリアルタイムカメラ翻訳、「ディープニューラルネットワーク(DNN)」という技術が使われています。ニューラルネットワークとは人間の脳の動きを模したアルゴリズムで、その中で最新版の技術を使って正確に演算することのできるAIと考えてください。ディープラーニングとも言います。

「ディープ」とは「深層」ということで、これまでの計算できる層は3層までだったのに比べてディープラーニングではそれを超える深さで計算することができます。要は高性能です。詳しく知りたいなら以下の本が参考になりますので、ぜひ。

[amazonjs asin=”4040800206″ locale=”JP” title=”人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)”]

特徴量とは

で、ディープラーニングが得意とするのは「特徴量」を捉えることなんですね。特徴量とはすごく大雑把に言うと、AをAとして認識するポイントのことです。人を見て猫と勘違いしないのはなぜかというと、人と猫には違いがあるからです。しかし、人と猫の違いをどうコンピューターに認識させるかというと、かなり難しい問題なんです。

ディープラーニングはその「何を持って猫とするか」というポイントを抽出することに長けていて、ディープラーニングで学習した画像については高い精度で猫を猫と見分けることができます。なお、AIが自動的に学んでいるもので人間と同じような捉え方はしないわけですよ。この辺がディープラーニングを採用したアルファ碁が「人間には思いつかない手を打った」と言われる所以なのですが。

いや、すごいのよ

このリアルタイム翻訳も映った画像から瞬時に書かれている文字を読み取り、翻訳しているわけですよ。OCRとか使ったことある人ならわかるとおもいますが、そのレスポンスの速さはすごいです。実際に見ているだけで「どうなってんの」と絶句します。そのくらいすごい技術が無料ってのがボクには信じられないです。

笑いの才能あふれる

なぜこうなった

で、このすごーい技術をですね、日本人はですね、大喜利にしちゃんですかね、なんでですかね。

Google翻訳の「リアルタイム翻訳」がおもしろ過ぎて試す人続出「電脳をハックされてる感じがたまらない」【画像まとめ】

いやまぁ、実際に面白いんですけど!あおもいろいろ撮りまくってますので、ちょっと一部を晒してみます。

特に、ご飯の中に「エリマキミツスイ」がいたのには驚いていました。もはや文字ですらねぇ!

使い物になる?

現在はあまり使いものにならない感じですけど、無数のオブジェクトを撮ることでGoogleのAIがどんどん賢く学習していくわけです。その手伝いを我々はしているんでしょうね。どんどん精度が上がっていくのは間違いないと思います。まぁ、この先どういう進化をしていくのか楽しみデスね。

パニックの可視化

で、ボクが気になったのは以下の動画。

電脳コイル、本当に面白かったですよね。ボクがハマって最後まで見たアニメは電脳コイルと四畳半神話体系だけです。DVDを買ったのも電脳コイルだけ、というくらいには電脳コイル好きです。SF好きはマスト買え。

[amazonjs asin=”B0058QFZYC” locale=”JP” title=”電脳コイル Blu-ray Disc Box”]

いや、ボクが電脳コイル好きかどうかはどうでもよくて、以下の様なことを考えたんですよね。

ちょっとわかってもらえない感覚だと思いますが、あんなんです。「何が何を認識しているか」がわからなくなってエラーが起きることもあるんですよ。それが「情報があふれる状態」と呼んでいます。まさに動画にするとあんな感じです。

この感覚をわかってくれる人は他にもいて、以下の様な反応が。

もちろん、誰も彼もが、というわけではないですけど、こういう状態の人は確実にいるようです。まぁ、普通に脳内のバグなんでしょうけども、なんなの、俺らGoogleのAI以下なの?とかなりますね?

まぁ、あおは「あんたの耳がリアルタイム翻訳だ!」とか言ってます。そのくらい聞き間違えは多いというかまず3回は繰り返さないと意味が通じない時があるので。「あんたの頭はナポリタン!」とか「ゴジラとゴモラがワルツ踊ってる」とかそんな具合に。これはこれで楽しい。いちいち聞き間違えなんて覚えてらんねぇよ!

ま、今日はこんくらいで。AI が自動的にブログ書いてくれる時代来ないですかね。新聞記事の一部の自動化には成功したみたいですけど。

では。

くらげ

This website uses cookies.