この記事は前回のつづきです。
ご覧になっていない方はまずこちらからお読みになってください。
相変わらず反論が的外れな新井紀子教授
「偶数と奇数をたすと奇数になることを示せ」と求められているのに、「2+1も4+9も偶数になる」というのを山のようにプレゼンして示して悦に入る人に対して、名のある方は距離を置き、安易に「いいね」しないことをお勧めしたい。これで終了でいいですか?
— 新井紀子/ Noriko Arai (@noricoco) March 15, 2018
悦に入るもなにも、それで解けてしまうのだからしょうがないでしょう。
それとも先生の言う通りの方法で答えにたどり着けないと不正解なのでしょうか?
そういう指導を行う先生に対するバッシングはTwitter上でよく見かけますし、そういう誰も得をしない教育方法は辞めた方がいいと思います。
たとえばこんな問題です。
「平面上に四角形がある。各頂点からの距離の和が一番小さくなる点を求めよ」
実際に図を描いてみるとわかりますが、人間だったら、「答は、対角線の交点だな」となんとなくわかります。証明もそれほど難しくありません。
新井紀子先生は、わざわざ括弧でくくって問題が何かを明確にしてくれています。
『証明もそれほど難しくありません』なんていう問題とは直接関係ない情報もくれるあたり、優しさを感じます。
「平面上に四角形がある。各頂点からの距離の和が一番小さくなる点を求めよ」という問題に対して、私はその点の座標を計算してしまいましたが、もしかしたら新井紀子先生が欲しい答えは『対角線の交点』だったのかもしれません。
ちなみに前回の記事で説明した通り、角度が180度より大きい頂点がある四角形においては、その頂点が『各頂点からの距離の和が一番小さくなる点』なので、『対角線の交点』という答えは不正解です。
それに対して私の書いたプログラムは、入力がいかなる形の5角形でも6角形でも100角形でも答えを導き出すという人間にはできないことを一瞬でやってのけます。
新井紀子教授は画像処理のプログラムを書いたことがない
去年の10月に書いたこちらの記事で、以下の新井紀子教授の主張はおかしいという話をしました。
たとえば犬の写真があったとします。写真のサイズやそのほかデジタル的なデータの変更があっても、人であれば画像を見たら即座に犬だと理解できます。でも、AIはできない。同じ規格の過去データがないからです。
すると以下のようなお返事が『AI vs. 教科書が読めない子どもたち』では書かれていました。
現状の画像認識や音声認識システムには、実用化するうえで、決定的な問題点が2つあります。一つは、AIの目であるカメラ、耳であるマイクというハードウェアがバージョンアップしたときにおこります。現在、最もAIに期待がかかっている画像診断では、そのリスクが問題になっています。
(中略)
それらの画像は、デジタル、すなわちピクセル行列でできています。その解像度が上がったり、規格が変わったとき、ハードの「視力アップ」に追随するには、教師データをつくるところからすべてやり直さなければなりません。画像認識や音声認識の最前線で戦っている何人もの優秀な研究者から直接確認したことですから間違いありません。
私は本書を読んで、新井紀子教授が何を勘違いしているのか理解できました。
引用では省略しましたが、ここでいう『それらの画像』とはMRIやマンモグラフィのことです。
そしてここでいう『規格』とは、『どのような手法で画像を取得するか?』ということだと推測できます。MRIを使うかX線を使うかで、まったく同じものを撮影しても取得できる画像が異なるからです。
つまりここでは『撮影方法』の規格の話をしているのに、新井紀子教授はそれを『ピクセル行列で表された画像の表現方法』に異なる規格があると勘違いしているのです。
犬の写真とかいう見当違いの例を出しているのが何も理解していない証拠です。
ピクセルデータはどこまで行ってもピクセルデータです。
スマホのカメラで撮影した犬の写真を見て、それを撮ったスマホのメーカーやモデルを当てることは普通出来ないでしょう。
ピクセルデータには異なる規格という概念はありません。
新井紀子教授が画像処理のプログラムなど一度も書いたことがないのがよくわかるエピソードです。
画像認識や音声認識の最前線で戦っている何人もの優秀な研究者から直接確認したことですから間違いありません。
その研究者の方々の言っていることは正しいと思います。
間違っているのは新井紀子教授の解釈です。
また解像度が変わっただけで、学習したディープラーニングモデルが使えなくなるようでは実用に耐えません。
この問題に対するもっともシンプルかつ効果的な対応方法は、元画像だけでなく、それを拡大縮小させた画像も一緒に学習データの中に入れておくことです。(Data augmentationといいます)
実は新井紀子教授はこの問題に対する対応方法を本書の中で自分で書いています。
回転しても拡大縮小してもやはりイチゴはイチゴで、解像度を下げてもやはりイチゴです。何を当たり前なことを、と思われるかもしれませんが、ここがとても重要なのです。膨大な教師データを作成しようとすると、普通ならとてつもないコストがかかります。でも、画像の場合は、一枚の教師データを回転したり拡大縮小したりすることで、教師データの数は一気に増えます。業界ではこれを「水増し」と呼んでいます。
これはまさに入力画像の解像度が変わっても学習モデルがうまく動くようにするための処理です。
しかし新井紀子教授はこれを水増しとよび、単に教師データ数を増やすための処理だと間違った解釈をしています。
伝聞の伝聞に価値はない
『直接確認したことですから間違いありません』という言葉が先ほど出てきました。
専門家が言っているから信じるというのは良くない習慣です。特に博士号を持つ大学教授が言うべき言葉ではありません。
『聞いたから~だ』だと主張するのではなく、わからないものはわからないと素直に言えばいいと思います。
世の中のすべてのことに精通している人など誰もいないので、別に知らないことは恥ずかしいことでもないですし、もちろん悪いことでもありません。
むしろ博士や大学教授の言うことは正しいと思い込んでいる方は少なくないので、数学者や大学教授という肩書で間違った情報を流すのは社会にとって有害です。
今はだれでも最新の研究成果が記された論文に無料でアクセスできます。
自分が大切だと思うことに関しては、新聞やニュースなどの『伝聞の伝聞』を聞いて分かった気になるのではなく、できるだけ現場の人間が出している情報に直接あたることを意識する必要があります。
読解力があっても知識がなければ他人にいいように利用されるだけ
『AI vs. 教科書が読めない子どもたち』は、子供たちの読解力を向上を目指すためにリーディングスキルテストを中学1年生全員に受験させるたいという言葉で結ばれます。
読解力はあるにこしたことはないと思いますが、私は十分な知識が伴わない単なる読解力は有害になることも多いと考えています。
新聞に書いてあることは常に鵜呑みにするべきですか?と問われれば、私の言っていることは理解していただけるのではないかと思います。
AIのどこが気に入らないか、今言葉になった。
AIは短期的には多くの人の「役に立つ」けど、長期的にはほんの一握りの人の巨大な利益をもたらし、圧倒的多くの人から搾取する装置(戦争で犠牲になることも含めて)だから気に入らないのだ。
— 新井紀子/ Noriko Arai (@noricoco) March 8, 2018
読解力があっても、書いてある内容を自分の知識と照らし合わせてその真偽を判断できなければ、他人に簡単にコントロールされてしまいます。
読解力も大切ですが、それ以上に、自分の手を動かし、自分の目で見て知識と経験を増やし、自分で真偽が判断できる部分を増やすことこそが、もっとも人生を楽にするものだと私は考えています。
そのためには知識と経験がなによりも大事で、そのスタート地点に立つための準備が学校の勉強です。
↑記事をシェアしてください!読んでいただきありがとうございました。