AI研究における苦い教訓 (4/6)

10月 26, 2019

音声認識においても、1970年代にDAPRAがスポンサーをした競争があった

参加者には、人間の知識、すなわち、言葉、音素、人間の声道などを利用した特化型の手法を用いたものがいた。

一方で隠れマルコフモデルに基づき、コンピュータの計算能力を活用した、もっぱら統計を用いた新しい手法もあった。

ここでも統計的な手法が人間の知識に基づいた手法に勝利を収めた。

このことは自然言語処理における大きな変革をもたらし、数十年かけて、次第に統計とコンピュータによる計算がその分野の大勢になっていった。

音声認識における近年のディープラーニングの活用はこの一貫した流れの中でもっとも最近におこった出来事である。

ディープラーニングでは人間の知識への依存は一層少なくなり、よりコンピュータの計算能力に依存したものになっている。そして膨大な教師データにもとづいた学習を利用して、圧倒的に優れた音声認識のシステムを作り出した。

ゲームの例でみたように、研究者たちは、常に自分たちが、自分たちの心が動くのと同じように動くシステムを、自分たちの知識をそのシステム内に構築することで、作ることを試みてきた。

しかしムーアの法則を通じて圧倒的なコンピュータの計算能力が使用可能になり、それを有効に利用する方法が見つかった今となっては、それらの試みは究極に非生産的であり、その研究者たちは壮大な時間を無駄にしたことは明らかだった。

 

コンピュータビジョンにおいても同様のパターンが観察されている

初期の手法は境界や円柱、またはSIFT特徴量などを探すものだった。

しかし現在ではそれらは捨てされれてしまった。

最新のディープラーニングニューラルネットワークはコンボリューションとある種の不変の処理のみを利用し、そしてそれらは圧倒的なパフォーマンスを出している。

 

The Bitter Lesson by Rich Suttonからの翻訳)

↑記事をシェアしてください!読んでいただきありがとうございました。


次の記事:

前の記事:


私のプロフィールはこちら

Twitterもぜひフォローしてください


ご質問、ご意見、ご感想等はこちらから!