ご縁のあった人たち

無料ブログはココログ

« 個性の前の条件 | トップページ | 世界に受け入れられるために姿勢の変化が必要 »

2012年5月13日 (日)

エンジニアリングと研究者の立場

 人工知能学会誌の2012/5号に、「ポスト経験主義の言語処理」と言う特集があった。自然言語処理は、研究を工業製品化が追い越した、興味深い分野である。この話は、大学などの研究の世界から、企業の実用の世界に転換するために、学生(院生)の方々には、しっかり向き合ってもらいたいものがあると考えるので、私の意見を書いておきたい。
 この特集でも、p273~p283の辻井潤一先生の
  「合理主義と経験主義のはざまでー内的な処理の計算モデルー」
は、自然言語処理に40年以上も向き合ってきた重みを感じさせるものがある。しかし、この内容は製品化と研究の違いに通じるものとして読めば、全ての工学の分野に通じるものがある。就職活動の時間を少し割いて、この内容をしっかり理解すれば、大学の研究の実用化に対する考え方が、見えてくると考える。
 以下、私見で要点を拾ってみる。なお、経験主義とここで書いている部分は、一部はエンジニアリングの部分で実用化を考える場合と使えると思う。

 人間が話している言葉に関する研究を、自然言語処理と言う。(これは、プログラミング言語のような人工言語に対する概念である。)この研究には、大きく分けて、合理主義と経験主義の2つのアプローチがある。
 合理主義は、人間の思考過程を計算過程として捉えて、研究対象とする、いわゆる演繹的な手法である。一方、経験主義は、蓄積された言語データを見本として、統計的な処理などを用いて機械的に処理するものである。機械学習などとも関連した、帰納的な手法である。
 経験主義の過激な発言は、

 「言語学者を一人解雇するたびに、『機械翻訳』システムの性能が向上していく」
「対象の構造を理解するための理論よりもデータ」
「先験的な理解をシステムに埋め込むことは、逆にデータからの帰納的一般化を阻害し、システムの性能を落とす」

と言う風に、研究者が限られた範囲の厳密な思考に閉じこもることを批判している。

 一方、経験主義だけで走ると

「計算の枠組みに関するきっちりとした吟味を経ずにデータを取り扱うと、枠組み自体の限界から取り扱えない現象が生じたり、枠組み自体が強力すぎて過度に問題を難しくする可能性がある」

と言う問題がある。特に、

ある程度のサイズのデータがあると、比較的単純な計算の枠組みでそれなりの性能が達成できるという魅力が落とし穴となっている

と言う批判は、工業化の時によく出る失敗である。但し、この裏側に、単純な仕組みでも強引に作ることで成果を得た例もある。例えば、日本語ワードプロセッサの誕生などは、その例である。当時の人工知能研究者の発想では、実用的なかな漢字変換などまだまだと言う感触であった。それを、利用者の修正機能や、カタカナを直接入力するなどの手法で、実用化したのは、メーカー的発想の成果である。
 特に研究者が、ロングテイル的な特異な問題にこだわるため、常用の性能を落としてしまうことは、ありそうな話である。

 しかしながら、辻井先生が指摘しているように

理論からの演繹的な予測の誤りを重要視して、それを理論自体の改変に結びつける態度

はこれからも重要である。また

成功した経験主義的な手法にどのような合理主義からの貢献を入れることで、よりすぎれたエンジニアリング手法を作り上げられるか?

は、研究の世界と現実のモノづくりの世界の橋渡しの基本だと考える。

本稿は、文責を明らかにしたいので、このブログの主義に反するが作成者名を載せておく。

        人工知能研究からのドロップアウト者 鈴木良実

« 個性の前の条件 | トップページ | 世界に受け入れられるために姿勢の変化が必要 »

コメント

コメントを書く

(ウェブ上には掲載しません)

« 個性の前の条件 | トップページ | 世界に受け入れられるために姿勢の変化が必要 »