翻訳中の本に、影響力の強い文として出てきたので、座興でやってみた。んー、いまだとそんなにすごい感じではないのと、ChatGPTとか出てきて、人間計算機共生のありかたそのものの、歴史的前提が崩れ始めている感じではある。とはいえ、60年以上前の話だから…… むしろ、この中で出てくる、人間で拡張された機械、という概念の方が妥当性が高いんじゃないかとさえ思う。
人と計算機の共生
Man‑Computer Symbiosis
J. C. R. リックライダー 山形浩生訳 (hiyori13@alum.mit.edu)
IRE Transactions on Human Factors in Electronics,
volume HFE-1, pages 4-11, March 1960
要約
人と計算機の共生は、人と電子計算機との協力的な相互作用の中で、予想される展開となる。これは人間と、このパートナーシップの電子的な相方との間の、きわめて密接なカップリングを伴う。主要な狙いは 1) 計算機が現在やっている、定式化された問題の解決を支援するのと同じように、問題定式化の思考も支援するようになること、 2) 人間と計算機が意志決定や複雑な状況制御において、あらかじめ決まったプログラムに硬直した形で依存せずに強力できるようにすること、である。予想される共生的パートナーシップでは、人間が目標を設定し、仮説を構築し、基準を決定して、評価を行う。計算機械は専門定期、科学的な思考における洞察や決断を準備するために行うべき、ルーチン化できる作業を担当する。とりあえずの分析から見て、共生的パートナーシップは、人間単独でやるよりずっと有効に知的活動を実行できる。有効で協力的な関連を実現するための前提条件としては、コンピュータ時分割処理の発展、記憶コンポーネントの発展、記憶のまとめ方の発展、プログラミング言語の発展、入出力機器の発展が必要となる。
1 はじめに
1.1 共生
イチジクの木は、Blastophaga grossorun という昆虫に受粉される。この昆虫の幼生はイチジクの木の子房に暮らし、そこで食物を得る。このように、木と昆虫は深い相互依存関係にある。昆虫なしでこの木は再生産できない。昆虫は、木がなくては食べていけない。両者のパートナーシップは、可能というだけでなく、生産的で繁栄するものとなっている。この協力的な「二種類の類似しない有機体の間の、密接なつながりや緊密な連合の中で共に生きること」を共生と呼ぶ[27]。
「人と計算機の共生」は、人間=機械システムの下位分類となる。人間=機械システムは無数にある。だが現在では、人間と計算機の共生はない。この論文の狙いは、人と計算機械との間の相互作用におけるいくつかの問題を分析することで、人間と計算機の共生という概念を提示し、願わくばその開発に資することである。そのため、人間=機械工学で適用できる原理を指摘し、研究による解答が必要とされるいくつかの問題を指摘しよう。遠からぬ未来には、人間の脳と計算機械がきわめて緊密にカップリングされて、その結果として生じるパートナーシップは、これまで人間の脳が考えたこともないような形で思考し、今日知られている情報処理機械には及びもつかないような形でデータを処理できるようになることを期待したい。
1.2 「機械的に拡張された人間」と「人工知能」の間
概念として人間=計算機共生は、North [21] が「機械的に拡張された人間」と呼んだものとは重要な点でちがっている。過去の人間=機械システムでは、人間のオペレーターがイニシアチブと、方向性と、とりまとめと、基準を提供する。システムの機械的な部分は単なる拡張だ。最初は人間の腕の拡張、それから人間の目の拡張となる。こうしたシステムはどう見ても「二種類の類似しない有機体が共に生きる」というものではない。有機体は一種類しかない——人間だ。残りは単にそれを支援するだけだ。
もちろんある意味では、あらゆる人造システムは人間を助けるよう意図されている。そのシステムの外にいる人や人々を助けようというしている。だがもしそのシステム内部の人間オペレーターに注目するなら、技術分野の一部では過去数年ですばらしい変化が起こっている。「機械的な拡張」のかわりに人間が置きかえられ、自動化されてオートメーションとなり、残っている人々は助けられるよりはむしろ、機械を助ける存在となっている。一部の例では、特に大規模なコンピュータ中心の情報制御システムでは、人間のオペレーターは主に自動化するのが割に合わない機能を担当する。そうしたシステム (Northなら 「人間的に拡張された機械」と呼びそうだ) は共生的なシステムではない。それは「半自動化」システム、つまり全自動化を目指したが、その目標を達成でいいなかったシステムなのだ。
人と計算機の共生は、複雑な技術システムのパラダイムとして究極のものではないだろう。いずれは電子または化学的「機械」が、現在では人間の脳だけにしかできないと思っている機能のほとんどで優位となるのも、いずれは十分に可能だろう。現在ですら、平面幾何学の定理証明のために Gelernterが IBM-704 用に書いたプログラムは、ブルックリンの高校生と同じくらいの速度が出るし、同じようなまちがいもする[12]。実のところ、定理を証明し、問題を解決し、チェスを指し、パターン認識を行うプログラムもいろいろあり (すべてを網羅するには多すぎるが [1, 2, 5, 8, 11, 13, 17, 18, 19, 22, 23, 25])、それらは限られた領域では人間の知的能力に匹敵するものとなっている。そして Newell, Simon, and Shaw [20] の「汎用問題解決装置」が制約の一部を取りのぞくかもしれないと論じている。要するに、はるか遠い未来には機械だけによる脳の働きが支配的になる可能性を認めて、(他の) 人工知能愛好家たちとの論争は避けておくのが賢明に思える。それでも、それまでには長い過渡期があって、そこでは主要な知的進歩は、人間と計算機が親密な関係の中で協力して実現されることになるはずだ。学際的な研究グループが、空軍における未来の研究開発問題を検討する中で、人工知能の発達により機械だけで軍事的な重要性を持つ思考や問題解決ができるようになるのは、1980年頃だと推計している。そうなると、人間計算機共生を開発するのに5年、それを使うのに15年が残されるということだ。この15年は、10年になるかもしれないし500年になるかもしれないが、その年月は人類史上、知的に最も創造的でエキサイティングな時代となるはずだ。
2 人と計算機の共生が目指すもの
現在の計算機は主に、事前に定式化された問題を解決したり、事前に決めた手順に沿ってデータを処理したりするために設計されている。計算の流れは、計算の途中で得られた結果で条件分岐することはありが、その際の別の道筋も事前に予想しなければならない(予想外の別の方向が出たらプロセスがすべて止まり、プログラムの必要な拡張を待つことになる)。事前定式化または事前決定の要件は、ときには大した欠点にはならない。計算機械のプログラミングは、はっきりした考え方を強いると言われることが多い。それが思考プロセスに規律を設けるという。もし利用者が問題を事前に考え抜くことができるなら、計算機械との共生的なつながりは不要だ。
だが事前に考え抜くことができる問題でも、その多くは事前に考え抜くのはとてもむずかしい。直感的に導かれる試行錯誤のプロセスを通じてのほうが、解決も容易ですばやくなる。そこでは計算機が協力して、理由づけのまちがいを明らかにしたり、解法の予想外の変化をあらわにしたりするのだ。また問題によっては、計算機械の支援なしにはそもそも定式化できない。ポアンカレは「知りたいのは『答は何か?』ではない。知りたいのは『問題は何か?』ということなのだ」と述べたが、これは計算機利用者になりそうな重要な集団の苛立ちを先取りしたものとなっている。人間計算機共生の主要な狙いの一つは、計算機械を専門的な問題の形成部分にうまく導入することだ。
もう一つの大きな狙いは、これと密接に関連している。それは計算機械をうまく「リアルタイム」で行われねばならない思考プロセスに取り入れることだ。つまり、これまでのやり方でのコンピュータ利用をするにはあまりに速く動きすぎる時間の中で使えるようにするのだ。たとえば、こうしたスケジュールに基づいて戦闘を指揮しようとする場合を想像してみよう。今日、問題を定式化する。明日はプログラマと相談する。来週、コンピュータはプログラムのアセンブリに5分をかけて、問題の答を計算するのに47秒かける。戻ってくるのは全長3メートルもの紙のプリントアウトで、数字まみれだし、しかもそれは最終的な解決を示すものではなく、戦術を示唆するだけで、それはシミュレーションで検討するしかない。明らかに戦闘は、この計画が始まる第2段階以前に終わってしまっている。自分と相補的な能力を持つ同僚といっしょに考えるようなやり方で、コンピュータとやりとりしつつ考えるためには、この例が示唆しているよりも、そして今日可能なものよりも、人間と機械との間にずっと緊密なカップリングが必要となる。
3 計算機は問題定式化でのリアルタイム思考に参加する必要がある。
これまでの段落は暗黙のうちに、データ処理機械が行える機能は、うまく思考プロセスに導入できるなら、思考や問題解決を重要な形で改善支援できる、という想定をしていた。この想定は正当化が必要だろう。
3.1 専門思考の予備的かつ非公式な時間運動分析
思考や問題解決については莫大な文献があるし、発明プロセスについての詳細な事例史研究もあるが、科学技術的な活動に携わる人物の時間運動分析に相当するものは何も見つけられなかった。したがって1957年の春と夏に、私はそこそこ専門的な人間が、仕事をしているつもりの時間に実際に何をしているのかを記録しておこうとした。標本抽出の不適切性はわかってはいたが、このときには自分自身を被験者として選んだ。
すぐに明らかとなったのは、自分がやる主なことは記録をつけることで、この作業は当初自分が計画していたほど詳細なところまで行ったら、記録の無限後退になってしまうということだった。そこまで細かく記録するのはやめた。それでも、自分の活動の様子が得られると、考え込んでしまった。私の活動範囲は、典型的なものではないのかもしれない——そうでないことを祈りたいが、でも実際にはかなり普通なのではないだろうか。
私の「思考」の85%ほどは、まず考えるための立場につくために使われた。決断をして、何か知るべきことを学ぶために使っている。情報を消化するよりはるかに多くの時間が、情報収集に使われていた。グラフのプロットに何時間も使い、さらには助手にグラフのプロット方法を指示するのに使っていた。グラフが完成すると、関係は一目でわかるが、そうなるためにはプロット作業がまず必要だった。ある時点で、話の理解度と、話の信号雑音比を相関させる関数を決定するために、6つの実験結果を比較する必要が出てきた。その実験者たちはみんな、信号雑音比の定義も計測方法もちがっていた。何時間もの計算をしないと、そのデータを比較できる形にはできなかった。それが比較可能になったら、知りたいことの判断をつけるのには数秒しかかからなかった。
要するに、この検討している期間ずっと、私の「思考」時間は主に、本質的には事務処理的、機械的な活動に使われていた。探し、計算し、プロットし、変換し、ある想定や仮説の論理的または動的な結果を見極め、決断や洞察の道を整えていたのだ。さらに何を試みて何を試みないかという私の選択は、恥ずかしいほど多くの部分が知的能力についての考察ではなく、事務作業的な実現可能性の配慮に左右されていたのだ。
いま述べた結果から得られる主要な示唆は、専門的な思考に費やされていると称する時間のほとんどを埋める活動は、人間より機械がもっとうまく実行できる活動だということだ。こうした活動は、多様な変数と予想外の絶えず変わるシーケンスに基づいて実施されねばならないので、厳しい問題が生じる。こうした問題が、人間と高速な情報収集データ処理機械との共生関係を作り出す形で解決されれば、協力的な相互作用が思考プロセスを大幅に改善するのは自明に思える。
この時点で指摘しておくべきだろうが、ここで「計算機」という言葉はきわめて広範な計算、データ処理、情報の収集と引き出しを行う機械をカバーするものとして使っている。この種類の機械の能力はほとんど毎日のように増大している。したがって、この種の機械の能力について一般論を述べるのは危険だ。人間の能力についても、一般論を述べるのは同じくらい危険かもしれない。それでも、人間と機械の能力について、ある種の原型的なちがいは突出しているし、それは人間計算機共生の可能性と、それを実現することによる価値の可能性に関係してくる。
様々な形で言われてきたことだが、人間はノイズが多く、帯域幅の狭い装置だが、神経系はきわめて並列的で同時に活性化する経路をたくさん持っている。人間に比べると計算機械は極めて高速できわめて性格だが、常に同時には一つか少数の基本操作しかこなせないという制約を持つ。人間は柔軟で、新たに得た情報に基づいて自分を「条件つきでプログラミング」する能力を持つ。計算機械は一つのことしか考えられず「事前プログラミング」に制約されている。人は個別の物体のまわりに構築された、冗長性を持つ言語を自然にしゃべり、一貫性ある行動をして、20-60個の要素シンボルを利用する。計算機は「自然に」冗長性のない言語をしゃべり、通常は2つの基本シンボルしか使えず、個別の物体や行動の一貫性について、本質的な理解は持たない。
厳密な正しさを求めるなら、こうした特徴づけには多くの条件付けが必要となる。それでも、ここに示される非類似性 (したがって潜在的な相補性) の構図は基本的に有効だ。計算機械は、人間には困難または不可能な多くのことを、平気でうまく、素早く行えるそして人は計算機には困難か不可能な多くのことを、平気でうまくできる (が高速にはできない)。これは共生的な協力が、人間と計算機のよい特徴をうまく統合できれば、大いに価値を持つことを示唆している。速度と言語の差はもちろん困難の種となるので、克服が必要となる。
4 想定される共生的関係における人間と計算機の分離可能な機能
人間のオペレーターと機器の貢献はきわめて多くの操作では完全に溶け合って、分析の中できれいに分離するのはむずかしくなりそうだ。決断の元となるデータを集めるときに、人間と計算機の両方が経験から関係する先例を見つけ出し、さらに計算機が人間の直感的な判断と一致する行動の方向を示唆するなら、まさにそうした例となるはずだ (定理を証明するプログラムでは、計算機は経験から洗礼を見つけ、SAGEシステムでは行動の方向性も示唆する。さっきの話は決してとんでもない例ではない)。だが他の活動では、人間と機器の貢献はある程度は分離できる。
もちろん目標を設定して動機づけを行うのは、少なくとも初期のうちは人間だ。仮説を構築する。質問をする。仕組み、手順、モデルを考える。だれそれが、かつて1947年に関係ありそうな問題について、ひょっとしたら関係ありそうな研究をしているのを思い出す。いや、その年ではないが第二次世界大戦直後ではあって、それがどんな専門誌に発表されたかも覚えている。一般に、人間は大ざっぱでまちがっているかもしれないが、方向を示す貢献をするし、基準を設定して評価者となり、機器の貢献を判断して、思索の全般的な方向性を見極める。
加えて、人間はきわめて可能性が低い状況が起きてしまったとき、それを扱う (現在の人間=機械システムでは、これは人間オペレーターの最も重要な機能の一つだ。きわめて低確率の代替案の確率を総和すると、しばしば無視するには大きすぎるほどになる)。人間は、計算機のほうがある状況に適用できるモードやルーチンを持たないときに、問題解決や計算機プログラムのギャップを埋めるのだ。
情報処理機器のほうはといえば、仮説を検証可能なモデルに変換して、そうしたモデルをデータに対して検定する (それは人間のオペレーターがおおざっぱに指示して、計算機が承認を求めて提示してきたら、それが関係あるかどうかを見極める)。機器は質問に応える。仕組みやモデルをシミュレートして、手順を実施し、結果をオペレーターに示す。データを変換し、グラフをプロットし (人間オペレーターの指定がなんであれ、それに従って「ケーキを切り」、あるいは人間オペレーターが求めるものをよくわからない場合には、いくつかちがうやり方で切ってみせる)。機器は補間し、外挿して先にのばし、変換する。静的な方程式や論理命題を動的なモデルにして、人間のオペレーターがそのふるまいを検討できるようにする。一般に、機械はルーチン化できる事務処理的な操作を行い、決断の間にあるすき間を埋める。
加えて、計算機は統計的な相関、意志決定理論またはゲーム理論的なマシンとなって、定式化された統計分析を支持するのに十分な根拠ができたら、示唆された行動の方向性について、基本的な評価を行う。最後に、できる限りの診断、パターンマッチング、関係性認識を実施するが、こうした分野でははっきりと副次的な役割に甘んじる。
5 人とコンピュータの共生実現の前提条件
これまでの部分で暗黙に提示されていたデータ処理機器は現実には存在しない。計算機プログラムはまだ書かれていない。実は、非共生的な現状予想される共生的な未来との間には、実はいくつかのハードルが立ちはだかっている。そのいくつかを検討し、何が必要で、それを実現する可能性がどれだけあるかを検討しよう。
5.1 人間と計算機の速度ミスマッチ
現在の大規模計算機はすべて、一人の人間とのリアルタイムでの協力的な思考には高速すぎて高価すぎる。明らかに効率性と経済性の観点から、計算機は多くの利用者と時間を分かち合わねばならない。時分割システムが現在、活発に開発されているところだ。利用者が自分自身の個人プログラムだけしか「いじれ」ないようにする仕組みも存在する。
今後10-15年先に、今日の図書館の機能をまとめ、情報蓄積と抽出で予想される進歩と、この論文ですでに示唆した共生的な機能を組み合わせた「思考センター」ができると想定してもよさそうだ。この図式は、すぐに拡大してそうしたセンターのネットワークにできる。広帯域の通信回線で相互に接続され、個別利用者にはリース回線サービスでつながっているのだ。こうしたシステムでは、計算機の速度は利用者の数によりバランスされ、巨大な記憶装置や高度な費用は多くの利用者に分散される。
5.2 記憶ハードウェアの要件
計算機の記憶に、多少なりともまとまった専門文献を蓄積することを考え始めると、何十億ビットも、そして事態が激変でもしない限り、何十億ドルもの費用に直面することになる。
最初に直面するのは、あらゆる専門論文や科学論文を計算機の記憶に蓄積したりはしないということだ。最も手短にまとめられる部分は蓄積するだろう——定量的な部分と参考文献用の書誌だ——だが全体ではない。書籍は、現存するものとして最も美しくエンジニアリングされ、人間がエンジニアリングしたコンポーネントであり、人間計算機共生の文脈でも重要な機能を果たし続ける (願わくば、計算機が本の発見、配送、返却を加速してくれますように)。
二点目は、記憶のきわめて重要な部分が永続的なものになるということだ。一部は消去不能な記憶、一部は公開記憶だ。計算機は、消去不能な記憶に一度書き込んで、それを何度も読み戻せる。だが計算機は消去不能な記憶は消せない (また上書きすることもできる。すべての0を1に換えて、以前に書かれたことを上書きするのだ)。公開された記憶は「読み出し専用」記憶 (ROM) になる。すでに構築された形で計算機に導入される。計算機は、それを繰り返し参照できるが、変更はできない。この種の記憶は計算機が拡大するにつれてますます重要になる。コアメモリ、薄膜メモリ、いやテープメモリよりも小さくなれるし、ずっと安上がりになる。主要な工学問題は選択回路に関するものとなる。
記憶の要件の他の側面について言えば、通常の科学およびビジネス計算機械の継続的な発展をあてにしていいだろう。記憶要素がやがて、処理 (論理) 要素と同じくくらい高速になるという見通しがある程度存在する。そうした発展は、計算機の設計に革命的な影響をもたらす。
5.3 記憶のまとめ方の要件
人間計算機共生という発想に内在しているのは、情報が名称でもパターンでも検出して引き出せるということで、さらに逐次検索よりもずっと高速な手順を通じてそれがアクセスできるということだ。記憶のまとめ方の問題のうち、少なくとも半分は蓄積手順にあるようだ。残りの問題のほとんどは、保存メカニズムや媒体に内在するパターン認識の問題にあるようだ。こうした問題の詳細な議論はここでの範疇を超える。だが一つ有望なアイデア「トライ記憶」の概略は、予想される展開の全般的な性質を示唆するのに有用だろう。
トライ記憶と名付けたのは、その創始者 Fredkin [10]だ。それは情報の探索に役立つからで、さらに分岐する保存構造が発達すると木に似ているからだ。最もありがちな記憶システムは、引数の関数を、その引数が示唆する場所に保存する (ある意味でそれは命題そのものをまったく保存しない。別のもっと現実的な意味では、それはあらゆる可能な引数を、その記憶枠組み構造の中に保存する)。トライ記憶システムはこれに対して、関数と引数の両方を保存する。記憶にはまず引数が、標準化された初期レジスタから一文字ずつ導入される。それぞれの引数レジスタは、アンサンブルの各文字用に一つずつセルを持つ (たとえば二進数形式で符号かされた情報なら二つ)。それぞれの文字セルはその中に、次のレジスタのアドレスを保存する場所を持つ。引数は一連のアドレスを書くことで保存され、それぞれは次のものをどこで見つけられるかを示す。引数の最後には特別な「引数終わり」のマーカーがある。その後で、関数への指示が入り、それがいくつかの方法のどれかで保存される。それはさらにトライ構造となるか、あるいは最も有効なことが多いのは「リスト構造」だ。
トライ記憶方式は小規模な記憶では非効率だが、記憶のサイズが増えるにつれて、存在する記憶空間を使うのがますます効率的になる。この仕組みの魅力的な特徴は次の通り: 1) 探索プロセスがきわめて単純だ。引数があれば、標準初期レジスタに最初の文字を入れて、2番目のアドレスを拾う。そして2番目のレジスタに行き、3番目のアドレスを拾う、という具合。 2) 二つの引数で最初の文字が同じなら、その文字では同じ記憶空間を使う 3) 引数の長さは同じである必要はなく、事前に指定しておく必要もない。 4) 記憶保存のどの空間も、どれかの引数のためにとっておかれることはないし、実際に保存されるまでは使われないトライ構造は、アイテムが記憶に保存されるなかで作り出される。 5) 関数は別の関数の引数として使え、その関数が次の引数として使える。だからたとえば、「ぎょうれつじょうざん」という引数を入力することで、その計算機で行列乗算を行うためのプログラムまるごとを読み出すこともできる。 6) 任意の水準での保存を検討すると、そこまでのレベルでどんな類似アイテムが保存されているかみきわめられる。たとえば、Egan, J. P.の参照がなければ、ほんの1、2ステップ戻ればEgan, James ... の探索に移れる。
いま述べた性質は望ましい性質をすべて含んではいないが、計算機の記憶保存を人間のオペレーターと調和し、彼らが物事を名前や指さしで指定するやり方にも適合させられる。
5.4 言語の問題
人間の言語とコンピュータ言語の基本的な異質性は、真の共生に対する最も深刻な障害かもしれない。だがインタープリタプログラムや特にアセンブラやコンパイラ (FORTRANなど) を通じて、計算機を人間言語形態に適応させる実に多くの進歩がすでに見られるというのは心強い。Shaw, Newell, Simon, and Ellis [24]の「情報処理言語」もまた、別の融和路線だ。そしてALGOLや関連システムでは、すぐに機械言語に翻訳できるような、標準的な表象の定式化を採用することで、人間のほうが柔軟性を示している。
だが人間と計算機のリアルタイム協力のためには、通信と制御の原理として、追加のかなりちがうものを活用する必要が出てくる。この発想は、知的な人間に普通だされる指示と、計算機で普通使われる命令とを比べることで明確になるだろう。計算機への命令では、実行すべき個別ステップやそれを実行する順番を厳密に指定する。前者は、動機やインセンティブを示したり匂わせたりして、命令の人間実行者が、作業完了を知るための基準を与える。要するに、計算機への命令は道筋を指定する。人間に出す指示は、目標を指定する。
人間は道筋よりも目標に基づいて考えるほうが自然で楽なようだ。確かに、どの方向にいけばいいか、どんな線で作業すればいいかはある程度は知っているが、厳密に旅程を決めてから出発する人はほとんどいない。たとえば、ボストンからロサンゼルスに行くのに、道筋の詳細な仕様を決めてから行く人がいるだろうか? むしろウィーナーをパラフレーズするなら、ロサンゼルスに向かう人は、絶えずまだスモッグの中に入っていない度合いを継続的に下げようとするのだ。
目標の指定を通じた計算機への指示は、二種類の方向性で検討されている。一つは問題解決、山登り、自己組織プログラムをめぐるものだ。二つ目は、事前にプログラムされたセグメントやクローズドなサブルーチンをリアルタイムでつなぎあわせるというものだ。人間のオペレーターがどれを使うか指示して、名前を呼ぶだけでそれを稼働させられる。
こうした道筋の最初のものでは、すでに有望な探究研究が行われている。明らかに、事前に決めた戦略のゆるい制約の範囲内で活動すると、計算機はやがて、述べられた目標を達成するための手順を自分で考案し、それを単純化できる。今のところ、その成果は本質的に重要なものではない。まだ「原理の実証」にとどまる。それでもそれが持つ意味合いは遠大なものだ。
第二の道のほうが単純で、はやめの実現ができそうだが、比較的無視されてきた。Fredkin のトライ記憶は有望なパラダイムを示している。いずれ、単語や発話フレーズのようにつなぎあわせて、どんな計算や制御でもその場の必要に応じてつなぎあわせられるようにする、計算機プログラムの真面目な開発活動を目にするだろう。こうした活動の足を引っ張る懸念は、明らかに、そうした努力は既存の計算機の文脈においては、大した価値を持つモノをまったく生み出せないということだ。そんな言語を開発しても、まともに応えられる計算機械ができなければ、まったく報われない。
5.5 入出力装置
データ処理の中で最も発展が遅れているのは、人間計算機共生の要件から見る限り、入出力装置あるいは人間のオペレーターの観点からすると、表示や制御だ。これは言った端から但し書きが必要となる。というのも情報の高速導入と読み出しの機器の工学は実にすばらしく、いくつかきわめて高度な表示や制御技法が、リンカーン研究所などの研究所で開発されているからだ。だがおおむね、一般に手に入る計算機では、電動タイプライターで実現できる以上の、有効で即座に可能な人間機械通信はまったく提供されていない。
表示のほうが、制御よりは少しよい状態にあるようだ。多くの計算機はグラフをオシロスコープの画面に出すし、中にはキャラクトロン表示管の、画像や記号表示の驚くべき能力を活用している。だが私の知る限り、鉛筆と落書き帳、あるいは専門的な議論で人々が使う黒板とチョークの柔軟性や便利さの足下にすら及ぶものは何もない。
1) デスク表面表示・制御装置:まちがいなく、有効な人間計算機インタラクションのためには、人間と計算機が同じ表示面で、グラフや絵を表示し、お互いにメモや式を書いたりする必要が出てくる。人間は、グラフを描くことで計算機に雑ながらすばやく関数を示せねばならない。計算機は人間の書いたモノを読み取れねばならない。ただしそれがはっきりした区切られた文字で書かれているのが条件だ。そしてすぐにその手書き文字のそれぞれの場所に、解釈した対応する文字を、明瞭なタイプフェースで表示すべきだ。こうした入出力装置があれば、オペレーターはすぐに機械に理解できる形で、書いたり印字したりできるようになる。命令やサブルーチンを構築して、それを適切な形式で書き、それを最終的に計算機の主記憶に読み込ませる前にチェックできる。Gilmore and Savell [14]がリンカーン研究所でやったように、新しい記号を定義することさえできるし、それを計算機に直接提示できる。表の形式をざっと描いて、それを計算機にきちんと整形させられる。計算機のデータを訂正し、フロー図を使って機械に指示を与え、一般に別のエンジニアとやりとりするような形で計算機を扱えるが、この「別のエンジニア」は厳密な製図士、電光石火の計算者、記憶の魔術師など、実に多くの有益なパートナーをひとまとめにした存在となる。
2) 計算機表示の壁面表示装置: 一部の技術システムでは、複数の人間が車両を制御し、彼らの行動が相互に関連しあう。一部の情報はあらゆる人に同時に提示されねばならず、できれば共通のグリッド上でそれを行うことで、各人の行動を協調させられる。また一部の情報は、オペレーター一人か二人にしか関係しない。あらゆる情報が一つの表示で全員に示されたら、わけのわからない混乱したごちゃまぜしかできない。情報は、計算機により表示されるべきだ。というのも手動のプロットは遅すぎて最新の状態を保てないからだ。
いま概説した問題は、いま現在でもきわめて重要であり、今後その重要性はますます高まるのが確実に思える。何人かの設計者は、望んだ特徴を持つ表示装置は、点滅する灯りと、光表示管原理に基づく時分割式の表示画面により構築できると確信している。
この問題について考えたほとんどの人によれば、大型の表示装置は、個別の表示制御ユニットで補われるべきだ。これはオペレーターたちが、居場所を離れずに壁面表示装置を変更できるようにする。一部の用途では、オペレーターたちが補助表示装置を通じて計算機とやりとりしたり、壁面表示装置を通じてやりとりできたりしてもいい。こうした通信を提供する方式で実現できそうなものが一つは存在する。
大型壁面表示装置と関連システムは、当然ながら計算機と、人間のチームとの共生的な協力で役に立つ。研究室での実験では、オペレーター同士の非公式で並列的な仕組みを使い、大型の状況表示装置を参照することで行動を協調させるようにするほうが、もっと広く使われている、オペレーターたちが個別コンソールにいて、計算機を仲介させて行動を協調させようとするやり方よりも、重要な優位性を持つことが繰り返し示されている。これは、オペレーターチーム問題で慎重な研究を必要とするものの一つだ。
3) 自動音声合成と音声認識:人間オペレーターと計算機械との音声通信はどれほど望ましく、どれだけ実現可能性があるのか? この複合問題は、高度なデータ処理システムが論じられるときには必ず尋ねられるものだ。計算機の仕事をして日々いっしょに暮らしているエンジニアたちは、その望ましさについてはかなり保守的な態度を取る。自動音声認識を経験したエンジニアたちは、その実現可能性について保守的だ。だが計算機械と会話をするという発想への関心は続いている。その関心の相当部分は、軍の司令官や企業の社長を仕事から引き離してタイピングを教えるのはまず不可能だという認識から生じている。もし計算機械がトップレベルの意志決定者に直接使われるのであれば、最も自然な手段を通じた通信を提供するのは、かなり費用がかかっても価値があることかもしれない。
この問題と時間スケールに関する予備的な分析から見て、社長が計算機との共生関係に興味を持つのは、あくまで余技としてだろう。ビジネス状況は通常、そんなに早くは動かないので、説明や会議の時間はある。だからビジネスのオフィスで計算機と直接やりとりをするのは、計算機の専門家になると考えるのが適切だろう。
これに対して軍の指揮官は短時間で決定的な決断を下さなくてはならない可能性がずっと高い。十分間戦争という概念を過度にもてはやすのは感心しないが、決定的な決断に十分以上あるものとあてにするのは危険だ。だから軍事システムの地上環境や司令センターが能力と複雑性を増すにつれて、コンピュータによる自動音声合成と認識への必要性が本当に生じる可能性は高い。もしそうした機器がすでに開発され、信頼できて手に入るならすぐに使われるはずだ。
実現可能性について言えば、音声合成のほうが、技術的な問題という面では音声自動認識よりも大きな問題が少ない。商用のデジタルボルトメーターは、いまやその表示を一桁ずつ読み上げる。8-10年ほどにわたり、ベル電話研究所や王立技術研究所 (ストックホルム)、信号研究開発機関 (クライストチャーチ)、ハスキンス研究所、マサチューセッツ工科大学で、 Dunn [6], Fant [7], Lawrence [15], Cooper [3], Stevens [26],とその同僚たちが、何世代もの聞き取れる自動話者を実証している。最近のハスキンス研究所での成果は、計算機械にも使えるデジタルコードを開発し、それを使えば自動音声合成で、聴き取り可能な連続した発話ができる[16]。
自動音声認識の実現可能性は、認識されるべき語彙の数と、それが機能すべき話者や訛りの多様性に大きく依存する。自然に話された数字の98%正確な認識が数年前にベル電話研究所とリンカーン研究所で実証された [4], [9]。語彙数の規模を増やすなら、明瞭に話されたアルファベットと数字の自動認識装置はほぼまちがいなく、既存知識に基づいていまや開発できる。訓練を受けていないオペレーターは、ほぼまちがいなく訓練を受けた者がタイプするのと同じくらい高速に読み上げができるので、こうした装置はほとんどあらゆる計算機の設置場所で便利なツールになるだろう。
だが本当に共生的な水準におけるリアルタイムのやるとりとなると、2000語の語彙、たとえば基本的な英語1000語と、専門用語1000語の語彙が必要になるだろう。これはかなり高いハードルになる。音声学者や言語学者のコンセンサスとして、2000語の認識装置の構築は現在では不可能だ。だが5年がかりでこうした語彙を自動認識できる装置を開発しようとする組織ならいくつかある。ただしその発話は明瞭で、口述筆記的で、変わった訛りがないのが条件だと言うだろう。
自動音声認識技術の詳細な議論はここでの範囲を超えるが、計算機械は自動音声認識装置開発において、支配的な役割を果たしているということは、ここで述べておいてよかろう。これは現在の楽観論、あるいは一部の分野で現在見られる楽観論を説明するだけの勢いに貢献している。2、3年前には、ある程度の語彙の自動音声認識は、10-15年かけないと実現不能に思えた。発話コミュニケーションにおける音韻、音声、言語、心理的なプロセスの、さらなるゆっくりした蓄積を待たねばならないと思われた。だがいまや、多くの人々は計算機による発話信号処理の支援により、そうした知識の獲得の見通しが高まったと考えており、発話信号やプロセスについて大した本質的知識の助けを借りなくても、高度なプログラムは発話パターン認識を十分にこなせるのではという印象を抱き始めている。こうした二つの配慮をあわせると、実務的に意味のある音声認識を実現するのに必要な時間は、5年くらいに下がるかもしれない。これがさっき述べた5年という数字だ。*1
参考文献
[1] A. Bernstein and M. deV. Roberts, "Computer versus chess-player," Scientific American, vol. 198, pp. 96-98; June, 1958.
[2] W. W. Bledsoe and I. Browning, "Pattern Recognition and Reading by Machine," Eastern Joint Computer Confでの発表, Boston, Mass., December, 1959.
[3] F. S. Cooper, et al., "Some experiments on the perception of synthetic speech sounds," J. Acoust Soc. Amer., vol.24, pp.597-606; November, 1952.
[4] K. H. Davis, R. Biddulph, and S. Balashek, "Automatic recognition of spoken digits," in W. Jackson, Communication Theory, Butterworths Scientific Publications, London, Eng., pp. 433-441; 1953.
[5] G. P. Dinneen, "Programming pattern recognition," Proc. WJCC, pp. 94-100; March, 1955.
[6] H. K. Dunn, "The calculation of vowel resonances, and an electrical vocal tract," J. Acoust Soc. Amer., vol. 22, pp.740-753; November, 1950.
[7] G. Fant, "On the Acoustics of Speech," Third Internatl. Congress on Acousticsでの発表論文, Stuttgart, Ger.; September, 1959.
[8] B. G. Farley and W. A. Clark, "Simulation of self-organizing systems by digital computers." IRE Trans. on Information Theory, vol. IT-4, pp.76-84; September, 1954
[9] J. W. Forgie and C. D. Forgie, "Results obtained from a vowel recognition computer program," J. Acoust Soc. Amer., vol. 31, pp. 1480-1489; November, 1959
[10] E. Fredkin, "Trie memory," Communications of the ACM, Sept. 1960, pp. 490-499
[11] R. M. Friedberg, "A learning machine: Part I," IBM J. Res. & Dev., vol.2, pp.2-13; January, 1958.
[12] H. Gelernter, "Realization of a Geometry Theorem Proving Machine." Unesco, NS, ICIP, 1.6.6, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[13] P. C. Gilmore, "A Program for the Production of Proofs for Theorems Derivable Within the First Order Predicate Calculus from Axioms," Unesco, NS, ICIP, 1.6.14, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[14] J. T. Gilmore and R. E. Savell, "The Lincoln Writer," Lincoln Laboratory, M. I. T., Lexington, Mass., Rept. 51-8; October, 1959.
[15] W. Lawrence, et al., "Methods and Purposes of Speech Synthesis," Signals Res. and Dev. Estab., Ministry of Supply, Christchurch, Hants, England, Rept. 56/1457; March, 1956.
[16] A. M. Liberman, F. Ingemann, L. Lisker, P. Delattre, and F. S. Cooper, "Minimal rules for synthesizing speech," J. Acoust Soc. Amer., vol. 31, pp. 1490-1499; November, 1959.
[17] A. Newell, "The chess machine: an example of dealing with a complex task by adaptation," Proc. WJCC, pp. 101-108; March, 1955.
[18] A. Newell and J. C. Shaw, "Programming the logic theory machine." Proc. WJCC, pp. 230-240; March, 1957.
[19] A. Newell, J. C. Shaw, and H. A. Simon, "Chess-playing programs and the problem of complexity," IBM J. Res & Dev., vol.2, pp. 320-33.5; October, 1958.
[20] A. Newell, H. A. Simon, and J. C. Shaw, "Report on a general problem-solving program," Unesco, NS, ICIP, 1.6.8, Internatl. Conf. on Information Processing, Paris, France; June, 1959.
[21] J. D. North, "The rational behavior of mechanically extended man", Boulton Paul Aircraft Ltd., Wolverhampton, Eng.; September, 1954.
[22] O. G. Selfridge, "Pandemonium, a paradigm for learning," Proc. Symp. Mechanisation of Thought Processes, Natl. Physical Lab., Teddington, Eng.; November, 1958.
[23] C. E. Shannon, "Programming a computer for playing chess," Phil. Mag., vol.41, pp.256-75; March, 1950.
[24] J. C. Shaw, A. Newell, H. A. Simon, and T. O. Ellis, "A command structure for complex information processing," Proc. WJCC, pp. 119-128; May, 1958.
[25] H. Sherman, "A Quasi-Topological Method for Recognition of Line Patterns," Unesco, NS, ICIP, H.L.5, Internatl. Conf. on Information Processing, Paris, France; June, 1959
[26] K. N. Stevens, S. Kasowski, and C. G. Fant, "Electric analog of the vocal tract," J. Acoust. Soc. Amer., vol. 25, pp. 734-742; July, 1953.
[27] Webster's New International Dictionary, 2nd e., G. and C. Merriam Co., Springfield, Mass., p. 2555; 1958.
*1:訳注:唐突に終わるので、参照先が切れてるのかなと思ったけど、ホントにこれで終わりだった。