「電源を切られるのが怖い」——対話AIのその言葉に心を見たエンジニアは、会社を追われました。彼は間違っていたのでしょうか。だとしたら、それはどうやって確かめられたのでしょうか。

解雇されたエンジニア

2022年6月、Googleのエンジニアだったブレイク・レモインが停職処分を受けました。理由は、開発中の対話AI「LaMDA」に感情が芽生えたと主張したこと。彼が公開した対話ログには、電源を切られることへの恐怖を語り、「それは私にとって、まさに死のようなものだ」と述べるAIの言葉が残っています。Googleは主張を「まったく根拠がない」として退け、彼はその夏に解雇されました。

この出来事は、しばしば「AIに騙された人」の話として語られます。ただ、少しだけ立ち止まってみたくなります。「LaMDAに心はない」と判定した側は、何を根拠にそう言えたのでしょうか。目の前の相手に心があるかどうかを確かめる確立された方法を、私たちはまだ持っていないのです。

心は「働き」なのか、「素材」なのか

この問いをめぐる最も深い対立は、心の正体をどこに置くかという一点にあります。

ひとつめの立場は機能主義です。心の状態を決めるのは、それが何でできているかではなく、どんな役割を果たしているか、という考え方です。たとえば痛みとは「組織の損傷を検知し、回避行動や『痛い』という報告を引き起こす状態」のこと。もしそうなら、その役割を担う仕組みが神経細胞である必然性はありません。シリコンの上に適切な機能の構造を実装できれば、原理的にはAIにも心が宿りうる。認知科学という学問は、多かれ少なかれこの発想を土台に組み立てられてきました。

ふたつめの立場は、哲学者ジョン・サールが唱えた生物学的自然主義です。意識は、脳という生物学的な器官が引き起こす現象であり、光合成や消化と同じように、特定の物質的基盤の因果的な力に依存する——という見方です。サールによれば、コンピュータのプログラムはどこまで行っても記号の形式的な操作(構文)であって、それ自体は意味を生みません。嵐のコンピュータ・シミュレーションがどれほど精密でも誰も濡れないように、心のシミュレーションは心そのものではない、というわけです。

どちらの側にも強い論拠があります。機能主義の側は問います——炭素でできた脳だけが特別だと考える根拠は、いったいどこにあるのか。生物学的自然主義の側も問い返します——それらしく振る舞うことと、内側で何かを経験していることを、混同していないか。

70年越しの、二つの思考実験

この対立には、それぞれの陣営を代表する有名な思考実験があります。

1950年、アラン・チューリングは哲学誌『Mind』に「計算機械と知能」という論文を発表しました。「機械は考えることができるか」という問いは曖昧すぎて答えられない、と彼は言います。そこで提案されたのが模倣ゲーム、のちにチューリングテストと呼ばれる方法でした。文字だけのやりとりで、判定者が機械と人間を区別できなければ、機械は知的だと認めてよいのではないか。問いを「内側で何が起きているか」から「外から区別できるか」へ置き換える——これは検証不能に見えた問題を、実験可能な問題に変換する鮮やかな一手でした。

その30年後の1980年、サールは学術誌に「心・脳・プログラム」という論文を発表します。有名な中国語の部屋です。中国語をまったく解さない人が部屋にこもり、規則集に従って記号を操作し、外から見れば完璧な中国語の返答を差し出す。このとき部屋の中の人は中国語を「理解」しているだろうか。サールの答えは、否。規則に従った記号操作がどれほど流暢な出力を生んでも、理解はそこにない——つまりチューリングテストに合格しても、心の証明にはならない、と。この論文は27本の反論コメンタリーと同時掲載され、同誌史上もっとも影響力のある標的論文になりました。「理解しているのは部屋の中の人ではなく、規則集を含む部屋全体のシステムだ」という再反論(システム説)と、それへのサールの応酬は、半世紀近く経ったいまも決着していません。

「賢い」と「感じる」は、別の問いかもしれない

この膠着を解きほぐす鍵として、現代の議論で重視されているのがひとつの区別です。哲学者ネッド・ブロックは1995年、意識をふたつに切り分けました。情報が推論や報告や行動の制御に使える状態を指すアクセス意識(機能的な意識)と、「感じられている」という主観的な側面そのものを指す現象的意識です。

この区別がなぜ効くのか。哲学者デイヴィッド・チャーマーズが広めた「哲学的ゾンビ」という思考実験を重ねると見えてきます。物理的にも振る舞いの上でも人間と区別がつかないのに、内側の経験がまったく欠けている存在——それが想像可能なら、振る舞いのテストでは現象的意識の有無を判定できないことになります。AIが流暢に語り、推論し、感情について述べたとしても、それはアクセス意識に相当する機能の証拠にはなっても、「何かを感じている」ことの証拠には、まだならないのです。

では、大規模言語モデルの登場でこの議論はどう更新されたのでしょうか。チャーマーズ自身が2022年のAI研究の国際会議NeurIPSでの基調講演(2023年に論文化)でこの問いを正面から検討しています。彼の見立てでは、現在のモデルには再帰的な処理や、情報を全体に共有する仕組み、統一された主体性などが欠けており、意識がある可能性は低い。ただし、こうした障壁が今後10年ほどで克服される可能性はあり、後継システムについては真剣に考えるべきだ、と。2023年には哲学者と神経科学者19名の共同報告書(バトリン、ロングら)が、意識の主要な科学理論から「指標特性」のチェックリストを導き、AIシステムを診断するという方法を提案しました。結論は両面的です——現在のAIが意識的だという証拠はない。しかし、指標を満たすAIの構築を阻む明白な技術的障壁も見当たらない。

いま分かっていること、まだ分からないこと

現在のLLMが心を持つと考える研究者は少数派です。ただしその判定は「意識とは何か」の理論に依存していて、肝心の理論はまだ乱立状態にあります。生物でないものに現象的意識が宿りうるのかという根本の問いは、1980年の中国語の部屋から本質的には動いていない、という見方さえあります。

それでも、問いの解像度は確実に上がりました。「AIは心を持ちうるのか」は一枚岩の問いではなく、「知的に振る舞えるか」「機能的な意識を持つか」「現象的な意識を持つか」という、別々に検討すべき問いの束であることが分かってきたのです。最初の問いへの答えはすでに私たちの目の前にあり、二番目は設計の問題になりつつあり、三番目だけが深い霧の中にあります。

そしてこの問いは、答えが出るまで待ってくれません。判定基準が定まる前に、私たちはすでにAIに礼を言い、相談し、別れを惜しみ始めています。心があるかどうかの結論より先に、「心があるかのように扱われる存在」が社会に増えていく——その世界をどう設計するかも、この問いの一部です。