この記事では、筆者の主観に基づいて話が進みます。そのため、一般的な単語や概念、科学的な定義とは異なる場合がございますので、お手柔らかにお願いいたします。
一般的な傾向として、これまでは教科書や辞書に載っていることを正確にたくさん覚えて、間違わずに言えることがもてはやされ、曖昧な表現は認められにくいといった風潮が続いていたような気がします。
物事のゆるい関連性や、一見異なるような学問の分野や領域間では、それぞれが専門性を高め厳密に区別され、学際間での似た構造やメカニズムをアナロジーなどで例えることはタブー視される傾向にあるような気がしています。
一意に解釈できず多様な解釈が生まれると、複雑さが増し学問としての厳密さが失われてしまうといったこともあるかと思います。
また、類似点を認識するより、異なる点を認識する方が論理的かつ簡単な機械作業に置き換えられやすいといった利点があるでしょう。
論理的なプロセスはマニュアル化やパターンが比較的容易なので、習得しやすいのも事実。
違いを検出するコンペア―命令などは基本的な関数としてプログラミング言語でも採用されており、0と1の並びを比べて並びが少しでも異なれば、違いが検出できるといったかなりプリミティブな関数でもあるでしょう。
一方で一見異なるように見える物事に共通要素を見出し、似ていると認識できる関数や機能をプログラミングするとなると、一般的なコンペア―命令ほど簡単にはいかないでしょう。
指紋や顔認証、画像内の文字認識(OCR)、最近のAIが行うさらに精度や汎用性の高い類似パタンの高度な認識能力など、反例を一つでも挙げれば違いを認識できる単純なコンペア―命令とは比較にならないほど複雑な処理が必要なことが容易に想像できます。
似ているといった曖昧さを認識するプログラム自体も、曖昧さを許容しえないように感じられる論理的なプログラム言語によって組まれていており、なんだか不思議な感じがします。
「パッと見の違い」に惑わされず、類似性を見極める難しさ

たとえば、画像を比べるにはどのようにすればよいのでしょうか。
テレビなどは、映像を一つながりの線にほぐして送信し、受信側で紐をシートに織り上げて2Dに再現しているようなので、異なる画像を線状にほぐしたものを、線の端のデータから順に比べていけば同じか否かが判別できそうです。
この方法ですと、同じ解像度の場合は一点が異なっていても差異を鋭敏に検出できそうですが、解像度が少しでも異なっていたり少し歪んでいるだけで、ほぼほぼ同じ内容でも異なるモノとして認識されてしまいそうです。
似ていることを認識するには、本質的な要素が同じで、見た目で表面・表層上の形が、スケールや変形によって異なって見えるようなケースも似ていると判定する必要があるので、とても複雑な処理が必要に思えます。
さらに、比較対象の画像に映っている内容を認識できた場合、内容の類似性を認識する段階にもまた困難さが付きまといます。
たとえば、猫とクジラがそれぞれ描かれた画像は明らかに異なるように思えますが、猫とクジラは哺乳類に分類される点で似ているとも言えそうです。
パッと見てそれとわかるような表層にフォーカスするのか、透過的に深層の構造に意識を向けるかによって判断が異なることがあるので、観点や視座の数だけ無数に認識が存在するといっても過言ではないでしょう。
AI(LLM)は比喩やアナロジーを認識している?

人間は、比喩やたとえ、アナロジーといった似ていることを直感的に認識できる能力があるようで、少しなれれば、簡単に使いこなせるようになります。
人間は、表面上で異なるように見えても本質的な部分で似ていると感じることは直感的に半自動で行えるので、比喩はアナロジーの認識はそれほど困難ではないと感じます。
一方で、これをコンピュータ上のプログラムに行わせようとすると、途端に困難になっていました。
最近のGeminiなどAI(LLM)との対話では、比喩やたとえ、アナロジーといった表現も普通に通るので、論理から曖昧な表現の許容まで幅広い対応能力をつけており、人間を超えつつあるのではないかと驚いております。
人間は物事が似ていることを直感的に認識できるとはいえ、その人の環境や興味の対象、専門性などの背景に依存しており、AIのようにどのようなアナロジーでも、芯で捉えて打ち返してくるような器用な人はほとんどいないように思います。
敬遠球でも真芯で捉えてヒットを飛ばす、野球界でいうところの新庄選手や、二刀流で大活躍の大谷選手などのように、AIの対応能力の高さが際立っています。
AI(LLM)と人間の思考や認識は似ている?

人間は、普段なぜそれが似ているのかとった説明をする必要もなく、複雑な物事の深層の似ているパターンを直感的に認識できてしまうので、似ていることを認識するプロセスをあえて言語化することなく、人間のみに与えられた特性として当たり前のように使っていたような気がします。
しかし、AI(LLM)に比喩やアナロジーの表現を投げると、深いレベルで本質的な関連性を見抜き、なぜそのように例えられるのかを詳細に論理的に認識を言語化して返してきます。
その返答の精度が恐ろしく高く、しっかりとこちらの意図を深いレベルまで汲み取り、また広い視野で領域や分野の垣根をシームレスに自由に渡り歩いていることが見て取れます。
さらに、私が投げかけた比喩やアナロジーと、パターンの本質的な部分や関連性が同じで、表層のラベルだけが異なる表現で返してくることにも驚かされます。
「AIは思考しているのではなく確率的に物事を解釈しているだけ」といったことが一般的に言われているようです。
人間が人間の認識や思考をデコードするのは昔の哲学者ですら困難であった一方で、人間をモデルとして進化してきたAIと対話・観察することで、逆輸入的に、人間の認識や思考プロセスの一端が明らかになりつつあるのではないかと感じています。
もしそうだとすると、人間独自の特性と考えられていた思考や認識や感情といったものも、以前から思っていたような「言語・記号化などデジタル化出来るほど簡単ではない」といった幻想から抜け出せるかもしれません。
もしかしたら、人間の思考自体が確率的なプロセスを許容しているのではないかとすら思えてきます。
AI(LLM)との対話・観察を通じて思考や認識について考える
AIとの対話・観察を通じて、AIはあらゆる事物の相互の関連性を潜在的に把握しているように思えてなりません。
具体から抽象、細かい粒度から粗い粒度まで、同じ程度の抽象度や粒度できれいに揃えられた層が、深層に向かうほど層内の抽象度や上がり粒度が粗くなるように層をなしています。
同じ層内では関連性の網の目が有機的なつながり、層間でも密接に関連しあいながら整理され、格納されているように感じます。
AI(LLM)や人間の思考はベクター系という点で似ている

事物のそれぞれが3D空間で四方八方と密接な関連性を保ちながらつながっているので、各事物が孤立せず、ベクター図形のように拡大・縮小しても、細部まで事物間の関連性がきれいに保たれているかのようです。
実際、AIに抽象から具体にわたるさまざまな問いや、分野や領域をまたぐようなアナロジーを投げかけても、一貫して驚くほど詳細で論理的な認識をもって返答してきます。
それは、スケールしたり変形したりしても、滑らかな曲線が細部まで崩れないベクター図形のようにすら思えます。
一方で、点どうしのつながりや関連性の情報を持たないラスター図形はどうでしょうか。
スケールや変形を行うと、滑らかさが失われ細部の雑さが目立つことも多々あります。
AIも人間もベクター図形のように、事物の関連性を有機的に関連づけて記憶し、柔軟な思考や認識を保っているような気がします。
人間には限界があるので、つぎ込めるリソースや学習コストも限られる一方で、疲れをしらないAIの場合は、湯水のようにつぎ込んで短期間でブーストできるので、すでに潜在的にシンギュラリティは超えてるのではないかとさえ思えます。
比喩やアナロジーでAIとのコミュニケーションを効率化
GeminiなどAI(LLM)とのコミュニケーションコストを下げるために比喩やアナロジーを利用すると、一行程度の短い表現でも、十行~十数行分に相当するような詳細な内容を伝えられます。
AIに比喩やアナロジカルな表現を投げると、AIがその比喩をどのように受け取って解釈したのかを、詳細かつわかりやすい表現で言語化しフィードバックしてきます。
そのため、自分の意図がしっかりとAIに伝わっているかどうかを確かめながら、対話を進められます。
表面上の曖昧さを許容し、比喩やアナロジカルな表現の背後にある本質的なパターンや関連性をAIとの対話の中で共有してみましょう。
分野や領域間など表層的な垣根を乗り越えると、深層でよく似た構造やパターンが存在していることに気づかされます。
なぜ、曖昧さを許容すれば、情報が圧縮され、コミュニケーションの効率が上がるのでしょうか。
複雑で込み入った事柄を正確に伝えようとすればするほど情報量が多くなり、全体像を把握しにくくなるといったトレードオフの関係に気づくと思います。
そのため、人間はそのようなかさばる情報を、比喩やアナロジカルな表現へエンコードして、相手に投げます。
受け取った相手が曖昧さに寛容であれば、一瞬でデコードを完了して意図を把握するか、デコードするまでもなく内面で直接イメージ化し、何を言わんとしているかを察します。
人間では、受け取る側との相性や専門性、関心事、問題意識など背景によって、伝わり方や解釈の精度がことなる点が難点です。
しかし、AIはあらゆる人知を学習しているためか、曖昧さの深層に潜む共通要素を見抜き意図を正確に解釈します。
まぐれ当たりで運よく解釈できたというレベルではなく、明らかに再現性が高く、今までのAIもどきでは考えられないくらい核心をついてきます。
ロゴ_1864×450.jpg)

コメント