記述の基体(がらくた)

【ブログ】日々の思ったことを徒然なるままに書いております。基本殴り書きで校正しておりません。【世界観】人は動物のように本能で現実に向き合っているのではなく、言語を通じてのシンボル体系としての世界、その世界の中の私(自我)という物語で現実にしがみついている。【取り組み】(1)現をよく存在させたい。そのためのよりよい社会や世界に向かう。(2)卓越した創作をしたい。そのためにはより多くのゲシュタルト(パターン・観念・概念)を獲得→世界でよく行動し、読書。【価値観】結局は「朋あり遠方より来たる、また楽しからずや」【プロフィール】東京出身のアラサーです。※著作権についてはオプトアウトに対応させていただいております。何かに共感された方はご連絡ください。 【コメント欄へのフィードバックお待ちしております。個人的な質問、反論、脅迫などはTwitterへお願いします。】

2016年10月

このベダであるが、往年の難題に答えてみたい。
ひとことで答えてしまえば、「もう社会がこういう流れにある以上、それ以外の道はない」ということと、「誰の観点から捉えるか、で答えは違う」という2つに集約されるのではないか。いやそれ以上にそもそも問いがおかしい、という見方もある。以下、3つの想定で吟味してみよう。

■社会的に考えるなら
「もう社会がこういう流れにある以上、それ以外の道はない」
国と国が接触を持ち始めた何百年か前に、或いは言語を使いだした何千年か前に戻ることが許されない以上、「今」を起点に考えるしかない。民主主義、資本主義というのは哲学的に根拠ある人間社会の在り方であり、誰もが普遍的に合意できる社会の形態は今のところ「これ」しかない。

■個人レベルで考えるなら
「誰の観点から捉えるか、で答えは違う」
もちろんそうだろう。上の考えは、社会全体、というか少なくとも多くの人のことを漠然と想定した場合のいい子ちゃんの答えだ。もう70歳でぎりぎりの年金生活の人と、25歳で上場企業の社長を引退しリタイアする若者との自分の「生」に対する見方は違う。社会を良くすることに大義を見出す熱い若者、後は野となれ山となれの卑屈なおっさん、どちらがいいとも価値判断はできないが、それぞれ違う物差しで世界や生を捉えている。誰にとって良いのか?それによって答えは違うのは当然。

■そもそも論で考えるなら
これを突き詰めると、そもそも「いいことか?」という問いが間違っている。言葉で答えられるのは事実的なことだけ。僕らの主観的な体験、本質というのは言葉では捉えることができない。こうなるともう、なんでもありの世界になってしまう。全てが幻想の唯幻論。

ということで、殴り書きだが取り急ぎ。 

ある白人である外国人の友達がこんなことを言っていた。いくら日本語がうまくても、私は見た目が違うので外国人扱いされ日本には完全には溶け込めない、と。溶け込むことの定義はここでは措いておいて、しかし、言っていることは分かるだろう。

では人種とは何か?それについて考えてみたい。WIKIによると「人種(じんしゅ)とは、現生人類を骨格・皮膚・毛髪などの形質的特徴によって分けた区分である 」とのこと。まず、それは単純に「見た目」と考えよう。

掘り下げてみる。それはまず生物学的なものであろう。猿から人間に進化したような時代、今の人間の原型が作られたとき、おそらく赤道付近の亜熱帯、森林の中での生活、砂漠、海辺、雪の絶えない北のどこか、その物理的な環境により皮膚や目の色、身体の作りの原型が形成されたのだろう。そう、物理的な影響で何種類かの外見的な特徴による人種ができた。黄色、白色、黒色など。その時点では、縞馬が他の馬と外見が違うのと同じレベルでの「違い」である。

人種は「見た目」である、というのは確かに正しく思える。しかし、同じ黄色人種の日本人であっても長澤まさみのような美人から片桐はいりのようなパンチの効いた人もいる。しかし、パっと見、肌のいろや大体の骨格はその外見を形作る「土台」という意味で、判断の大きな役割を果たす。

しかし、人間は文化を持つ。この視覚情報にどんどん情報が上乗せされていく。

1,物理的な環境で物理的な身体の違い生まれる。黄色、白色、黒色など。
2,人間が集団生活を始める。感情移入しやすい見た目が似ている人間と集団を形成。
3,こうした集団が各地で生まれてくる。
4,ある人間集団が”何かの理由”により強くなる。例えば、便利な道具を開発したとか。
5,集団生活になると、「言語」が生まれる。言語が生まれたから集団生活となるのかもしれないが今はどちらでもいい。
6,言語を持つと世界や社会の中に自分を位置づけるようになり、今後の体験すべてがこの自我に紐付けられる。あらゆる体験がかこの記憶と連合し記憶される。例えば、自然の中で猿など黒っぽい動物などをよく見ていた黒人は、見た目が「黒」に親近感があるかもしれないが、白人を見れば「敵」と見なすかもしれない。逆に白人は自分たちを他の動物とは一線を画する、と思っているかもしれない。
7,このように、まずは敵(或いは違う集団)として肌や骨格の違いは、ネガティブな印象からスタートする。
8、その後、社会生活を営む上でさまざまな観念の連合が起きて価値観が複雑化する。例えば、私がある「家」を所有している、ある人にその「家」を褒められる、するとなぜか自分が「嬉しい」、これは家と、そこにずっと住んでいる自分が連合している。もちろん、所有という観念も働いている。或いは、幼児のころ大好きな母親がいつも緑の服を着ていれば緑に好感を抱くようになるかもしれない。そしてこの緑がさらに他の観念と連合したりでカオス的に複雑化した網目となる。
9,こうして、当初は「違う集団の人」程度の認識であった外見の違いが、社会的に「国」「戦争」「経済」などなどの観念の登場とそれらとの連合の過程で、社会的な情報が加わっていく。帝国主義の世界潮流であれば、その中心にいる国の「外見に対する考え」が良いもの、正しいものとなっていく。
10.そして、こうした国どうしの国際社会が形成され大きな戦争を乗り越えた今、冷静にその歴史を振り返り、生物学的な根拠なども加わり、「外見は人間の優劣には関係ない」という見方が広まる。しかし、既に築かれてしまった社会的な価値観を根本から崩すのは難しい。そして歴史の中で白人が主役となり営まれた事実は消えない。

ということで、論理的に考えればたしかに人種は関係ない、といえるだろうが、事実としてその違いが重要性を持っていたことは確かである。それにより人びとの振る舞いも作られてきた歴史がある。

これが「人種」の現状である。

冒頭の友人に人種(外見)について答えるなら、こうなる。 たしかに、その友人が日本社会に溶け込むためにはハードルがある。そして、外見上、他の日本人と同じように日本社会に溶け込むことは不可能であろう。でも、もちろん仲良くなり、違う形で溶け込むことはできる。

外見の違い、それは突き詰めたら「気づいたら既に始まっている私の生の特質」、被投性なのである。 

私は以前、学校の授業で、音声認識と音声合成について学んだことがある。簡潔に言ってしまえば、音声認識とは人が発語した音声をプログラムに正しくテキスト化させることで、音声合成とはテキストをプログラムに正しく発語させることである。

 

音声生成に不可欠な、アクセント・イントネーション、リズム・タイミングといった音声言語を特徴付ける韻律特徴の制御のしくみや、言語情報との関連、聴覚心理的な観点からの理解、これらの制御規則を学習する人間の諸機能の特性についてのモデル化さらに検証をし、音声認識と音声合成の精度を高めるための作られた理論や技術の概要を学んだのである。

 

音声認識技術が高まれば、我々が発語により言語行為をした場合に、プログラムが正しく発語内容をテキスト化できる。もちろん、言語行為自体の「意味」の理解は別の問題となる。しかし、正しいテキスト化は言語行為の理解の第一歩である。

 

また、音声合成技術のほうは、既に人間の声と区別がつかないレベルに達しており、実際にウェブ上の音声合成技術を利用してみると、その精度の高さに驚いてしまう。(例えば、imtranlator.net[1]を使ってみるとそのレベルの高さに感動してしまう

現時点での実用例は主に以下の3つのようだ。
[2]

1.       文字を読むことが困難な障害者や、文字が読めない人(幼児、外国人など)に画面読み上げソフト(スクリーンリーダー)として

2.       言葉を発することが困難な人が代替手段として

3.       家電製品の音声ガイダンスや、公共交通機関や防災関係のアナウンス用途として

 

この音声合成の読み上げは現時点の技術では「棒読み」しかできないが、1,3の用途に限れば「棒読み」で問題ないだろうし、もうこれ以上精度を上げることの実用での利は収穫逓減でほとんどないだろう。

 

2については「棒読み」以外に付加要素として需要がありうる。さらに高度にして発話に関するノンバーバルな声のトーンや声質なども音声合成に取り入れることである。実際、以前授業でも「ノンバーバル発話「ん」の韻律特性を用いた対話韻律の生成」を紹介していただいた。

 

仮に喜怒哀楽或いはさらに細かく分けた発語の際に表現できる感情を列挙し、読み上げ速度やイントネーション、声の大小など適切な特徴を見出しそれをパターン化できたとしよう。言葉を発することができない人は、まずキーボードなどによりテキストで発話したい文章を作成。それを音声合成プログラムで発語する際に、「喜怒哀楽」を選択する、ということになるだろうか。それではコミュニケーションがぎこちなくなり、現実的な使用には不適切である。やはり自分の口で発話する際に感情などノンバーバルなものを乗せて伝えるのが自然だ。

 

では、「ノンバーバル発話」の音声合成は役に立たないのだろうか。そんなことはない。先の1,3でも利用すれば付加価値はある。例えば、物語の読み上げであれば、お母さんが幼い子どもに絵本を読み聞かせるように表現豊かに読み上げれば聞き手はより豊かに楽しく内容を理解できるだろう。

 

では、そのような音声合成技術が可能なのだろうか。

 

この問題は2つに分けて考えるべきだ。まずは、上述したがテキストに載せるべき感情などのパターンを十分にいくつかに分け、その特徴(イントネーション、速度など)を適切に記述する。これは実際には非常に難しい。人は自分が特別な口調で発語しているときに必ずしもどのような心的状態(怒っているのか、興奮しているのか、その程度はどれくらいか)など把握していないし、捉える基準もない)

 

さらに、仮にこの問題が解決されても、プログラムが何かの文章を読む際に“どのような”ノンバーバル発話を適応して読むべきかを「どうやって判断するのか」という問題がある。例えば、「なにやってるの?」という発話でも文脈次第で、興味を示すゆっくりとした口調の発語もあれば、相手に怒りを示す口調の発語も考えられるが、プログラムはそれを文脈で判断しなくてはいけない。そうでなければ絵本の読み上げはお母さんのようにうまくはできない。

 

ここまで来ると、当初のような人間の発語を分析してパターンを見出し再現するという次元を超えている。むしろ、ここで必要なのは人間と同じレベルの知性を持った人工知能ロボットである。

 

なぜだろうか。絵本の読み上げがそんなに難しいことなのか。

 

例えば、あるプログラムに桃太郎の絵本を子供に対して読み上げされると考えてみよう。そのプログラムはノンバーバル発語をできるという設定だ。鬼が発語するときは、ゆっくりと大きな低い声でわざとらしい口調で発語するだろう。

 

しかし、この判断をプログラムはどうやってするのか?もちろん、事前に鬼はそういうしゃべり方をする、などとインプットしておいてはプログラムの意味がない。(というか汎用性がないので使えない)

 

プログラムがその判断をするには無数の知識を既に持っていなくてはならない。

Ø  どれが鬼に発語か識別する

Ø  鬼というのが悪いキャラクターであること

Ø  実在しない存在であること

Ø  悪いキャラクターの典型的な話し方

などなど無数にある。それこそ人間が持っている知識のセット一式が必要である。そのようなことを事前に人間が入力するのは不可能。

 

要するに、人間と同じようなレベルの知性を持った人工知能が必要なのである。それは人間と同じようなインプット情報(視覚、聴覚、嗅覚の情報など)を獲得でき、自分で特徴量を見出し概念を獲得できるロボット。さらに、人間に近い身体も必要である。

 

人工知能を専門にする日本の工学者松尾豊は著書『人工知能は人間を超えるか ディープラーニングの先にあるもの』 (角川EpuB選書、2015)にて人工知能の身体の必要性について以下のように述べる。

 

“たとえば、コップというものをきちんと理解するためには、コップを触ってみる必要がある。ガラスや陶器のコップは強く握ると割れてしまうし、そういうことも含めて「コップ」という概念がつくらている。「外界と相互作用できる身体がないと概念はとらえきれない」というのが、身体性というアプローチの考え方である。”

 

“人間が生活する環境で、人間並みの「身体」を持てば、人間がつくり上げる概念にある程度近いものは獲得できるはずだ。”

 

人間と同じ程度の概念を持つには人間と同じような身体を持ち、同じような環境で時間を過ごし一般的な人間が形成してきた概念を学ばなくてはならない。もちろん、それらをすべて人間が何らかの形で記述しインプットしてもいいが、それは天文学的な数になるし、そもそも人間は自分がどんな概念を持っているかなど把握していない。

 

さらに松尾は、人工知能の発展を六段階に分けている。第一段階が画像認識レベル、最終の六段階目に秘書として働けるレベルを設定しているが「言語の理解」を第五段階とかなり最終段階に近くに置いている。こうしたことから、絵本を子供に対してノンバーバルな要素を含み発語することは人工知能やロボットの発展段階の最終局面に近いほど難易度の高いことがうかがえる。

 

以上、私は本授業で、われわれの生活を便利にする音声認識と音声合成が具体的にどのような技術や理論で成り立っているのかの概要を掴むことができた。そこには一筋縄ではいかない数学的、工学的な知見が詰まっているし、発話された言葉を分析した研究者たちの努力も見られた。それらを受けて、今後こうした分野が社会にどのような影響を及ぼしそれらの実現の可能性を考察した。

 

**参考

なお、上記の考察において私は以下のような言語観に基いている。以下は竹田 青嗣『現象学は思考の原理である  』(筑摩書房, 2004)を要約したもの。以下で示される「企投的意味」と「一般意味」の違いが分かれば言語の持つ様々な問題が解明される。例えば、「広間が鶏に入り込んだ」という文はおかしいが、われわれは理解できる。

 

■「企投的意味」と「一般意味」

語がもつ辞書的な意味を「一般意味」、現実言語の中でわれわれが了解しようとしている発話者の言葉の意味を「関係企投による意味」と区別しよう。その基本関係は、言語行為は一般に言語によって他者と世界を共有しようとする関係的な試み(企投)であり、人は語の一般意味を利用して自分のその都度の「企投的な意味」を他者に投げかけようとする。

 

ウィトゲンシュタインの哲学探究での素朴な言語ゲームを例にしてみよう。ある男Aが「板石!」とBに言ったとする。これはBに対して、板石を持ってきてくれ、といっているかもしれないし、この板石は邪魔だからどけてくれ、ということかもしれない。この語は「板石」の概念を意味するが、男Aがいいたいのは「邪魔だからどけて」である。これは語の一般意味を利用して、自分の企投的意味を投げかけようとしている。

 

こうしてみると、語の表現する一般意味がそのままで言語行為の企投的意味とぴたりと重なることは決してありえない。すなわちわれわれは、どれほど単純に見える言語行為でもかならず一般意味を利用してその都度の各自的な意の投げかけあい(関係企投)を行っている。このように語の一般意味と、言語の企投的意味の違った本質を持っているのである。

 

われわれが言語の意味というとき、しばしば語のもつ「一般意味」とそれを媒介とする言語行為における「企投的意味」とを混同している。語の「一般意味」は人間が長くある語を一定の仕方で使ってきたことの集合的な痕跡。しかし、「企投的意味」はわれわれが生活のなかで絶えずそのつど行っている実存的な関係行為。見てきたように現代言語哲学における言語の謎はたいていこの2つの意味を混同することから生じている。

 

言語の「意味」という概念は、語の「一般意味」と、発話者ー受話者の関係で現れる企投的意味(言わんとすること)という二重の「意味」をもつということである。これはソシュールでは、ラングとパロールの二重性に重なり、フッサールでは指標と表現という区分に対応する。

 

時間的な先行関係としては、語の一般規則が確定されていなければ、われわれはそれを使って発語すること、関係企投を行うことができない。しかし、論理的な先行関係としては発語行為の積み重なり、その集合的な痕跡が語の一般規則(一般意味を含む)を形成するので、企投的意味が一般意味の形成の根拠である。言い換えれば、一般意味は現実の発話行為を、つまり発語行為のなかで生きて動く企投的意味をその源泉とする。

 

われわれはある前言術的な感覚に押され、それを他者と共有しようとする気持ちにうながされて、はじめてそれを言語化する。人間世界の意味の秩序が言語によって分節されているということは実存の世界が総じて欲望相関的に分節された前言術的な意味の世界であるということを土台としてはじめて成立するのであり、この根拠関係を理解することが意味の本質を理解する上でのポイント。哲学的には、欲望やエロスの動きが関係という形式性を分節するのであり、つねに欲望が関係に先行する。

 

言語についていってみれば、この実存的企投に発する他者との世界了解の共有(分有)ということが、発語することの基本的「動機」であり、またそれが現実言語の「企投的意味」の本質。さらに、このような関係行為としての言語による「企投的意味」の集合的な痕跡(積み重なり)として、言語の「一般意味」(辞書的意味)が成り立っている。言語の一般規範ラングが個々のパロール現実言語を可能にしているが、根拠関係としてはパロール企投的意味の積み重ねが絶えず一般ルールのラングを作り上げている。


 
 



[1] http://imtranslator.net/translate-and-speak/speak/japanese/

[2] https://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90#.E5.AE.9F.E7.94.A8.E4.BE.8B

自分の中に確固として規範がある人はかっこいい。惹かれてしまう。

特に今の時代。

ポストモダンの現代、多様性が重視され絶対的に正しいものなどないことをみんな知っている。そんな中、自分にはもちろん他人にも強いることができるような決めごと、これを持つものは稀である。

方向性のない時代。

何をやってもいいじゃん、というその投げやりな感じ。

そんな空気感が蔓延する中、自分の中に規範を持ちあらゆるものを次々と判断していく。そんな人に惹かれてしまう。 

そして、そういう人ほど充実した実存を過ごすのだろう。 

限りないも、それが欲望。井上陽水は果てしない人間の欲望を謳っている。

なぜ欲望は果がないのか?
食欲や性欲などの生物的な欲求は満たされることができる。

しかし、丸山圭三郎が言うように僕らは動物がもつ本能的な身分け構造がコトバを獲得したことで、破綻し、欲求ではなく欲望の世界を生きるようになった。

動物は身分け構造を生きている。「いま、ここ」だけを生きていれば欲求が満たされれば収まるのだ。一方人間はそうはいかない。

なぜか?それについて私の考えを述べよう。コトバを持つと人間は現在の我々が持っているような時間、空間の概念を得る。そして、一般人が持つ自然的態度、客観的な物理世界の中に生きる一人の人間として自分を捉え、その主体としての自分が時間の流れの中でさまざまな経験をしていくという生の理解をしている。

こうすることにより「いま、ここ」が時間的にも空間的にも無限に拡がっていく。目の前の食べ物で腹を満たしても、将来のことが気になりだす。さらに人間は社会を営み分業をしたり、娯楽をしたりと社会を形成し生活を複雑化していく。こうなると、人間関係においても複雑なゲームが始まり、権力や権威、評判などが本能的な欲求を基にしているが、それがあらゆるものと相互に連合しあい複雑な網の目となりどうすればどうなるのかが分かりらなくなっている。

われわれは、日々、意味を感じつつ生を進行している。丸山圭三郎は"意味"を「生への関与生」という。ようは生、「いま、ここ」という実存に関するものは全て"意味"である。コウモリが捉えるような超音波はわれわれの生に関与しないので意味として現れないが、小さなわけのわからない物音は生に関与すれば意味あるものとなる。

「いま、ここ」だけを生きる動物にとって、意味は目の前にあるものだけだ。それに惹かれるか或いは避けるかというような単純なもの。一方、人間は、目の前のものだけでなく、そこから時間、空間へ拡がり動物と比べ物にならないほどの”意味”を取る。目の前に会社の顧客がいれば、動物的にはただの同じ種の生物がいるだけだが、人間的には「気をつかう人」「将来の収入に関係のある人」「めんどくさいやつ」であり、「相手はどのようなことを考えているのか」「どうやったら気に入ってもらえるか」などいろんな意味が一瞬のうちに湧き出る。

「いま、ここ」という一点から空間、時間のすべての方向に意味が展開される。こうして人間は、沢山の意味を見出しながら生きる。それは生存のためには総合的には有利かもしれないが、個人の実存、生としてはあらゆることに気をとられて疲弊してしまうかもしれない。

ただ、根本的には我々人間も生物である。基本は「いま、ここ」を身分け構造でいきる生物である。その上に四方に広がる言分け構造の世界は流動的であり実体のないものであることを理解すれば、過度に疲弊する心配もない。

欲望が限りないのは、時間、空間を無限に引き伸ばしているからなのだ。 こうして見出される無限の時間と空間における欲望は満たされることはない。根本的に。

ちなみに、ジャック・ラカンは欲望をつぎのように説明する。われわれはもともと母親と一体化し万能感があったが、父親の介入でそれがなくなる。そしてそれまでペニスをもった万能な母親にペニスがないことを発見し自分自身が母親のペニスになりたいと思う。しかし母親が欲しているのはペニスではなく他のもののように思えてくる、それは父親のペニスであり、財産や権力でもある。こうして、父親のペニスになることを断念し(去勢)、その代理品(象徴)で満足するように方向転換。こうして子供は初めて言語を語る存在、人間となる。 

代理品である象徴で満足するようになった人間は、本質的に満たされることはないのである。なぜなら、母親と一体であった万能な世界を断念し、全てが妥協となっている状態であるから。 

↑このページのトップヘ