aurea mediocritas

日々の雑感や個人的な備忘録

学習について学習しよう

 

 

【参考文献】

1.藤田和生『比較認知科学への招待―「こころ」の進化学』(ナカニシヤ出版,1998)

2.ジェームズ・E・メイザー(2006), 磯博行・坂上貴之・川合信幸訳『メイザーの学習と行動 第3版』(二瓶社, 2008)

3.実森正子・中島定彦『学習の心理―行動のメカニズムを探る―』(サイエンス社, 2000)

4.Pavlov, I, P. (1927). Conditioned Reflexes. Oxford: Oxford University Press.

5.Skinner, B. F.(1938). The behavior of organisms. New York. Appelon-Century-Crofts.

6.Skinner, B. F.(1948). Superstition in the pigeon. Journal of Experimental Psychology, 38, 168-172.

7.Thorndike, E. L.(1911). Animal intelligence. New York, Macmillan.

 

 

 

 

 

 

【最初に話の流れだけを提示してみる】

1.学習とは、「経験による比較的永続的な行動の変容」である。

 


2.行動には大きく分けて、「刺激により誘発される反射行動」と、「随意的に制御可能で個体が自発するオペラント行動」がある。

 


3.反射行動の変容原理としては、「馴化」と「鋭敏化」という2つの「非連合学習」があり、それとは異なって「連合学習」もある。「馴化」とは刺激の反復により反射が減弱する過程で、「鋭敏化」とはその逆に増強する過程である。

 


4.反射行動は、「古典的条件付け」と呼ばれる「連合学習」によっても変容する。「古典的条件付け」とは「中性刺激」と反射を誘発する「無条件刺激」の「対提示」によって、「中性刺激」が「条件刺激」となり、よく似た反射を誘発するようになる過程である。

 


5.「オペラント行動」は「オペラント条件づけ」と呼ばれる「連合学習」の変容原理によって変容する。これはある環境刺激(弁別刺激)の下で自発された反応が、それに後続する環境変化(強化刺激)により強められたり弱められたりする過程である。

 


6.オベラント行動の時間や回数と強化の出現の間に設けられた関係を「強化スケジュール」と呼び、オペラント行動の生起は、それによって特徴的なパターン(「スキャロップパターン」や「ポーズ・アンド・ラン」など)になる。

 


7.「古典的条件づけ」と「オペラント条件づけ」は、「連合学習の一般原理」である。

 


8.実際には刺激間や刺激と反応の組み合わせ、あるいは場面によって、学習の効率は著しく変化する。これらは「学習の生物学的制約」と呼ばれる。つまり、「連合学習の一般原理」はどの動物にも同じように適応できるわけではないし、効率も種によって異なる。

 


9.自然界に見られる学習には「連合学習の一般原理」には当てはまらないものが数多く見られ、それらは「プログラムされた学習」と呼ばれる。

 


10.「学習の生物学的制約」や「プログラムされた学習」は、動物がその種の典型的な生活を送るために必要不可欠な内容を必要な時に確実に学習するために進化した「適応的意義」を持つものであり、ヒトの学習も、こうした制約から自由ではなく、なんでもゼロからいつからでもどんな仕方ででも学べるわけではない。ヒトを含めた動物たちに与えられた時間や学習の機会は無限にあるわけではないので、生きていくために必要不可欠なことは、速やかに効率よく学ぶ必要があり、すべてをゼロから学ぶのでは時間がいくらあっても足りない。「学習の生物学的制約」と「プログラムされた学習」は、学習の自由度を下げてしまうように思えるかもしれないが、学習の自由度を下げて、どのように学習するかがあらかじめ決まっていることによって素早く学習することを可能にしている。むしろ、「古典的条件付け」や「オペラント条件付け」のような「一般原理による学習」こそ、より予測することが難しい環境変化に適応するための最終手段としてバックアップ的に装備されていると考えた方がよい。人間以外の動物たちの学習の多くは、当該の種としての典型的な生活を送るためにどうせ必ず学習しなければならないものについては、それを確実に学習するときように、あらかじめプログラムされたものになっている。

 

 

 

 

 

 

【これまで考えられてきたヒトの特殊性】

⑴.道具を使う

⑵.道具を作る

⑶.言葉を話す

⑷.文化を持つ

⑸.意識(内省)

→⑴-⑸は、原初的な形でなら動物にもその萌芽が見られる。

 

 

 

【学習とは何か】

 


比較認知科学における「学習」は、「学校の授業や宿題」のことではない。比較認知科学における「学習」とは、「「経験による」「比較的、永続的な」行動の変容」のことである。また、「何かをしなくなること」も学習である。たとえば、「嫌な思いをした店に二度と行かなくなる」のも「学習」である。行動の変容というのはたとえば、新しい行動の形成、行動の形態の変化(料理のレシピ調べが読書からネット検索へ)、行動の時間帯の変化、行動の持続時間の変化、行動の頻度の変化、行動の出現場所の変化なども学習である。

 

 

 

【学習とは何でないか】

 


[⑴.経験をしなくても生じる行動の変容は学習ではない]

→誰に教わらなくても赤ん坊は「ハイハイ」をして歩くので「ハイハイ」は学習ではない。

 


[⑵.すぐに元に戻る行動の変容は学習ではない]

→ガソリンスタンドに行くと揮発油の匂いがするけれども、すぐに気にならなくなる。これは抹消の匂い感受器の「順応」と呼ばれる働き。このようにして生じる非常に短期的で抹消的な行動の変容は学習ではない。他方で、毎日ガソリンスタンドに勤めているうちに「順応」に必要な時間が短くなっていったとしたらそれは学習である。

 


[⑶.永久的な行動の変化も学習ではない。]

→事故で片足を失ってもう両足では歩けなくなった場合、そうして生じた行動の変容は学習ではない。ただし、義足を装着してから訓練によって歩けるようになったなどの行動の変容は学習。

 

 

 

 


【学習はなぜ必要なのか】

 


常に一定の環境(たとえば深海のような安定した環境)で生活する動物ならば生活や繁殖に必要なすべての情報(たとえば「何を食べて、誰と繁殖するか」など)があらかじめ遺伝子に組み込まれていてもよいだろうが、現実には、「完全に安定した環境」というのはほぼないし、そこに住む動物もほぼいない。

 


→たとえ空間的位置を変えなくても、時間(たとえば季節)が変われば環境は変わる。そうした変化する環境に「学習」によって対応したり行動を調節したりできる動物の方が、より適応的に生きていくことができる。

 


→さらに重要なことに、環境の中には、「遺伝子の中に組み込むことが原理的にできない情報」もたくさんある。たとえば、生まれた場所の地理や地形を遺伝子に組み込むことはできない。よって、「学習」は非常に多くの動物にとって、生存の役に立つというだけではなく、必要不可欠でさえある。学ぶしかない情報というのもたくさんあるからだ。

 

 

 

【学習の2類型】

 


学習には二種類ある。

1.さまざまな動物に共通した基本的原理に従って生じる学習

2.種によって特異的にプログラムされた学習

 

→「2.プログラムされた学習」は後半で扱う。


→ただし、「1. 共通した基本的原理に従って生じる学習」の学習原理は次に述べる行動のタイプによってことなる。

 

 

 

【行動の2類型】

 


行動には「⑴反射行動」と「⑵オペラント行動」がある。

 


⑴.反射行動(レスポンデント行動)

→「反射行動」とは、「ある刺激が生体の感覚器に取り込まれると、自動的に誘発される不随意的な行動」である。

 


[⑴-①. 唾液反射]

→口に食物が取り込まれると不随意的に唾液が生じる。

→唾液が出ないと食べ物を飲むのは難しい。(胃液もそう。)

 


[⑴-②. 眼瞼(がんけん)反射]

→眼に空気を吹きかけると瞬きが不随意的に誘発される。

→瞬きに関しては、ある程度意志の力で制御することができる。ただし完全にはできない。

→瞬きがなければ目が乾いて物が見えなくなる。

 


[⑴-③.歩くときの姿勢維持]

→歩くときに不随意的に姿勢が維持される運動。

 


[⑴-④.驚愕反射]

→雷が鳴ると身がすくむ

 


[⑴-⑤.原始反射(吸入反射、把握反射、ルーティング反射)]

→新生児が備えている特有の反射行動。

→新生児のくちびるに物を近づけるとそれを吸う反射(吸啜反射)。

→新生児の手のひらに鉛筆などを押し付けるとそれを強く握る反射(把握反射)。

 

 

 

⑵.オペラント行動(「道具的行動」とも呼ばれる)

→オペラント行動は、「主体がその出現を制御できる随意的な行動」であり、反射行動とは異なってオペラント行動を誘発する特定の刺激はない。

→オペラント行動の最大の特徴は、「行動の結果、生じた環境の変化によってその強さや自発される頻度が変わること」である。

→人間が普段の生活でやっている行動の多くはオペラント行動である。

→たとえば、字を書くこと、友達と話すこと、テレビを見ること、料理をすることなど、これらは随意的に制御できるので、いずれもオペラント行動である。

→オペラント行動は「主体が環境に働きかけてそこから良い結果を得るために道具として用いられるもの」とみなすことができるため、時として「道具的行動」と呼ばれることもある。

 

 

 

【「⑴反射行動」におけるその変容原理の2タイプ】

 


反射行動の変容原理には、「⑴-ⅰ.非連合学習」と「⑴&⑵-ⅱ.連合学習」とがある。さらに「非連合学習」の中には「⑴-ⅰ-1.馴化」と「⑴-ⅰ-2.鋭敏化」とがあり、他方で「⑴&⑵-ⅱ.連合学習」の中には「⑴-ⅱ-1.古典的条件付け」がある。ただし、「⑴&⑵-ⅱ.連合学習」の中には、「⑵-ⅱ-2.オペラント条件付け」もあるが、「⑵-ⅱ-2.オペラント条件付け」の方は「⑴反射行動」の変容原理ではなく、「⑵オペラント行動」の変容原理である。

 

 

 

[⑴-ⅰ.非連合学習]

非連合学習とは、反射を誘発する刺激を反復して提示すると、反射の強度や頻度が変化するという学習である。

→なぜ「非連合」学習と呼ばれるかというと、「複数の刺激や反応の組み合わせが関与しないから」である。非連合学習には「馴化」と「鋭敏化」があり、どちらも「刺激の単独提示」によって生じる。

 

 

 

<⑴-ⅰ-1.馴化>

→くつろいでいる時に突然雷がなると身体がびくっと動く。これを「驚愕反射」という。しかし、何度も雷の音を聞いているうちに驚かなくなる。これが「馴化」である。反復によって反射強度が弱まっていく現象のことを「馴化」あるいは単に「慣れ」と呼ぶ。

 


【自発的回復】

→ただし、雷に馴化した後に数日後また雷が鳴ると同じ驚愕反射が起きる。これを驚愕反射の「自発的回復」と呼ぶ。

 


【刺激特異性】

→馴化には、さらに注意点がある。たしかに時間が経てば「自発的回復」によって、反射は回復するけれども、だからといって、この「馴化」は筋肉疲労によって生じたものではない。その証拠に、雷にはもう馴化している人のところに突然大地震が到来した場合でも、また同じ驚愕反射は起きる。ということは、「馴化」は「筋肉疲労」によってではなく、それを生じさせたある特定の刺激に対して生じている現象なのである。これを馴化の「刺激特異性」と呼ぶ。

 

 

 

【脱馴化】

→ある刺激に対して馴化が生じた後、馴化刺激とは無関係な刺激を提示すると、馴化したはずの反射が回復する場合がある。たとえば、「雷の音」に馴化した人に「強い光」などを当てると雷に対する反射が回復することがある。これを脱馴化という。

 


【馴化・脱馴化法】

脱馴化を利用して、2つの刺激が区別されているかどうかを調べることができる。1つ目の刺激に対して馴化が成立したあとで、2つ目の刺激を提示すると2つ目の刺激に対して反応が回復すれば、その2つの刺激に区別がついていると考えるのである。この手法を「馴化・脱馴化法」と呼ぶ。これは言語的なテストを用いることができない乳児や動物の知覚に対してしばしば利用する。

 


【刺激般化】

→でも、「馴化」に関して、さらに厄介なことに、「馴化」は厳密にそれを生じさせた一つの刺激だけに対して生じるのでは、ないのだ。実は、ある刺激に対して「馴化」が生じている時、それとよく似た同じような刺激に対しても「馴化」は起きているのである。たとえば、雷に馴化している人は、それとよく似たシンバルの音に対しても馴化している。これを「刺激般化」と呼ぶ。

 


【馴化の適応的意義】

→「馴化」の「適応的意義」は、「環境内の重要ではない刺激を無視する」という非常に重要な意義がある。生体は環境内の事物を常にチェックしてはいるのだが、そのために必要な「注意」や「時間」は有限なので、常時環境内のすべての事象に注意を払っていることはできない。そこで、馴化は「強いかもしれないが特に危険ではないような刺激」をフィルターにかけてこしとる」という役割を担っている。「環境内の不要な刺激の濾過」が馴化の意義である。

 


<⑴-ⅰ-2.鋭敏化>

→「馴化」と同じように刺激を反復して提示すると、「反射」の強度がむしろ増していく場合があり、これを鋭敏化と呼ぶ。たとえば、お化け屋敷に入った時、最初のうちは少し驚くだけであるが、中をどんどん進むにつれて、最終的には「なんでもない音」や「ちょっとした物の動き」にさえ身体がすくむようになる。暗闇で人影を見ると非常にドキっとするのは「鋭敏化」の働きである。

 


【お化け屋敷】

→馴化に比べて、「鋭敏化」の方は「刺激特異性」が弱くて、多様な刺激に容易に「刺激般化」が起きる。お化け屋敷はこの性質を利用しているのである。

 


【鋭敏化の適応的意義】

→「鋭敏化」の意義は、「危険なものをなるべく早く、確実に察知する」のに役立っている。危険が存在するかもしれない確率が高い場所ならば、たとえ間違うリスクをおかしてでも、危険を早く察知する方が得策なのだ。

 


【馴化と鋭敏化のどちらが起きるか】

→ある刺激を単独で反復提示したときに、「馴化」と「鋭敏化」のどちらが生じるのかを予測することは難しいが、一般的には、「弱い刺激を短い時間間隔で何度も同じ場所に反復提示すると馴化」が生じやすくて、それとは逆に、「強い刺激を長い時間間隔で違う場所に提示すると鋭敏化」が生じやすい。

→たとえば、「時計の針の音」や「持続的な天井のファンの音」には「馴化」が生じやすい。それに対して、「大地震」の後には「鋭敏化」が生じやすいので「小さな余震」に対して非常に鋭敏な反応になる。お化け屋敷も適度な時間間隔を十分に空けてから強い刺激を与えるように内部の仕掛けが作られている。

 

 

 

[⑴&⑵-ⅱ.連合学習]

「刺激と別の刺激の間や、刺激と反応の間の関連が生じたり、その関連の在り方に変化が生じたりするような学習」のことを一括して「⑴&⑵-ⅱ.連合学習」と呼ぶ。「連合学習」の基本過程には「⑴反射行動」の変容原理である「⑴-ⅱ-1.古典的条件づけ」と、「⑵オペラント行動」の変容原理である「⑵-ⅱ-2.オペラント条件づけ」との2種類がある。つまり、「古典的条件付け」は反射行動の連合学習であり、「オペラント条件付け」はオペラント行動の連合学習である。

 

 

 

<⑴-ⅱ-1.古典的条件付け>

ノーベル賞を受賞したロシアの生理学者にパブロフがいる。パブロフは唾液腺の働きを研究(1927)しており、犬の口の中にチューブを固定して自動的に唾液を採取できるようにしていた。その研究の途上、パブロフは奇妙な現象に気付いた。「飼育係の足音がすると犬が唾液を流し始めた」のである。これを再現するためにパブロフは次のような実験を開始した。まず犬にベルやブザーやメトロノームなどの音を聞かせる。犬はその音に注意を引かれるがそれ以上のことは起こらない。それを確かめたのちに、パブロフは音に続けて数秒後に犬の口の中に酸や肉片を入れた。すると、犬は食物に対する反射行動として唾液を流し始める。ここまでの操作を何度も繰り返すと、犬は音を聴かせただけで、口の中に酸や肉片が入れられる前から唾液を流し始めるようになった。つまり、「犬はベルの音がすると唾液が出る」という新しい「反射行動」を獲得したのである。これを抽象化すると、次のようになる。

 


【無条件刺激】

→まず、もともと反射行動を誘発する機能を持っていた刺激(この場合は酸や肉片)のことを「無条件刺激」と呼ぶことにする。

 


【無条件反射】

→次に、「無条件刺激」によって誘発される反射のことを「無条件反射」と呼ぶ。

→「無条件刺激」によって起きる「無条件反射」は生体に生得的に備わっている。

 


【中性刺激】

→「無条件刺激」に対して、最初は特別な意味を持たなかった刺激(この場合にはブザーの音)のことを「中性刺激」と呼ぶ。

 


【条件刺激】

→「中性刺激」(ブザーの音)が、「無条件刺激」(肉片)と対(つい)にして提示することにより「「唾液反射」を誘発する」という新しい働きを獲得した。この「新しい働きを備えるようになった中性刺激」のことを「条件刺激」と呼ぶ。

 


【条件反射】

→「「条件刺激」によって新たに誘発されるようになった反射」のことを「条件反射」と呼ぶ。

 


【古典的条件付けのまとめ】

→以上のことをまとめると次のようになる。「一般的に、「中性刺激」と「無条件刺激」とを対にして提示(=「対提示」)し、「無条件反射」が生じることを繰り返すと、「中性刺激」が「条件刺激」となり、「無条件反射」によく似た「条件反射」が生じるようになる。この学習過程のことを単に、「古典的条件付け」と呼んだり、あるいは「反射行動」の別名が「レスポンデント行動」であることから、「レスポンデント条件付け」と呼んだり、あるいは発見者の名前を取って「パブロフ型条件付け」と呼んだりする。」

 


【強化】

→「古典的条件付け」が成立するための必要条件は、「「中性刺激」と「無条件刺激」とを対にして提示すること」、それだけである。「「中性刺激」と「無条件刺激」とを対にして提示する」というこの手続きのことを単に「強化」、あるいはオペラント条件付けにおける強化とは区別するために、特に「レスポンデント強化」と呼ぶ。

 


【必要条件は対提示だけ】

→「古典的条件付け」のポイントは何かというと、「古典的条件付けが成立するための必要条件の中に、「反応の結果生じる事象」は含まれていない」ということである。つまり、「古典的条件づけは、反応の結果には影響されない」のである。

 


【梅干し】

→日本人の多くは、梅干しを見ると唾液が不随意的に出る(=反射行動)が、これは、「梅干しのすがた(=「条件刺激」=かつての「中性刺激」)」と、「梅干しの酸味(=「無条件刺激」)」が繰り返し「対提示」された結果、条件づけられた「条件反射」である。梅干しを食べない西洋人はこの反射を持たないので、これは古典的条件付けによる「学習」である。

 

 

 

 


【古典的条件づけのバリエーション】

→「古典的条件付け」には実は色々なバリエーションが存在し、それに応じて古典的条件付けのしやすさが変化することが知られている。そのうち特に重要なものは、「中性刺激の提示」と「無条件刺激の提示」との間の時間的関係である。

 


【同時条件付け】

→まず、「同時条件付け」は、「中性刺激の提示」から概ね5秒以内に「中性刺激の提示」をしたままそこへさらに重ねて「無条件刺激の提示」をするようなタイプの古典的条件付けであり、これが最も条件付けが容易である。

 


【延滞条件付け】

→次に、「延滞条件付け」は、「中性刺激の提示」から「無条件刺激の提示」までの時間間隔を長くしたもので、条件付けするのはそれに伴って難しくなる。また、この場合、「条件反射」は「中性刺激の提示」から設定された時間だけ遅れて生じる。

 


【痕跡条件付け】

→さらに「痕跡条件付け」という方法がある。これは、「中性刺激の提示」後、一旦、「中性刺激」を消してから「無条件刺激」を提示するという方法である。この場合にもそれに伴って、学習は難しくなる。

 


【逆行条件付け】

→さらに「逆行条件付け」という方法もある。これは「中性刺激」と「無条件刺激」の提示順序を逆にするものである。このやり方だと、「同時条件付け」と同じように「中性刺激」と「無条件刺激」とが「対提示」されているのにもかかわらず、条件付けは著しく困難になるのだ。たとえば、梅干しを見ても唾液が不随意的に出たりはしない西洋人に、「梅干しの酸味(=「無条件刺激」)」を提示してからそのあとで「梅干しのすがた(=「中性刺激」)」を提示することを繰り返しても、その「対提示」の結果、「梅干しを見ると唾液が出る」という「条件反射」を条件付けることは困難になる。

 


【時間条件付け】

→さらに特殊なものとして「時間条件付け」という方法もある。これは、「中性刺激」を提示しないで、一定の時間間隔で「無条件刺激」だけを繰り返し提示する方法である。この手続きで条件付けすると、「条件反射」はその時間間隔で生じるようになる。この場合、「時間間隔そのもの」が、「条件刺激」になっていると考えられるのである。

 

 

 

【消去】

→一旦条件づけられた行動は未来永劫そのままで変わらないのかというとそんなことは当然なくて、「古典的条件付け」が成立し「新しい条件反射」が生じるようになったあとに「条件刺激」だけを単独で提示することを繰り返すと、「条件反射」は次第に弱くなっていき、ついには出現しなくなる。パブロフの犬の例で言えば、「ブザーの音」だけを聞かせてその後に「肉片」を口に含ませるのをやめると、次第に、パブロフの犬はたとえ「ブザーの音」が聞こえても唾液を出さなくなるのである。このように「条件付けの成立後に条件刺激だけを単独で繰り返し提示する手続き、あるいはそれによって反応が減衰していく過程」のことを「消去」と呼ぶ。

 


【消去は「消し去ること」ではなく「抑制すること」である。】

→ただし、「消去」は実は「消し去ること」という意味ではなく、「消去」と呼ばれている手続きによって実際になされていることの内実に即していうなら、「条件反射の抑制」という意味である。その証拠に、いったん消去した後に長い時間を置くと、「消去」したはずの「条件反射」が復活することがよくあるのである。ということは、「消去」にはその効果時間というものがあり、このように「消去」の効果が切れることがあるということである。このような復活を「馴化」のときと同様に「自発的回復」と呼ぶ。雷の音に「馴化」した後に数日後また雷が鳴ると同じ驚愕反射が起きるのを驚愕反射の「自発的回復」と呼ぶわけだが、それと同じく、条件反射も「消去」してから長い時間を空けると「自発的回復」をしてしまうのだ。だから「消去」という操作の内実は「消し去り」ではなく「抑制」の過程である。

 


【古典的条件付けにおける刺激般化】

→「馴化」でも「刺激般化」は生じたように、「古典的条件付け」でも「刺激般化」は生じる。具体的にいうと、「古典的条件付け」が成立すると「条件刺激」によく似た別の刺激に対してもある程度の「条件反射」が出現することを指す。たとえば、「メトロノームの拍数」や「ブザーの音の高さ」が少しくらい変わっても同じ条件反射(唾液反射)は出現する。これを「古典的条件付けの刺激般化」と呼ぶ。

 


【刺激般化の適応的意義】

→「刺激般化」は「学習」を曖昧にしてしまうように思われるかもしれないが、「刺激般化」にも適応的意義がある。たとえば、「刺激般化」がもしも一切起こらないとすれば、動物は環境内にあるありとあらゆる刺激について個別に学習しなければならなくなり、これは非常に大変なのである。よく似た刺激に対しては既に学習したことを応用するようにしておいた方がより適応的だったのである。これが刺激般化の「適応的意義」である。

 


【分化強化と弁別の適応的意義】

→しかし、場合によってはよく似た刺激であっても、「刺激般化」して応用するのではなく、区別をしたほうがいい場合もある。たとえば、「子供が蜂に刺されてしまって、痛い思いをして、蜂を怖がるようになった」としよう。この学習は高確率で「刺激般化」するので「色々な虫を子供は怖がるようになる」だろう。すると、こどもはこれが嵩じると、もうそとに出れなくなるかもしれない。だから、「ハチに少し似ていても、ハチではない虫は安全だ」ということを子供は学習する必要がある。そのために分化強化と弁別が必要なのだ。

 


【分化強化と弁別】

→「古典的条件づけ」をするときに、ある二つのよく似た刺激のうちの、一方については、「無条件刺激」と対提示して「強化」し、他方については、「無条件刺激」との対提示をしないことによって「消去」することを繰り返すと「条件反射」は前者の刺激に対してだけ成立するようになる。このように、「二つ以上の刺激で強化の仕方を変える操作」のことを「分化強化」といい、「「分化強化」の結果、それらの刺激に対する反射の生じ方が分かれてくること(=分化)」を「弁別」という。

 


【分化強化の具体例】

パブロフの犬の例で言えば、「100拍のメトロノームの音」に対してはパブロフの犬の条件反射を「強化」し、「120拍のメトロノームの音」に対しては「消去」するようにすれば、条件反射としての唾液分泌は「100拍のメトロノームの音」に対してのみ生じるようになる。

 


【高次条件付け】

条件付けが成立した後に、「第2の中性刺激」と「条件刺激」だけを対提示すると、「第2の中性刺激」が「条件刺激」としての機能を獲得する。たとえば、メトロノームの音で唾液反射を示すようになった犬に、光が提示されて短時間の遅延の後にメトロノームの音だけ(肉片はなし)を提示されるという経験が反復されると、やがて光は唾液反射を誘発するようになる。これが「2次条件付け」である。理論的には3次や4次も可能。

 


【高次条件付けの具体例】

ハチを見ると恐怖する子ども→刺激般化→昆虫図鑑のハチの絵や写真を怖がる子ども→反復→昆虫図鑑を怖がる子ども

 


【条件性制止】

メトロノームの音で唾液反射を条件づけた犬に対して、光とメトロノームの音を同時に提示し、その時には肉片を与えないことを繰り返すと、メトロノームの音だけの時には唾液反射が生じるのに、メトロノームと音が組み合わさった場合には反射を示さなくなる。別刺激の存在が条件づけられた反射の出現を阻害する現象を「条件性制止」と呼び、この場合は光が条件反射を抑制する機能を獲得したと考えることができる。

 


【隠蔽】

光と音のように、二つの刺激を組み合わせた「複合刺激」を中性刺激として条件付けを行うと、どっちの刺激も対提示されているにもかかわらず、どちらか一方の刺激だけが条件刺激としての機能を獲得する場合がある。たとえば、ブザーと光を同時に提示しているのに、ブザーに対しては唾液反射が生じているのに光には生じないことがある。これはどちらの刺激がその生体に取って顕著かを示している。これを条件付けにおいて一方が他方を「隠蔽」した、という。

 


【阻止】

たとえば、光という中性刺激に条件付けを行って唾液反射の条件刺激とした場合、そのあとで第二の刺激であるブザーと光の複合刺激を提示しても、第二の刺激がほとんど条件刺激としての機能を獲得しない現象である。

 


【古典的条件付けの適応的意義】

古典的条件付けは、重要な無条件刺激の予兆を生体が学習する過程である。こうした過程は、食物を口中に入れるよりも前に、既に口内の状態を適切にしておくことに役立つのである。たとえば、ネズミが猫などの危険な捕食者の接近を猫の匂いやあしおとで検知することができれば、猫が接近するよりも前に不動状態(うずくまって動かない)をとったり、巣に逃げ込む条件反射によって、より安全にその危険をやり過ごすことができる。

 


→条件刺激が出現したということは、その直後に無条件刺激が来るであろうことを予測させるような出来事である。もしも、無条件刺激が到来することを事前に察知することができるとしたら、動物はより早く確実に準備的な行動をとることができる。だからこそ、古典的条件付けという学習システムには適応的な意義があるのである。

 


【系統的脱感作(かんさ)】

古典的条件付けは、人間の恐怖症や依存症、異常な性的執着などの問題行動にも関連している。これらは経験により強い不快や快の情動的反応が特定の刺激に条件づけられたものと考えられる。これらの治療法として、系統的脱感作などがある。これはクモの小さい模型など、恐怖反応を引き起こさない極めて弱い状態から提示し始めて、患者が平静を保てていることを確認しながら少しずつ刺激強度を高めていき「条件づけられた恐怖反応」を「消去」していくという方法である。なお、これはいわゆる行動療法のひとつである。

 

 

 

【拮抗条件付け】

依存症、異常な性的執着の治療に対しては拮抗条件付けという手法がある。これは依存や執着の対象となっている当該刺激と「嫌悪を生じさせる無条件刺激(たとえば催吐剤(さいとざい)や電撃)」を対提示することにより、当該刺激に連合した快の情動を打ち消す手法である。ただしこれは当然、人権問題になる。

 

 

 

 


<⑵-ⅱ-2.オペラント条件付け>

 


【言葉の定義】

「随意的に制御できる行動」がオペラント行動である。

「オペラント行動が自発されるための環境側の必要条件」が弁別刺激である。

オペラント行動は、「3項目随伴性」で記述される。3項目随伴性とは、①弁別刺激、②オペラント反応、③オペラント反応に後続して起きる強化刺激の3つである。

 


【車の運転というオペラント行動】

車の運転はオペラント行動である。この場合、信号が青になるのは①弁別刺激で、ブレーキから足を離してアクセルを踏むのが②オペラント反応。ここで、オペラント反応をドライバーが自発するかどうかは主体の意志に任されている。そして、アクセルペダルを踏むと車が進むのが③強化刺激である。弁別刺激は、あくまでオペラント反応というある特定の行動に機会(きっかけ)を提供しているに過ぎない。また、ガス欠で車が動かなくなればドライバーはそれ以上アクセルを踏まなくなる(このように、反応の強さがオペラントレベルに戻ることを指して「消去」と呼ぶ。)のであって、アクセルを踏むのはそれによって車が動くからでありその限りででしかない。

 


【ソーンダイクの実験】

ソーンダイク(1911)は「問題箱」と呼ばれる箱に動物を閉じ込めた。最初のうち動物は闇雲に動いていたが、そのうちに偶然しかけが外れて脱出した。これを繰り返すと無駄な反応は減少して閉じ込めるや否や脱出するようになった。「快を得られるものは強められ、不快をもたらすものは弱められる」法則をソーンダイクは、「効果の法則」と呼び、この学習を「試行錯誤」と呼んだ。効果の原理を使った学習を現在はオペラント条件付けと呼んでいる。オペラント条件づけでは、個体は反応を環境から良い結果を引き出そうとする道具として用いていると考えることができるため道具的条件付けと呼ばれることもある。オペラント条件付けには、「オペラント反応に後続して、何かが出現し、それによってオペラント反応が強められるパターン」と、「オペラント反応に後続して、何かが消滅し、それによってオペラント反応が弱められるパターン」とがある。

 

 

 

【オペラント強化と、罰と、消去の違い】

オペラント条件付けの原理はスキナー(1938)によって整理されて体系化された。オペラント条件づけの成立する要件は、反応が自発された後に環境の変化が生じることである。これは古典的条件付けが、反応の結果には影響されなかったことと好対照である。反応が自発された後に環境の変化が生じて反応が強められることを「オペラント強化」と呼び、環境変化の結果、逆に反応が弱められることを「罰」と呼ぶ。また、条件づけられたオペラント反応がもはや環境の変化を引き起こさなくなるとその反応の強さが条件付けを始める以前の強さ(オペラントレベル)に戻る。この手続き、あるいはこの手続きによって生ずる反応強度の復旧をさして、「消去」と呼ぶ。反応が強化されていた場合には消去によって反応はオペラントレベルまで減少し、反応が罰されていた場合には消去によって反応はオペラントレベルまで増加する。

 


ゲームセンターでコインを入れてからのボタン押しの回数で考えると分かりやすい。コインを入れる前に試しに操作してみる時のボタン押しの頻度をオペラントレベルとすると、コインを入れてから、ボタンを押すとキャラクターを操り、望ましい結果が得られるならばボタンを押す頻度は増加し強化される。コインを入れてから、ボタンを押すと望ましくない結果が得られるならばボタンを押す頻度は減少し罰される。ゲームの制限時間が来てボタンを押しても何も起こらなくなると、消去が起きて、ボタンを押す頻度はオペラントレベルに戻る。

 

 

 

【刺激性制御】

オペラント条件づけでは、環境側の必要条件、すなわち弁別刺激が整えられると個体は反応を自発する。その意味では、反応が自発するか否かはあくまでその主体に委ねられている。しかし、弁別刺激を提示すると、その個体に当該の反応を自発するように促すことができるので、弁別刺激は個体の行動を制御する一要因になっていると考えることができる。このように弁別刺激を与えるかどうかによって個体のオペラント反応の自発を制御できることを「刺激性制御」と呼んでいる。①交差点で青信号に従って動き出したり、赤信号に従って止まったり、②挨拶をしたりするのは、弁別刺激による制御(刺激性制御)を受けた行動であると考えることもできる。

 


【「条件反射で居酒屋に入ってしまった」は言葉の誤用】

「酒好きの人が旅先で赤のれんを見るとその店に入ってしまった」という場合に、「弁別刺激」が「条件刺激」となって「条件反射」を誘発しているように見える場合がある。しかし、この場合、「赤のれんをくぐる行動」はオペラント行動である。反射行動ではないので自発しない意志があれば止められるはずである。

 

 

 

【強化と罰には4種類ある】

 


「強化」はオペラント反応を強め、「罰」はオペラント反応を弱める。

強化と罰には、①正の強化と②正の罰と、③負の罰と④負の強化がある。

 


①オペラント反応に後続して提示され、オペラント反応の「結果」としてそれが提示されるとオペラント反応を強める強化刺激のことを「報酬」または「正の強化刺激」または「正の強化子」と呼ぶ。そして、これによって反応が強められることを「正の強化」と呼ぶ。

 


②オペラント反応に後続して提示され、オペラント反応の「結果」としてそれが提示されるとオペラント反応を弱める強化刺激のことを「罰子」または「嫌悪刺激」または「負の強化刺激」または「負の強化子」と呼ぶ。そして、「負の強化子」によって反応が弱められることを「正の罰」と呼ぶ。

 


③オペラント反応の「結果」として、「正の強化刺激」を剥奪したり提示を遅らせると、反応は弱められ、これを「負の罰」という。

 


④オペラント反応の「結果」として、「負の強化刺激」を剥奪したり提示を遅らせると、反応は強められ、これを「負の強化」という。

 

 

 

①→「上手にお手ができた犬におやつを与える」のが「正の強化」。

②→「家具をかじった犬を叱る」のは「正の罰」。

③→「犬が吠えると食事を片付ける」のは「負の罰」。

④→「犬が機嫌の悪い飼い主から隠れるようになる」のは「負の強化」。

 


→負の強化は罰ではなく強化であり、強化であるならばオペラント反応は強められる。

→犬が機嫌の悪い飼い主から離れるというオペラント反応をすると、それによって機嫌の悪い飼い主に叱られるという「嫌悪刺激」が提示されることは無くなるか、あるいは遅れる。これによって、このオペラント反応は強化されるのである。

 

 

 

【子どもや犬のしつけ等で罰を使用してはいけない理由は全部で7つある。】

 


→まず確認しておこう。オペラント条件付けとは、「弁別刺激(例えば青信号)」をきっかけにして生じるオペラント行動(=随意運動)である「オペラント反応(例えば「アクセルを踏む」)」の結果として提示される「強化刺激(例えば車の発進)」によって、当該の「オペラント反応」が「オペラント強化」されるような、学習過程のことである。

 


→例えば、笛を吹いたら「おすわり」をすることを、おやつを使ってイヌにオペラント条件付けするとしよう。この場合、笛の音は「①弁別刺激」であり、おすわりをすることが「②オペラント反応」であり、それに後続しておすわりをしたことの結果として理解されるべきものとして提示されたおやつが「③強化刺激」である。そして、この①と②と③が全て揃っていることを「3項目随伴性」と呼ぶ。

 


→ところで、そもそも「罰」は「罰を与える側にとって望ましくない行動」をすぐに減少させることが多い。これが「正の強化刺激」となって、この「罰を与える」という行動は「オペラント強化」される。つまり、罰を与える側の罰を与える随意運動は「オペラント強化」されやすい。そのため、人はついつい、「しつけ」において「正の罰(嫌悪刺激の提示)」や「負の罰(報酬の剥奪)」を使いがちになってしまうという構造がある。では、「罰」を使うことの何がそんなにいけないのか。以下の7つの問題があるからである。

 


⑴第一に、罰は、身体的、精神的に学習者を傷つけることにつながり、倫理的な問題を引き起こしやすい。また罰が倫理的な問題を引き起こしやすいことがよく知られているため、罰を与える時に弱い強度の罰からスタートされやすい。

 


⑵第二に、罰は、「望ましくない行動をさせないようにする」のには有効だが、「望ましい行動をするように導く」のには有効でない。というのも、罰は「何をしてはいけないか」を指示はするが、「何をすればよいか」は指示できない。よって、罰を与えられることによって学習者は積極的な行動が取りにくくなるかもしれない。

 


⑶第三に、罰は、繰り返すとその効果が弱くなっていくことが多く、同じ効果をあげ続けるには罰を強くしていかなければならない。しかもその際に、段階的に罰の強度を高めていくと、かなり強い強度の罰でさえも効かなくなる。倫理面への配慮から、人はついつい最初は弱い強度の罰でスタートしてしまいがちなのだが、それは罰に対する学習者の慣れを生んでしまう。そこからさらに、更なる倫理面への配慮から、罰の強度を一気に上げず、徐々に罰の強度を高めていくということもまた起きやすい。そうすると、学習者には罰への慣れがかなり高い強度まで生じえてしまう。弱い罰からはじめて徐々に強度を上げていくと、かなり強い罰でも効果を持たなくなる場合がある。これを防ぐには、最初から非常に強い強度の罰を与えればいいのであるが、そのような強度の設定は誰にとっても容易なことではない。

 


⑷第四に、罰が来なかった時、学習者にとっては、「望ましくない行動をしなかったから罰が回避できたのか」、それとも、「もう罰は来なくなったのか」がわからないということである。そのため、学習者は再び同じことをしてしまうことが多い。例えば、子どもが何か先生にとって望ましくないことをすると、罰として先生がその子どもにビンタをする教室があるとして、ある日子どもが遅刻をした時に、先生がその子どもにビンタをしないと、子どもからしたら「遅刻は先生にとって望ましくない行動ではなかった(もしくはなくなった)からビンタが回避できたのか」、それとも、「遅刻は先生にとって望ましくない行動ではあるがビンタはもう来なくなった」のかがわからない。だから、遅刻することが先生にとって今はどういう行動であるのかを知ろうとして同じ行動は再び繰り返される場合がある。

 


⑸第五に、罰が来る場面には、先生や親の存在など、はっきりした弁別刺激が伴っていることが多い。それゆえ、たとえ罰を与えることによって望ましくない行動がみるみるうちに減ったとしても、それは弁別刺激があるときだけに限られる場合が多い。弁別刺激がないところでは、望ましくない行動をするかもしれない。つまり、コソコソと隠れて悪事を働くようになるかもしれない。

 


⑹第六に、罰は、学習者に学習にとって好ましくない行動を引き起こしがちである。例えば、罰でしつけられた犬の場合には、ストレスから、「テイルチェイシング」のような、「自分の尻尾を追いかけてうなる行動」を取ることが多くなる。人間の子どもの場合も、「顔をピクピクと動かす」というチック症に似た症状が出ることがある。これらの嫌悪的な反応は、望ましい行動の出現を妨害する可能性がある。

 


⑺第七に、学習者は罰を回避するために、罰を与える仕掛けを壊したり、罰を与える訓練者を攻撃したりする可能性がある。学習者にとっては、これは究極の解決策になっており、学習者からしたらそのことが合理的な行動だと思えるかもしれない。また、そのことによって訓練者も損害を被る。

 

 

 

以上のように、罰を使用する学習は非常に難しく、罰を使用する学習に熟達するよりも、罰を使用する学習自体を避ける方が賢明である。

 

 

 

【条件性強化刺激とは何か】

動物には生得的に強化刺激として機能する刺激がある。空腹の動物に対しては食物、喉が乾いている動物に対しては水、性的活動期における異性などがそれである。これらは一括して一時性強化刺激と呼ばれる。そして、一時性強化刺激と対提示された刺激、一時性強化刺激の到来(これからやってくること)を示す刺激、一時性強化刺激と交換可能な刺激も強化刺激としての機能を発揮する。これを二次性強化刺激あるいは、条件性強化刺激と呼ぶ。

 


【条件性強化刺激と汎用条件性強化刺激の違いは何か】

ここが重要なのだが、条件性強化刺激はあくまでもそれを支える一時性強化刺激が強化機能を持つその限りにおいてのみその強化機能を発揮する。例えば、お手をするとおやつがもらえる場合に、そのおやつと対提示されるクリック音は強化機能を持つが、それは飽食した直後には強化機能を持たない。しかし、例えばお金や商品券のように、その時の動因の状態とは無関係に常時強化機能を発揮し、それを収集すること自体が目的となるような強化刺激もある。これが汎用性強化刺激である。

 

 

 

【オペラント条件付けにおける刺激般化】

例えば、笛を吹いたら「おすわり」をすることを、おやつを使ってイヌにオペラント条件付けするとしよう。この場合、笛の音は「①弁別刺激」であり、おすわりをすることが「②オペラント反応」であり、それに後続しておすわりをしたことの結果として理解されるべきものとして提示されたおやつが「③強化刺激」である。この時、いつもとは違う音色の笛を吹いてみよう。そうすると、犬は少し戸惑うけれどもやはりおすわりする。このように、学習時の弁別刺激に類似した刺激にたいしては、学習したオペラント反応が少し強度は弱まるにせよ出現するのである。これを刺激般化という。このような曖昧化には適応的意義があることは既に述べた。そもそも同じ笛であってさえ、その音色は毎回異なるのであって、もし仮に「①弁別刺激」が飼い主の声であれば、その一回ごとの変化はさらに大きいわけである。そして、おすわりは普通、飼い主の声を弁別刺激として訓練される。学習があまりにも特定の刺激に厳密に限定されてしまうと応用が効かなくなるのである。

 

 

 

【オペラント条件付けにおける分化強化とオペラント弁別】

通常は刺激般化の及ぶ範囲内のよく似た刺激であっても、2つの類似した刺激のもとでオペラント反応の強化の仕方を変えると、反応の生じ方を変えることができる。この手続きを分化強化とよび、分化強化によって反応の仕方に違いができた状態をオペラント弁別と呼ぶ。例えば、笛Aの音を聞くと、おすわりをすることを強化し、笛Bの音を聞くと伏せをすることを強化すると、この分化強化によってオペラント弁別を成立させていることになる。

 

 

 

【オペラント条件付けの最大の弱点とそれを克服する4つの手段】

オペラント条件付けの最大の弱点は、オペラント反応というのはあくまでも動物が自発するものなので、古典的条件付けのように当該の反応を動物の意志とは無関係に確実に生起させる手段がないということである。もし犬が自発的におすわりをしてくれなければ、そのおすわりをオペラント強化することはできないのである。だから、でたらめに放置しておいてもなかなか出現しないような反応を作り上げてそれをすかさずオペラント強化するためには様々な方法が考案されている。以下の4通りがその代表である。

 


①誘発法

②成型法

③模範提示法

④逐次接近法

 


以上の4通りのうち、

 

 

 

 


【①誘発法】

→①誘発法とは、例えば、犬に「おすわり」と言いながら、おやつを持った手をイヌの目の前で上に向けて動かすと、イヌの顔はそれを追って上を向き、それに伴っていわゆる「おすわり」の姿勢に移行する。そこですかさずオペラント強化をすると、おすわりをオペラント条件付けできる。この時、強化の方法はおやつ以外のなんでも良くて、「褒める」や「クリッカーを鳴らす」でもよい。これによって、おやつがない時でも犬は手の動きと「おすわり」という弁別刺激によっておすわりをするようになり、これでおすわり学習は成立する。

 


【②成型法】

→②成型法とは、学習者の手や足をとって必要な介助を行なって、それを達成したら強化する方法である。たとえば、お手を教える時には最初は「オテ」と言いながらイヌの前足をとって持ち上げ、それを強化する。徐々に介助を減らしていくとついには合図に対して自発的に手を持ち上げるようになるのだ。ただしこの方法は、訓練者と学習者の間に信頼関係が必要となる。

 

 

 

【③模範提示法】

→③模範提示法は、学習者の前で形成した行為を訓練者が演じて見せることである。ヒトのように模倣が安定して生じる学習者であればこの方法は非常に効果的である。しかし、一般にヒト以外では模倣というのはそれほど容易には生じないので、適用できる学習者の範囲は限られる。

 

 

 

【④逐次接近法】

→④逐次接近法とは、学習者の行為のレパートリーの中から、目標となる行動に少しでも近いもので、かつ比較的生起頻度が高いものを選び出して、それを強化することから始めて、徐々に目標行動に近づけていくことである。ただし、これはそんなに単純な学習では全然ない。ポイントは、基準を上げる時にすかさず一個前の基準の行為を「消去」することである。

 


例えば、「犬に新聞受けから新聞をとってこさせる場合」を考えよう。

まず、犬が新聞受けの方を一瞬見たら、すかさず褒めるのである。

これを何度か繰り返せば犬は何度も新聞受けを見るようになる。

そうしたら今度は基準を上げて、新聞受けまで近づくと褒めるようにするのである。

次に新聞を口に加えたら褒め、それを持って戻ってきたら褒めるように基準を変えていく。

これが逐次接近法である。

 


しかし、その基準を上げる際には、必ずその前までの基準の行動を「消去」することが大事である。

我々人間も、テレビのリモコンを押しても画面に何もうつらなければ、リモコンを振るなどの「探索行動」をする。それと同じように、あるオペラント反応をするという基準をクリアしているのに、それまでもらえていた強化刺激がもらえなければ、そのオペラント反応は通常オペラントレベルにまでゆっくりと消去されていくのであるが、その際に、学習者は様々な探索的行動をするのである。つまり「消去」は行動の変異性を増すので、それらの変異の中に次の基準を満たすか、あるいはそれに近い行為が出現する可能性は高くなるのだ。これがポイントである。

 


【なぜおやつではなくてクリッカーなのか】

→また、犬のしつけにおいては、「強化刺激におやつを使う」のはあまり賢明ではない。なぜならば、おやつだと、①おやつがなくなるかもしれないし、②満腹になるかもしれないし、③強化したい行動の直後に即座に与えることができずに思わぬ行動が強化されてしまうかもしれないからである。だから、まずは確実な「条件性強化刺激」を提示して、それが貯まったら、後からゆっくりおやつをなどを与える方が良いのである。より確実な条件性強化刺激としては「クリッカー」がある。クリッカーは、クリック音で即座に、犬のオペラント反応を肯定することができる。

 

 

 

【オペラント反応は毎回強化を与えられなくても維持できる】

オペラント反応は、一回自発されると一回強化を与えなければいけないようなものでは必ずしもない。そのことを利用して、「強化スケジュール」を考えることができる。

 


縦軸に反応の累積数、横軸に時間経過を書いたロール紙である「累積記録機」を使えば、反応が全くない時には描かれる線は紙と平行になり、反応が高頻度で生じている時には累積記録が切り立ったものになるような、線が描ける。これにより反応の加速や減速が一目で分かるのである。

 

 

 

①反応を毎回強化するスケジュールが「連続強化」(Continuous  Reinforcement )である。

②反応を時折強化するスケジュールが「間歇強化」(Intermittent Reinforcement)である。

「間歇強化」の別名が「部分強化」(Partial Reinforcement)である。

 


オペラント反応を消去しようと思った時に消去にかかる時間や反応回数のことを「消去抵抗」と呼ぶ。

 


では、実際問題、オペラント反応を消去しようと思った時に、「①連続強化された場合のオペラント反応」と、「②間歇強化された場合のオペラント反応」とで、消去抵抗はどちらが大きいか。正解は、「②間歇強化された場合のオペラント反応」である。直観的には、①連続強化された場合のオペラント反応だと答えたくなるが、間歇強化された反応の方が遥かに消しにくいのである。間歇強化の方法は無限にあるが、代表的なものは以下の4種類である。

 


1.Fixed-ratio

2.Variable-ratio 

3.Fixed-interval 

4.Variable-interval

 

 

 

【①固定比率のスケジュール】

固定比率(Fixed-ratio)スケジュールは、反応が定められた回数溜まると強化刺激がもらえるような間歇強化のスケジュールである。固定比率強化の特徴は2つある。ひとつめは、「強化後休止」である。強化後休止の長さは、要求されている回数が多ければ多いほど長くなる。ふたつめは、「休止と連続作業(Pause and Run)」である。強化後休止とは、強化の後に反応が生起しなくなる期間があることで、「休止と連続作業」とは、反応が一旦始まると、要求された回数まで反応がやすみなく一定の反応率で進むことである。日常場面では「歩合給」や「ポイントが一定ポイント溜まると商品と交換できるサービス」や、「自動販売機に10円だけを入れて同じジュースを何本も買う行動」などがこれにあたる。

 

 

 

【②変動比率のスケジュール】

変動比率(Variable-ratio)スケジュールは、強化されるために必要な毎回の要求回数は一定しておらず、毎回何回目に強化されるかは学習者には分からないのだが、反応が平均して定められた回数溜まった時に強化が与えられるような間歇強化のスケジュールである。このスケジュールだと固定比率での強化に見られるような反応休止がほとんど生じることがない。強化直後からほぼ一定の高い時間あたり反応率、つまり一定高率で反応が持続する。

 


→パチンコやスロットは、ある確率で「当たり」という名前のオペラント強化が行われるが、いつそれが出現するかは予測できない。このスケジュール下では、長期間強化がされなくても非常に長い間反応は維持され、消去抵抗は非常に高くなる。一旦消去されても、一度反応が強化されると反応はすぐに元に戻る。ギャンブルの恐ろしさの本質はこのスケジュールにある。

 


【わがままなのは子供のせいなのか問題】

→子供が何度も駄々をこねると、多くの親は根負けして何回かに一回おやつを買い与えるが、これは「駄々をこねる」というオペラント反応を変動比率で間歇強化していることになる。おやつを買ってもらえるために必要な駄々をこねる回数が一定していないので、強化後休止も起こらない。駄々をこねる反応が何回目で強化されるかはわからないのでこれは変動比率での強化である。わがままは子供のせいではなく、親がそれを訓練しているのである。「わがまま」の場面は、子供にとってみれば何度か駄々をこねると何回目かで時々報酬が手に入るという学習場面なのだ。

 


【③固定間隔のスケジュール】

固定間隔(Fixed-interval)スケジュールとは直前の強化から一定期間が経過した後の最初の反応に強化が与えられるような間歇強化のスケジュールである。このスケジュールでは、強化の後しばらくは反応が出現しないが、時間経過に伴って少しずつ反応の出現率が上がり、強化の直前が最も反応回数が多くなる。そのため累積記録は特徴的なホタテガイの殻の形になるため、スキャロップパターンを描くと言われている。10分間隔でくるバスが来てからしばらくは反応は止み、また8分めくらいからまた反応が加速しだすのである。

 


→日常的には一定間隔でくるバスを待っている時にバスのくる方向を見る反応や、風呂のお湯張りで様子を見に行く反応の回数や、オーブンでお菓子を焼いていて様子を見る反応の回数などがこれにあたる。

 

 

 

【④変動間隔のスケジュール】

変動間隔(Variable-interval)スケジュールは、不一定の時間が経過し、直前の強化から「平均して」ある一定の時間が経過した後の、最初の反応に強化が与えられるような間歇強化のスケジュールである。日常では「全然一定間隔でこないバスのくる方向を見る行動」や、「話し中であることが多いお客様相談室への電話をする行動」などがこのスケジュールに近い。このスケジュールでは、②変動比率での強化とは好対照をなして、たとえ反応率が高くても強化の数にはほとんど影響がないので、一定低率で反応が生起する。消去抵抗は変動比率強化と同じく非常に高い。

 


→「雨乞い」と「降雨」には因果的関係がない。雨乞いという「反応」はそれに対する強化の回数に直接関係がないから、雨乞いはそう頻繁には行われない。しかし、非常に長いタイムスパンで見てみれば、ある低頻度なペースで雨乞いをしていると、雨はでたらめなインターバルで、つまり間隔が非一定に、降る。そうすると、「雨乞い」が強化されるのである。つまり、この「雨乞い」は変動間隔スケジュールでの強化を受けることになるのだ。

 

 

 

【なぜ我々は縁起を担ぎ、おまじないをして、雨乞いをして占いをするのか】

「発話と実現との間にたとえ客観的な因果的確証がなかったとしても、実現するたびに人間は、(妥当なものかどうかは別として)原因を想起し、また、実現されないならば原因を等閑に付し、探ろうとしない。この非対称性にもとづいて、実現時には発話をその原因として特定、想起し、「やはり口にしたからこうなったのだ」という主観的確信を深めることになる。(占い一般にも同様の構造が観察される。)」(木田直人著「砲丸のように言葉を投げること」p54より引用)

 

 

 

→日頃我々は、縁起を担いだり、おまじないをしたりといった、様々な奇妙な行動をとる。多くの人々は、それらが非科学的な行為であることを認識しているにもかかわらず、やめようとしない。このことの理由の一部は、「オペラント条件づけ」と「強化スケジュールの効果」で説明することができる。スキナー (Skinner 1948)は、ハトを実験箱に入れ、ハトが何をしようが無関係に15秒に一度、食物を提示した。するとハトは、ひたすら待っていればよいだけであるにもかかわらず、ぐるぐる回る、床をつつくなどの、個体によって異なるさまざまな行動を繰り返し見せるようになったのである。スキナーはこれを、食物の提示前に生じていた反応が偶然強化された結果であると考え「迷信行動」と名づけた。いったんこうした無意味な行動が強化されると、その出現頻度は高まり、その結果さらにその行動が強化される機会が多くなる。多くのルーティーンはこのような偶然の強化の結果生じたものかもしれない。しかもこうしたルーティーンは、強化との因果関係はないのだから、毎回強化されるわけではなく間歇強化を受けるのである。そうすると、こうした迷信行動はますます強固になっていく。「雨乞い」や「人柱(ヒトバシラ)」やさまざまな宗教的儀式も、もとをたどればこのような偶発的強化によって形成されたものかもしれない。

 

 

 

 


【学習の生物学的制約】

1960年代までは、「学習の一般性(学習を研究するには動物はなんでもよいという考え)」が主張されていたが、1960年代以降は、それに反する事実が次々と明らかになった。

 


→まず、学習は自由に起こせるものではなく、種が持っている生物学的特性から強い制約を受けるものだったのだ。

→学習は、刺激によって学習の速度が著しく変わるし、反応と刺激の組み合わせによって学習の効率は大きく変わる。

→学習は、年齢や個体性によって制約を受け、弁別刺激や反応の形態や強化刺激にかかわらず同じように学習が進むわけではなかったのだ。制約によっては、学習途上で学習行動が瓦解してしまうこともありうる。

 


【食物嫌悪学習】

選択的連合は、ガルシアら(Garcia, Ervin, & Koelling, 1966)は、1966年のラットの「食物嫌悪学習」の研究で、選択的連合を提唱した。甘みのついた水を飲ませてから22分後に食あたりを起こす薬物をラットに注射すると、翌日にはラットは甘味水が食あたりの原因であるかのように甘味水を拒否するようになったのである。

 


→これは手続きだけ見ると「古典的条件付け」とよく似ている。甘味水は「中性刺激」であり、「食あたり薬物」は「無条件刺激」であり、それらの「対提示」によって甘味水が「条件刺激」となった結果、ラットは「甘味水」を条件反射的に避けることを学習したと考えることができる。しかし、このように「古典的条件付け」で理解すると不可解なことが以下の3つある。

 


①[反復の不在]第一に、中性刺激と無条件刺激の対提示の反復こそが古典的条件付けによる学習の条件であったにもかかわらず、この場面に反復は不在である。

②[間隔の広さ]第二に、古典的条件付けでは中性刺激と無条件刺激の対提示は時間的に二つの刺激が近接していなければならないはずであるが、しかしこの実験では「中性刺激である甘味水」と、「無条件刺激である薬物」との間に22分もの時間が挿入されている。

③[なぜ甘味水なのか]第三に、「無条件刺激である薬物」と時間的に近接している刺激は注射針であったり、実験者の手袋であったり、実験者の白衣であったりしてよいのに、なぜ無条件刺激と連合したのはそれらから時間的に遠く離れた甘味水だったのか。

 


→これらをそれぞれ①学習の早さ、②遅延の長さ、③連合の選択性と呼ぶ。

 


【選択的連合】

選択的連合とは、連合学習の中に、1.結びつきやすい刺激と刺激のペアや、2.結びつきやすい刺激と反応のペアがあり、反対に1'結びつきにくい刺激と刺激のペアや、2'結びつきにくい刺激と反応のペアがあることである。ガルシアら(Garcia & Koelling, 1966)は、上記の③の問題の本質である「選択的連合」が生じていることを次のような実験を行なって示した。まずラットを4つの群に分けて、次のように操作をしわけた。

 


第一群のラット:甘味水を与える→X線で気分を悪くさせる

第二群のラット:甘味水を与える→電気ショック

第三群のラット:光と音が出る無味な水→X線で気分を悪くさせる

第四群のラット:光と音が出る無味な水→電気ショック

 


→この結果、いずれの群も特徴のある水を飲んで不快な思いをしているのに、水の摂取量が減ったのは、第一群と第四群だけだったのだ。逆にいうと、第二群と第三群のラットは甘味水の摂取量は減らなかったのである。

 


→これは何を意味するのか。味は気分の悪さにその原因として後から指定されやすい一方で、音や光は電気ショックにその原因として後から指定されやすかったのである。これを指して選択的連合と呼ぶ。気分が悪くなる反応は味という刺激と結びつきやすく、電気ショックという刺激は光や音と結びつきやすかったのである。

 


→このほか、飲食物を食べて食中毒を起こすとその飲食物を嫌悪するようになる学習が広範な種で見られ、しかもそれによって「もともと中性刺激だったものを条件刺激に変化させる(=条件づける)」ことができるのは食物の味だけでなく見た目や匂いなどもあることから、これは当初「味覚嫌悪学習」と呼ばれていたが、今では「食物嫌悪学習」と呼ばれているのである。食物嫌悪学習は上述の通り「古典的条件付け」によく似ているが、①学習の早さ、②遅延の長さ、③連合の選択性から鑑みて、特別なタイプの学習類型と考えてもよい。

 


→これは人でも生じる。ガンの化学療法や、放射線治療を受けて気分が悪くなると、思いもよらない食材が嫌悪されるようになることがある。他にも、理由がわからないがどうしても食べられない食材がある場合、生涯のどこかの時点でその食べ物に対する嫌悪が学習された可能性があるのだ。

 


→たとえその食べ物が原因でなくても、その時偶然引いていた風邪で、その食べ物を食べた後に気分が悪くなると、因果関係がそこにはなくても、その時に食べた食べ物が嫌悪されるようになるということがあり得る。この学習は、アルコール依存症やニコチン依存症の治療にも応用が可能だが、人権に配慮しなければ大変なことになる。飲めない人が無理して飲んで吐くことを繰り返すとお酒が嫌いになるのである。

 


【オペラント条件付けにおいても選択的連合は生じる】

→シェトルワース(shettleworth, 1975)は、1975年の研究で、ゴールデンハムスターの様々な行動を、餌や巣材を用いて強化したり電気ショックで罰したりしてみた。そうすると、行動と強化刺激の組み合わせによって、学習の容易さが大きく異なっていたのである。「後肢(こうし)立ち」は食物や巣材で容易に強化できるが、電気ショックではほとんど減少しなかった。逆に、「顔洗い」は、電気ショックで容易に減少するが、食物や巣材では増えなかった。同じオペラント行動でも、報酬で増えやすく罰で減りにくい行動と、罰で減りやすく報酬で増えにくい行動があるのだ。

 


ラクリンの実験】

→さらに、行動だけでなく、文脈も学習に影響する。ラクリンの1969年の実験によると、スキナーの有名な実験でおなじみのように、キーをつついて餌を手に入れることを容易に学習するはずのハトが、キーをつついて電気ショックを切ることを学習するのは非常に困難であることがわかったのである。一方で、壁から出たキーを翼で叩いて電気ショックを切ることは容易に学習した。ここでポイントなのは、キーをつつくこと自体は、ハトにとって容易な行動であるはずであり、なぜ特定の文脈ではそれが難しくなるのかということである。

 


【種特異的防御反応】

→この問いにボウルズ(Bolls, 1970)は1970年に一応、答えた。回避学習の容易さには、その種が示す生得的な防御反応(種特異的防御反応)が関係しているとボウルズは主張している。鳩は電気ショックを受けると翼をバタつかせて暴れまわるが、このハトの種特異的防御反応は、翼でキーを叩くことと拮抗していないので学習が容易だが、キーをつつくことはこの反応と拮抗しているので学習が容易ではないのだ。

 


→これも、ある刺激とある反応の間に連合しやすいものとそうでないものがあるという選択的連合の例である。

 


→人間にも種特異的防御反応は存在する。たとえば、「地震が起きたらまずは落ち着いて火を消して、落ち着いてガスの元栓を閉めなさい」とよく言われるが、それを学習するのは難しい。なぜなら、種特異的防御反応であるパニックを起こしている(泣き叫ぶとかその場から逃げるとか)時に、「ガスの元栓を閉める行動」は「拮抗」するからだ。

 


→このように、ある中性刺激とある反応との学習による選択的連合は、ヒトにも見られるのである。

(→また、ある刺激と別の刺激との選択的連合も、人にも見られるのである。→食物嫌悪学習)

 

 

 

 

 

 

【本能による漂流とブレランド夫妻】

本能による漂流とは、訓練をすればするほど、学習が崩れていくという非常に興味深い現象のことである。学習研究の元祖バラス・スキナーのもとで学んだブレランド夫妻は会社を作り、そこでオペラント条件付けを用いていろいろな動物にショーをさせるビジネスをやっていた。そんなある日、ブレランド夫妻は、時折「強化の原理」がうまく働かなくなり、動物が思い通りに訓練できなくなることに気づいたのである(Breland &Breland, 1961)。

 


→たとえば、金鉱掘りに見立てた木片を拾って箱に入れると報酬がもらえるという訓練をしていたブタである。最初は豚の食欲も旺盛なので訓練は順調に進んだ。しかし、ブタが満腹になったわけではないのに、豚は次第に木片を箱には持って行かなくなったのである。むしろそのかわりに、ブタは木片を落として転がしては鼻すりをするようになったのである。鼻すりをしても報酬は貰えないしむしろ貰えたはずの報酬がどんどん遅延するのだからこの場合ブタの鼻すりは負の罰を受けている。それでもブタは鼻すりをやめなかった。

 

 

 

→アライグマもそうであった。アライグマにコインを拾わせて貯金箱に入れれば報酬を与える仕方で訓練をしていたのだが、ある時からアライグマはコインを貯金箱に「ひたして」それをゴシゴシと擦るようになってしまったのである。

 


→豚もアライグマも、木片やコインは単なる中性刺激であり、これらはただの「物体」であった。しかし、訓練を進めると、これらの物体はもはや「条件性強化刺激(=強化刺激の到来を告げる、強化刺激に代替可能なもの)」になってしまったのである。そうすると、本来は食物に対して示されるべき生得的な行動が、その食物の信号(すなわち条件性強化刺激)に対して示されるようになっていくのである。こうして学習は瓦解する。つまり、学習が瓦解して、生得的な行動パターンへと漂流していくのである。皮肉にも、学習を重ねれば重ねるほど、この漂流の効果は強力になっていくのである。強化の原理が、学習行動を壊す元凶になっていたのである。

 

 

 

→それで、ブレランド夫妻はどうしたのか。「サミー、なぜ踊る?」という題のニワトリの芸はその典型なのであるが、ニワトリ(チャボ)はジュークボックスのスイッチが入るとその上で足元を交互に引っ掻いて踊り出す。これは鶏が落ち葉や地面の下の虫を探す動作なのであるが、当初夫妻が計画したのは、ニワトリが音楽をじっくり聴くようにすることであったのだが、その音楽と舞台が条件性強化刺激になって生得的な本能についには漂流してしまったため、むしろ「踊る芸」であるということにしたのである。

 


→ヒトにも種全体としての固有な特性とその個人としての特性に応じて、「学びやすいこと」と「学びにくいこと」とがある。

 

 

 

【プログラムされた学習】

「古典的条件付け」と「オペラント条件付け」は、様々な予期できない環境変化に適応できるようになるための「一般的な学習の原理」なのであるが、しかし、自然界の動物たちはそんなに「一般的な学習」をしているのかというと、あまりそうではない。動物たちの学習の多くは、限られた時間の中で当該の種としての典型的な生活を送るためにどうせ必ず学習しなければならないものを確実に学習するときように「プログラムされた学習」になっている。

 

 

 

【グールドと蜜蜂】

グールド(Gould, 1982)は、蜜蜂が眠っている間に、巣箱を何マイルも移動させてみた。そうすると蜜蜂は大混乱になるかというと、ならなかったのである。ところが、ミツバチが巣から飛び出していったそのあとで、帰ってくるまでの間に巣箱を移動すると、その移動距離が数フィートであっても、大混乱になったのである。

 


→蜜蜂は人間がショッピングモールまでの道筋を長期的に覚えているような仕方で経路や情景を長期的に覚えているのではないらしい。

 


→蜜蜂は、巣から飛び出した後、体軸を巣に向けたまま左右に繰り返しとぶ。そして次第に距離をとってから巣から離れていく。蜜蜂はこの飛行によって巣の周りに何があるのかを1日に一回記憶しているらしい。そのとき前日までの記憶は綺麗さっぱり消えて書き換えられているのだ。自然界では外部の情景は予告なく変わる。嵐が来れば一変するだろう。こうした状況では、毎日一回情景を書き換え学習するようにプログラムされているほうが賢明ではないだろうか。だから、グールドが数マイル移動させたのは単なる嵐や自然災害に相当するものでしかなかったのだ。こういう時、毎日一回の学習は非常に有効なのだ。

 


【べーレンズとジガバチ】

ジガバチは、10個程度の巣の中に発達段階の異なる幼虫を住まわせ、毎日その幼虫の大きさに合わせた獲物を取ってきて餌付けする。ジガバチは毎朝、全部の巣を訪ねて、幼虫の様子を調べてから狩りに出発し、戻ってきて餌付けをする。では、ジガバチは長期的に巣穴の場所と幼虫の大きさの関係を記憶しているのだろうか。ベーレンズ(Baerends, 1941)は、試しに、親が朝、大きさチェックに来る前にこっそりと幼虫の場所を全て入れ替えてみた。しかし、その場合でも、戻ってきたジガバチはしっかりと幼虫の大きさにあった獲物を給餌したのである。ところが、親が朝に幼虫の大きさを調べた後に、つまり親が狩りに出かけてから戻ってくるまでの間にベーレンズが幼虫の場所を入れ替えると、親は入れ替えられる前の幼虫の大きさに従って給餌してしまったのである。つまり、ジガバチは、朝一番のパトロールの時に学習した巣穴の場所と幼虫の大きさの関係に従って行動しており、給餌時の幼虫の大きさは全く考慮されていないのだ。ハチは、給餌時に餌の大きさを調節できるわけではなかったのである。もし給餌時に「あなたは大きい子だからこれね」という具合に調整するのであれば「巣穴とそこに住む幼虫の大きさの関係」などというややこしいことを覚えずに済むわけだが、ジガバチは毎朝「巣穴とそこに住む幼虫の大きさの関係」を覚えることをプログラムされており、それに従った行動をしていたのだ。

 


→ハチ類の場所学習というのは、概して極めて高度なのであるが、「いつ、なにを、どのようにして学習するか」ということが既に限定されたプログラムに基づいて行われているような学習なのである。これは必要な作業を確実にこなすうえで、非常に効率がいい。

 

 

 

 


ローレンツと刷り込み(インプリント)】

皇居のカルガモの親子たちは、雛が生まれると親がいちいち雛のところまで餌を運んでくるような習性をカルガモが持たないため、家族で水辺に引っ越していき、そしてそれを警察官が車を止めるなどして援助する。そしてその映像が人間には人気である。親ガモの後を雛たちが歩いてついていくのである。ノーベル賞を受賞した動物行動学者のローレンツ(Lorenz, 1960)は、ハイイロガンを使って、ガンやカモやニワトリなどの孵化後すぐに自立し移動できる早成性(離巣性)のある鳥類のヒナが、孵化直後に見た、(できれば動く)物体に非常に強い愛着を示すことを「刷り込み(インプリント)」と呼んで研究した。

 

 

 

 

 

 

【刷り込みの特徴】

この「刷り込み」という学習には、いろいろと面白い特徴がある。

 


①第一に、「擦り込み」は、ただ一度の経験で生じ、学習は極めて容易で、安定して生じる。

②第二に、学習が容易に成立する「敏感期」と呼ばれる時期がある。ニワトリの場合には、孵化後数週間から48時間程度である。敏感期の間、完全暗黒にするなど刺激を一切提示しなければ、敏感期は少しの期間延長されるが、これを過ぎると学習は生じにくくなる。

③第3に、いったん学習が成立すると、それを別の刺激に再学習させることは難しい。

 


【刷り込みやすいものの好み】

刷り込みの対象は基本的に何でもよいが、刷り込みのしやすさにはある程度の選別があるようである。たとえばニワトリの場合、敏感期に赤いボールといった無意味な物体に刷り込むと、後にニワトリの剥製に刷り込み直すことがある程度可能である。しかしこの手順を逆にすると、つまり、ニワトリの剥製に刷り込んだあとに赤いボールに刷り込み直すことはできない。

 


→また、敏感期の間を完全暗黒で育てると、ヒヨコは、刷り込みが起きなかったのに、ニワトリの形態に対してある程度の追従反応を示すようになる。これらは刷り込みが万一失敗したときのバックアップ機構なのかもしれない。

 


【親子刷り込みと性的刷り込み】

刷り込みには、実は「親子刷り込み」と「性的刷り込み」という2つのタイプがある。「親子刷り込み」は上記の通り「養育者の学習」であるが、「性的刷り込み」は「性成熟後に繁殖活動をおこなう対象の学習」である。種によってはこれが同時に進行することもあり、ローレンツに刷り込まれたハイイロガンは、成鳥になってもヒトに求愛したという。つまり、ハイイロガンでは、親として刷り込まれた人の類が、性的対象としても刷り込まれるのだ。「性的刷り込み」は、一般には敏感期の開始が遅く、通常数ヶ月齢から始まり数週間続く(Gould, 1982)。 

 

 

 

→ガン・カモ・ニワトリなどは、孵化後すぐに自立し移動するので早成性(離巣性)があった。その反対の鳥類は晩成性(就巣性)と呼ばれ、性的刷り込みのほうは、晩成性(就巣性)を持つ鳥類でも生じる。

 


【さえずり学習】

島類のさえずりは、テリトリーの防衛と求愛のための重要な技能である。さえずりの獲得のメカニズムはそもそも種によってさまざまなメカニズムでおこなわれるようであるが、種によっては、厳格にプログラムされた学習がそれを決定していることもある。

 


【小西とミヤマシトド】

鳴禽類の1種ミヤマシトドで見られるさえずりの学習メカニズムが有名である。

 


→この鳥は、通常の場合、両親に養育され、幼鳥の時に父親のさえずりを繰り返し聞かされる。成長して最初の繁殖期が近づくと、ひなはさえずりの練習を始める。そして徐々に上達し、最終的に、父親のさえずりに似た音声でさえずるようになる。

 


→小西正一(Konishi,1965)は、この学習機構を明らかにするために、さまざまな実験操作をおこなった。まず、幼鳥時にミヤマシトドを隔離して育て、同種のさえずりを聞かせないようにすると、さえずりの練習をするんだけれどもまったく上達せず、自種の典型的なさえずりとは似ても似つかないものになってしまうのだ。

 


→さらに、幼鳥時に同種のさえずりを聞かせても、繁殖期が来る前に耳を壊して耳を聞こえなくし、自分の声が聞こえないようにすると、さえずりは練習するが完成はしない。つまり、この鳥のさえずりは、幼鳥時に聞かされたさえずりの記憶を繁殖期まで保持し、自分のさえずりを聞きながらその記憶に合わせるように調節していくことで初めて完成するのである。さらには、幼鳥時に聞かせるさえずりは、自種のものでなければならないらしく、近縁種のウタスズメのさえずりを聞かせても、全く効果はなかった。

 


→なぜ、ミヤマシトドがひなの時に聞いたウタスズメのさえずりの学習効果は、全然ないのだろうか。どうやら、聞かせるさえずりはなんでもよいわけではなく、ミヤマシトドはさえずりの原型を生まれつき持っていて、ヒナのときに聞くのが、その原型からあまりにも遠く離れたものであったら学習しないようになっているらしいのだ。

 


→つまりこのミヤマシトドの学習は①学ぶ対象(なにをまなぶか)、②学ぶ時期(いつまなぶか)、③学ぶ方法(どうやってまなぶか)、がすべて厳密にプログラムされているのである。

 

 

 

以上のような「学習の生物学的制約」や「プログラムされた学習」は、学習に枠をはめてしまっているから、学習の自由度を下げてしまうように思えるかもしれない。たとえば、学習にあらゆる自由度を与えて、何でもゼロから学習できるようにすれば確かにより柔軟に環境に適応できるように見える。しかし、実際には動物に与えられた時間や学習の機会は無限にあるわけではないので、生きていくために必要不可欠なことは、速やかに効率よく学ぶ必要がある。すべてをゼロから学ぶのでは、時間がいくらあっても足りない。何をいつどうやって学ぶかが決まっている方が素早く学習できるのである。つまり、「学習の生物学的制約」や「プログラムされた学習」は、動物たちが、必要なことを必要なときに確実に学習するために進化させてきた工夫なのである。だから、学習は生物学的適応形態の1つであり、種により、多様なものへと進化したと考えられる。逆に言えば、制約なき「一般原理による学習」は、この意味では、より予測の難しい環境変化に対応するための最終手段だと見ることもできよう。

 


【ヒトの学習だって生物学的制約から自由ではない】

学ぶに遅すぎることなしと言われるように、ヒトの学習は学ぶ時期には制限がゆるいと思われているし、フランス語を学ぶかドイツ語を学ぶかも選べるのだから何を学ぶかも選べるし、どうやって学ぶのかも選べる。だから、ヒトの学習は一般的には自由度が高い(生物学的制約がない)と考えられている。しかし、ヒトとして生きるための重要な技能には、やはり強い生物学的制約がかけられている。食物嫌悪学習もその1つである(食中毒になればその対象を素早く嫌いになり、対提示の反復は不要)し、言語の学習もそうである。

 


→ピアノは大人になってからの習得は難しいし、絶対音感も幼児期に訓練しなければ習得は難しい。

 


→言語は非常に複雑な体系であるが、しかし乳幼児は驚くほど容易にこれを学習する。実はこれにはヒト特有の非論理性が関係している。(正確には、非論理的な仕方で「決め打ち学習」するというヒト特有の学習仕方の制約が関係している。)

 

 

 

 


【乳児の音素の学習は無限にある音に境界線を引けるようになる学習ではない】

→6ヶ月未満の乳児に、rとlのような、音素の似た変化を聴かせると、それが母国語のものでなくても、音素に変化があったことに乳児は気付く。しかし、10ヶ月以降の乳児にrとlのような音素の似た変化を聴かせると、それが母国語のものでなければ(例えばその乳児の母語が日本語であれば)その変化に気がつかなくなる。母国語の音素の対にしか気付かないようになっているのだ。つまり、言語音の区別の学習とは、無限にある音の中に切り込み(境界線)を入れて音素として切り出せるようになっていくことではなくて、むしろ、既にあらかじめひかれた切れ込み(境界線)を消していく過程でもあるのだ。

→そもそも、人間の発声器官で出せる音声は無限ではない。発声器官の構造が決まっているからだ。もともと人間の発声器官で出せる音声の種類が無限ではないのであれば、幼児の側でもあらかじめ人間の発声器官で出すことが可能な音の場所にそれに対応した境界線を引いておくことは賢明な策なのである。だから、幼児はあらかじめ音に境界線を引いておく。しかし、そのような境界線があっても、自分の母国語では何の役にも立たないのであれば、それを学習によって消してしまうのだ。最初から区別をしないようにしたほうが情報が確実に伝わるからだ。日本人にはrとlの区別がつかないとよく言われるが、それは学習の過程でその区別を潰すことを学習したからかもしれない。

 

 

 

【黄色い球体のくだものはミカンだが、ミカンは黄色い球体のくだものなのか問題】

たとえば、母親が黄色くて丸い果物を持って「ミカン」と言うのを幼児が聞くと、幼児はその果物を見て「ミカン」と言えるようになるだけではなく、「ミカン取って」と言われると、その果物を取るようになる。こんなこと当たり前のように思われるが、実はこれは論理的ではない。というのも、論理的に厳密に考えるならば、「逆は必ずしも真ならず」だからである。ある物体が「ミカン」と呼ばれたからといって、その物体がミカンだとは限らない。お母さんがミカンを持って、「黄色」と言ったからといって、「黄色」はミカンではない。ミカンは黄色いが、黄色がミカンだとは限らない。黄色くて丸い果物が「ミカン」だからと言って、「ミカン」が黄色くて丸い果物である保証はないのだ。(たとえば、ツバメを指差して「鳥」と言われた場合に、「鳥」はツバメのことではない。)このような論理錯誤をしながら「決め打ち学習」をするのは、これまで調べられた中ではヒトだけである。これはヒトの特徴といえる。

 


【決めうち学習】

またそもそもその「ミカン」という言葉が、黄色くて丸い果物全体を指すという保証もない。もしかしたら、「ミカン」という言葉が指しているのは、黄色くて丸いくだものについているブツブツのことなのかもしれない。だが、ヒトの幼児は、疑いもなく、その果物全体が「ミカン」であり、かつ「ミカン」はその果物のことであると考えて、「ミカン」という単語を習得する。こうしたさまざまな奇妙な学習の非論理的制約が、ヒトの言語習得を支えているのである。だから、ヒトの学習も、生物学的制約やプログラムされた学習から完全に自由なのではない。