『図説心理学入門』を参考に、心理学にまつわる内容をまとめています。
学習心理学入門
学習とは経験を通して起こる比較的長期的な行動の変化を指し、その行動には単純なものから高度で複雑なもの等、広い範囲のものが含まれる。ここでは、学習のプロセスおよび学習と関連が深い記憶について複数のトピックを通して学ぶ。
なお、単一の刺激を繰り返し経験することで起こる反応の鋭敏化とその逆の順化については今回は扱わない。
§1 条件づけ
条件づけは、動物実験から始まり、そこで得られた知見が人間の行動の理解にも適用されると考えられている。条件づけによる学習理論では、行動の主体を生活体や有機体とし、行動を刺激と反応で理解・説明しようとする。この立場を行動主義という。
1. 古典的条件づけ
パブロフは、消化器の研究で使われている犬が食物や実験者を見ただけで唾液を分泌する現象に注目した。視覚刺激は本来、唾液反射とは無関係なはずである。
このように本来無関係であった刺激と反応の間に新しい結合を形成する手続きを定式化したのが、今日古典的条件づけと呼ばれるものである。
無条件反応に対して、一定の経験のもとに生じる反応を条件反応という。条件刺激と無条件刺激を時間的に接近して提示する手続きを強化という。
強化によって、本来中性刺激であった条件刺激(音)が、無条件刺激(肉粉)に誘発された反応(唾液)を次第に喚起するようになる。強化の回数が多くなるに伴い、条件反応は大きくなる。実験結果によると、条件刺激から無条件刺激の開始までの時間的遅れが0.5秒程度が、最も条件づけに適している。
古典的条件づけの例として、条件性情動反応、すなわち不安や恐怖の条件づけがある。
2,オペラント条件づけ
ある事態で行動を起こすと、その行動は事態に変化をもたらす。そして、その変化が良ければその行動は繰り返され、悪ければ別の行動が行われる。これは、行動の後に起こったことによって行動の結びつきが強まったり弱まったりする古典的条件づけとは異なる型の条件づけであり、オペラント条件づけと呼ばれる。 オペラント条件づけとして最もよく知られているのは、スキナーによって発表された、白ネズミのレバー押し行動の条件づけである。ネズミはレバーを押すことで餌を得るという新しい行動様式を学習する。
重要な点は特定の行動に対して報酬が与えられることであり、オペラント条件づけではこれを強化という。オペラント条件づけで強化刺激として用いられるものは、生活体にとって好ましいものばかりではなく、苦痛を与えるような刺激も強化刺激として使われる。この場合、逃避反応や回避反応を学習する。
オペラント条件づけでは、行動が頻繁に行われるようになる刺激を正の強化子、その刺激を排除する行動を増加させる刺激を負の強化子という。特定の行動の後に常に嫌悪刺激が与えられると、その行動は次第に生じなくなる。これは罰と呼ばれる。罰にも正と負の2種類があり、それが与えられると行動が次第に起こらなくなる罰を正、取り上げられることが罰となる刺激を負という。
嫌悪刺激が負の強化子として使われるオペラント条件づけには逃避・回避条件づけがある。嫌悪刺激を何度か経験するとそれから逃げる行動(逃避反応)を学習し、さらに続けると、刺激が来る前にそれを回避する行動(回避反応)を学習する。しかし、避けられない嫌悪刺激を何度も経験すると、逃げたり避けたりすることが可能な事態でも逃避反応や回避反応を学習できなくなることが、セリグマンらの実験によって示された。これを学習性無力という。
古典的条件づけによる学習とオペラント条件づけによる学習には相違点がある。古典的条件づけでは、条件反応の形成は無条件刺激による反応の誘発に依存しているため、自律神経系の反応(例えば眼瞼反射や皮膚抵抗の変化)を条件づけるのに適している。一方オペラント条件づけは、まず生活体が反応することで強化がもたらされ、反応が自発しない限り強化は成立しないため、中枢神経系の反応(例えばボタンを押す)の条件づけに適している。
古典的条件づけでは、学習された反応を引き起こす刺激を条件刺激と呼び、オペラント条件づけではそれを弁別刺激という。古典的条件づけは条件刺激が条件反応を誘発する学習であり、条件反応は自律神経系の不随意反応が多い。対して、オペラント条件づけで学習される多くの反応は中枢神経系の随意反応である。しかし身体の生理的変化をフィードバックする装置を使うと、オペラント条件づけを用いて自律神経系の反応をコントロールすることもできる。
3,消去と自発的回復
古典的条件づけによって形成された条件反応は、無条件刺激を与えず条件刺激のみを単独に提示することを繰り返すことによって次第に小さくなり、やがて現れなくなる。 オペラント条件づけでも条件反応に対して報酬を与えない、あるいは不快刺激を除かないことで次第に反応頻度が減少し、やがて生じなくなる。これを消去という。 消去もまた学習である。
消去が進むと条件反応は生じなくなるが、休憩を入れると反応が回復するのがみられる。この現象は自発的回復と呼ばれる。 自発的回復の原因について、休憩に入る直前の反応には別の付加的要因が働くという見方がある。付加的要因は、疲労などの反応すること自体によって作り出され、反応を抑制するような働きをし、休憩によって消失する性質のものである。
4,汎化と弁別
ある刺激に対して一定の反応をすることを学習した生活体は、似た刺激に対しても同じ反応をするようになる。これを刺激汎化という。汎化による反応の強さは刺激が元の刺激にどれほど似ているかによって異なる。これを汎化勾配という。汎化は消去によって形成された無反応傾向にも生じる。
汎化と表裏の関係にあるのが分化(弁別)である。生活体はある刺激には反応するが、他の刺激には反応しないことも学習されなければならない。この学習の手続きを弁別学習という。弁別学習により正刺激には反応が起こり、負刺激には反応が起こらなくなる。
一つの条件づけが行われると、生活体は汎化によって条件刺激や弁別刺造だけでなく似たような刺激にも反応するようになるが、弁別学習によって位た刺激に反応するかしないかの区別が学習されるのである。
5,部分強化
古典的条件づけにおいて強化を続けて行う方法を連続強化といい、2回に1回というように強化と消去をおり混ぜて行う強化の仕方を部分強化という。
オペラント条件づけでの部分強化はスケジュールの組み方によって以下に示すような主な四つの型に分けられる。
定率強化:3回に1回というように一定数の割合で強化を行う。
変率強化:平均強化率が決められ強化は不定期に行う。
定時隔強化:強化間のインターバルを決め、強化が与えられた後は,規定時間を経過した後の最初の反応にのみ強化が与えられる。
変時隔強化:平均時間間隔が決められ強化間のインターバルが変化する。強化は変化する時間間隔後の最初の反応が強化される。
どのようなスケジュールで強化されるかによって、反応パターンに違いが生じてくる。
部分強化は消去試行が入るにもかかわらず連続強化によって形成された反応よりも消去抵抗が高い。これは部分強化効果とかハンフレイズ効果といわれる。たまにうまくいくので止められない賭け事は、部分強化の例である。
6,二次的強化
人にとって、言葉もまた報酬になる。しかし言葉それ自体は,本来報酬や嫌悪刺激としての機能をもたない。学習の結果として,強化刺激としての特性をもつようになったものである。このような刺激によって行われる強化を二次的強化という。
幼児が危険なものに近づいたとき,母親は「危ない」と大きな声を発し、手を叩くこともある。これにより幼児は「危ない」という言葉に対する怖れや不快感を覚え、危ないという言葉は反応を制止する性質を獲得する。
二次的強化は、オペラント条件づけにおいて一層興味深い。ウォルフによる実験では人間社会において貨幣が報酬としての特性を獲得する過程と同じような過程をチンパンジーにみることができる。二次的強化刺激はその強化としての働きを学習によって獲得したため一次的強化によって時々補強されないと次第に強化力を失っていく。二次的に強化子として機能する刺激を条件性強化子ともいう。