如何加强和惩罚修改行为
操作性条件反射(有时称为器械性条件反射)是通过对行为的奖励和惩罚而发生的学习方法。 通过操作性条件反射,在行为和后果之间建立关联。
例如,当实验室老鼠按下一个蓝色按钮时,他会收到食物颗粒作为奖励,但当他按下红色按钮时,他会受到轻微电击。
结果,他学习按下蓝色按钮,但避开红色按钮。
但是操作性调理不仅仅是在实验环境中发生的,而是在训练实验动物时发生的。 它在日常学习中也扮演着重要的角色。 强化和惩罚几乎每天都在自然环境中进行,并且在更有条理的环境中进行,如课堂或治疗课程。
让我们仔细研究如何发现操作性条件反射,它对心理学的影响,以及它如何用来改变旧的行为和教授新的行为。
操作条件的历史
操作性调理由行为主义者BF Skinner创造,这就是为什么你偶尔会听到它被称为Skinnerian调理。 作为一名行为主义者,斯金纳认为,为了解释行为,并不需要考虑内部的想法和动机。 相反,他建议,我们应该只关注人类行为的外在的,可观察的原因。
通过20世纪的前半部分,行为主义已经成为心理学领域的主要力量。 约翰B.沃森的想法很早就主宰了这一学派。 沃森专注于古典空调的原则,曾经有人提出他可以带任何人,无论他们的背景如何,并且训练他们成为他选择的任何东西。
早期行为主义者将兴趣集中于联想学习的地方,斯金纳更关心人们行为的后果如何影响他们的行为。
斯金纳用术语操作来指任何“对环境产生后果的主动行为”。 换句话说,斯金纳的理论解释了我们如何获得我们每天展示的学习行为的范围。
他的理论深受心理学家爱德华索恩迪克的工作影响,他提出了他所谓的效果定律 。 根据这一原则,遵循理想结果的行为更有可能重复,而那些出现不良后果的行为则不太可能重复。
操作条件依赖于一个相当简单的前提 - 随后加强的操作将会得到加强,并且将来可能再次发生。 如果你在课堂上讲一个有趣的故事,并且大家都笑,那么你将来可能会再次讲述这个故事。 如果你举手问问题,并且老师赞美你的礼貌行为,那么下次有问题或评论时,你更有可能举手。
由于行为之后是强化,或者是理想的结果,所以前面的行为得到加强。
相反,导致惩罚或不良后果的行动将被削弱,未来再次发生的可能性会减小。 如果你在另一个班级再次讲同样的故事,但这次没有人笑,你将来不太可能重复这个故事。 如果你在课堂上大声回答并且老师责骂你,那么你可能不太可能再次打断课堂。
行为类型
斯金纳区分了两种不同类型的行为
- 被访者的行为是那些自动且反射性的行为 ,例如当医生在您的膝盖上打水时,将手从热炉上拉回或者抽筋。 你不必学习这些行为,他们只是自动而不自觉地发生。
- 另一方面, 操作行为是我们有意识控制的行为。 有些可能会自发地发生,有些可能会故意发生,但这些行为的后果将影响它们是否会在未来再次发生。 我们在环境方面的行动以及这一行动的后果构成了学习过程的重要组成部分。
虽然经典的条件可以解释受访者的行为,但Skinner意识到它不能解释大量的学习。 相反,Skinner认为操作性条件反射的重要性更高。
斯金纳在少年时期发明了不同的设备,并在操作性调理研究期间将这些技巧运用到工作中。
他创造了一种称为操作调节室的装置,现在通常称为Skinner箱 。 该室基本上是一个可以容纳诸如老鼠或鸽子之类的小动物的盒子。 箱子还包含一个动物可以按下的酒吧或钥匙,以获得奖励。
为了跟踪回复,Skinner还开发了一种称为累积记录器的设备。 设备将响应记录为线的向上移动,以便通过查看线的斜率来读取响应率。
操作条件的组成部分
操作性条件反射有几个关键概念。
操作条件下的强化
强化是强化或增加其行为的任何事件。 有两种强化剂:
- 积极的强化剂是在行为之后呈现的有利事件或结果。 在反映正面强化的情况下,通过增加诸如赞美或直接奖励之类的东西来增强反应或行为。 例如,如果你在工作中做得很好,你的经理会给你奖金。
- 负面的强化因素包括在显示行为后消除不利事件或结果。 在这些情况下,通过消除一些令人不快的事物来加强应对。 例如,如果你的孩子在杂货店中间开始尖叫,但是一旦你送给他一种治疗就停止,你下次开始尖叫时更可能会给他一种治疗。 你的行为导致消除了不愉快的状况(孩子尖叫),消极地强化了你的行为。
在这两种强化情况下,行为都会增加。
操作性条件下的惩罚
惩罚是指导致其行为下降的不利事件或结果。 有两种惩罚:
- 积极的惩罚 ,有时被称为应用程序的惩罚 ,会出现不利的事件或结果,以削弱其遵循的反应。 不当行为打屁股是应用程序处罚的一个例子。
- 负面惩罚也称为移除惩罚,发生在行为发生后有利的事件或结果被消除时。 在不当行为后带走孩子的视频游戏就是负面惩罚的一个例子。
在这两种惩罚的情况下,行为都会减少。
强化计划
强化不一定是一个简单的过程,有很多因素可以影响新事物的学习速度和方式。 斯金纳发现,行为在何时何地被强化,对收购的速度和强度起了一定的作用。 换句话说,强化的时间和频率影响了如何学习新行为,以及如何修改行为。
Skinner确定了影响操作性调节过程的几种不同的加固时间表 :
- 每次发生响应时, 连续加固都需要加强加固。 学习往往发生得比较快,但回应率很低。 一旦钢筋停止,灭绝也会很快发生。
- 固定比例计划是一种部分强化。 只有在发生了特定数量的答复之后,答复才会加强。 这通常会导致相当稳定的回应率。
- 固定间隔时间表是部分强化的另一种形式。 只有经过一段时间后才能进行加固。 响应率保持相当稳定,并且随着补强时间的临近而开始增加,但在钢筋交付后立即减缓。
- 可变比例表也是一种局部强化,涉及各种反应后的强化行为。 这导致了高响应率和缓慢的灭绝率。
- 可变间隔时间表是Skinner描述的部分加强的最终形式。 这个时间表包括在经过了可变的时间之后交付加固。 这也趋于导致快速响应率和缓慢的灭绝率。
操作条件的例子
我们可以在我们周围的工作中找到操作条件的例子。 考虑儿童完成家庭作业以从父母或老师那里获得奖励,或者员工完成项目以获得赞扬或晋升的情况。
操作性调理的更多例子:
- 如果您的孩子在购物旅行期间出现问题,您可以给他一个治疗方法让他安静。 因为你积极强化了这种不正当行为,他将来可能会更有可能再次表现出来,以便接受另一种治疗。
- 在社区剧场演出后,你会收到观众的掌声。 这是一个积极的强化,鼓舞你尝试更多的性能角色。
- 只要他正确地执行行为,你就可以训练你的狗给他提供赞美和拍头。
- 一位教授告诉学生,如果他们全学期都有完美的出勤率,那么他们不必参加最后的综合考试。 通过消除不愉快的刺激(最后的测试),学生被强化为定期上课。
- 如果你没有按时完成项目,你的老板会变得生气,并在同事面前表现你的表现。 这是一个积极的惩罚者,使你不太可能在未来的晚些时候完成项目。
- 一位十几岁的女孩在她被问到时没有清理她的房间,所以她的父母在一天的其余时间里都拿走了她的手机。 这是一个负面惩罚的例子,其中积极的刺激被拿走。
在其中一些例子中,奖励的承诺或可能性导致行为增加,但操作性条件反射也可用于减少行为。 取消理想的结果或负面的结果应用可用于减少或防止不良行为。 例如,一个孩子可能会被告知,如果他们在课堂上轮流说话,他们将失去隐性特权。 这种惩罚潜力可能会导致破坏性行为的减少。
一句话来自
虽然行为主义可能失去了它在20世纪早期的主导地位,但操作性条件反射仍然是学习和行为改变过程中一个重要且经常使用的工具。 有时自然的后果会导致我们的行为发生变化。 在其他情况下,可能有意识地奖励和惩罚以创造变化。
无论您在自己的生活中是否可以立即认识到操作性调理,无论是教您的孩子良好行为还是培训家犬停止咀嚼您最喜爱的拖鞋。 要记住的重要一点是,对于任何类型的学习,有时需要时间。 考虑可能最适合您独特情况的加固或处罚类型,并评估哪种类型的加固计划可能会产生最佳结果。
>来源:
> Coon,D&Mitterer,JO。 心理学:一次旅程。 贝尔蒙特,加州:沃兹沃思; 2014年
> Domjan,M.“学习和行为的原则”,第七版。 康涅狄格州斯坦福德; 圣智学习; 2015年。