在操作性条件反射中,可变比率时间表是一个强化的时间表,其中响应在不可预知的响应数量之后得到加强。 这个计划创造了一个稳定,高回应率。 赌博和彩票游戏是基于可变比例时间表的奖励的好例子。
强化时间表在强化调节过程中起着核心作用。 行为得到加强的频率可以帮助确定学习响应的速度以及响应的强度。 每个强化的时间表都有其独特的特征。
特点
有三个常见的众所周知的因素:
- 导致高的,稳定的回应率
- 加强后只会导致短暂停顿
- 在无法预测的回复数量之后提供奖励
在确定不同的强化时间表时,首先查看个人时间表本身的名称可能非常有帮助。 在可变比率时间表的情况下,术语变量表示强化在不可预知数量的响应之后传递。 比例表明,强化是在一定数量的反应后给出的。 所以在一起,这个术语意味着在不同数量的反应之后提供钢筋。
将钢筋的变比表与钢筋的固定比率表进行对比可能也是有帮助的。 在一个固定比率的时间表中,在一定数量的答复之后提供强化。
因此,例如,在具有VR 5时间表的可变比率时间表中,动物平均可以每五次获得奖励。 这意味着有时奖励可能会在三次回应之后出现,有时在七次回复之后,有时在五次回复之后,等等。 强化计划的平均每5个回应将得到奖励,但实际交货计划仍将完全不可预测。
另一方面,在一个固定比例的时间表中,强化时间表可能被设置为FR 5。这意味着每五个响应就会有一个奖励。 如果可变比例时间表不可预测,则固定比率时间表设定为固定比率。
例子
- 老虎机:玩家无法知道他们赢得比赛之前需要玩多少次。 他们所知道的是,最终,一场比赛将赢得胜利。 这就是为什么老虎机非常有效,玩家往往不愿意退出。 他们投入的下一个硬币总是有可能成为赢家。
- 销售奖金:呼叫中心通常为员工提供随机奖金。 工作人员不知道他们需要多少次才能获得奖金,但他们知道他们增加了拨打电话或销售额的机会。
- 门到门销售:销售人员一家一家旅行,但从不知道他们何时会找到感兴趣的买家。 它可能是下一个房子,或者可能需要多站才能找到新客户。
- 视频游戏 :在某些游戏中,玩家收取代币或其他物品以获得奖励或达到下一级别。 玩家可能不知道他们需要多少令牌才能获得奖励,甚至不知道奖励会是多少。