可变比率时间表特征

在操作性条件反射中,可变比率时间表是一个强化时间表,其中响应在不可预知的响应数量之后得到加强。 这个计划创造了一个稳定,高回应率。 赌博和彩票游戏是基于可变比例时间表的奖励的好例子。

强化时间表在强化调节过程中起着核心作用。 行为得到加强的频率可以帮助确定学习响应的速度以及响应的强度。 每个强化的时间表都有其独特的特征。

特点

有三个常见的众所周知的因素:

在确定不同的强化时间表时,首先查看个人时间表本身的名称可能非常有帮助。 在可变比率时间表的情况下,术语变量表示强化在不可预知数量的响应之后传递。 比例表明,强化是在一定数量的反应后给出的。 所以在一起,这个术语意味着在不同数量的反应之后提供钢筋。

将钢筋的变比表与钢筋的固定比率表进行对比可能也是有帮助的。 在一个固定比率的时间表中,在一定数量的答复之后提供强化。

因此,例如,在具有VR 5时间表的可变比率时间表中,动物平均可以每五次获得奖励。 这意味着有时奖励可能会在三次回应之后出现,有时在七次回复之后,有时在五次回复之后,等等。 强化计划的平均每5个回应将得到奖励,但实际交货计划仍将完全不可预测。

另一方面,在一个固定比例的时间表中,强化时间表可能被设置为FR 5。这意味着每五个响应就会有一个奖励。 如果可变比例时间表不可预测,则固定比率时间表设定为固定比率。

例子