当我们呼唤某人或某些可靠的东西时,我们的意思是说他们是一贯可靠的。 可靠性也是良好心理测试的重要组成部分。 毕竟,如果测试不一致并且每次都会产生不同的结果,那么测试就不会很有价值。 心理学家如何定义可靠性? 它对心理测试有什么影响?
可靠性是指措施的一致性。 如果我们重复获得相同的结果,则测试被认为是可靠的。 例如,如果一项测试旨在衡量一种特质(如内向性 ),那么每次对某个主体进行测试时,结果应该大致相同。 不幸的是,精确计算可靠性是不可能的,但它可以通过许多不同的方式进行估算。
测试 - 重新测试可靠性
重测信度是衡量心理测试或评估一致性的指标。 这种可靠性用于确定测试在一段时间内的一致性。 测试重测信度最适用于随时间变化稳定的情况,如智能 。
通过在两个不同时间点进行两次测试来测量重测信度。 这种类型的可靠性假定质量或构造不会发生变化。
在大多数情况下,测试之间的时间很短,可靠性会更高。
测试重测法只是可以用来确定测量可靠性的方法之一。 可以使用的其他技术包括评估者间可靠性,内部一致性和并行形式可靠性。
重要的是要指出,重测信度只是指测试的一致性,而不一定是测试结果的有效性 。
评估者之间的可靠性
这种可靠性的评估方式是由两名或两名以上的独立评委进行测试。 然后比较分数以确定评估者估计的一致性。
测试评分者间可靠性的一种方法是让每个评估者为每个测试项目分配一个评分。 例如,每个评估者都可以从1到10的等级上评分项目。接下来,您将计算两个评分之间的相关性,以确定评分者间信度的等级。
测试评分者间可靠性的另一种方法是让评估者确定每个观察属于哪个类别,然后计算评估者之间的一致性百分比。 因此,如果评估者同意10次中的8次,则该测试具有80%的评分者间可靠性率。
并行形式的可靠性
通过比较使用相同内容创建的两个不同测试来衡量并行形式的可靠性。 这是通过创建一个大量的测试项目来衡量相同的质量,然后随机将项目分成两个单独的测试来完成的。 然后这两个测试应该同时对相同的对象进行管理。
内部一致性可靠性
这种形式的可靠性用于判断同一测试中各项目结果的一致性。 基本上,您正在比较测量相同构造的测试项目以确定测试内部一致性。 当您看到与另一个测试问题看起来非常相似的问题时,可能表明这两个问题正用于衡量可靠性。 因为这两个问题是相似的,并且旨在衡量同一事物,考生应该同时回答这两个问题,这将表明该考试具有内部一致性。
可能影响可靠性的因素
有很多不同的因素会影响衡量标准的可靠性。
首先也许最明显的是,被测量的事物是相当稳定和一致的。 如果测量的变量是定期变化的,那么测试结果将不一致。
测试情况的各个方面也会影响可靠性。 例如,如果测试是在非常热的房间中进行的,那么受访者可能会分心并且无法尽其所能地完成测试。 这可能会影响措施的可靠性。 其他诸如疲劳,压力,疾病,动机,差劲指令和环境干扰等因素也会影响可靠性。
可靠性与有效性
重要的是要注意,仅仅因为测试具有可靠性,并不意味着它有效。 有效性是指一项测试是否真正衡量其声称要衡量的内容。 将可靠性视为精度和有效性的度量,以此作为衡量准确性的指标。 在某些情况下,测试可能是可靠的,但无效。 例如,假设求职者正在进行测试以确定他们是否拥有特定的人格特质 。 虽然测试可能会产生一致的结果,但实际上它可能并没有衡量它声称要衡量的特质。