一套成熟的人才测评产品,应该
有完善、可读性强的测评报告和可供深度分析的有效测评数据:
报告内容是否能够真实为企业提供人才决策依据;测评数据能否深度挖掘分析利用;报告对HR、业务部门以及测评者本人是否都提供了帮助和启发,是否能够提高管理效率等,都是考察的重点。
除了这些之外,HR在日常工作中还有哪些清晰易得的评价标准来区分测评工具的优劣呢?今天跟大家分享
三个关键因素
信效度、标准分VS原始分、常模。
信度是指测验结果的一致性、稳定性及可靠性,信度系数愈高即表示该测验的结果愈一致、稳定与可靠。通俗一点理解,就像我们称体重,如果一次测45kg,一次测50kg,说明信度不高。一般在统计学上信度0.7就达到一个很高的水平。
效度是指所测量到的结果反映所想要考察内容的程度,即能不能测到我们想要的东西,测量结果与要考察的内容越吻合,则效度越高。
为了方便大家理解信效度,我们以画画来做类比。例如:老虎:测评者真实性格;画家:测评工具;作品:测评结果
从上述图,我们可以发现,
信度是效度的必要条件,但不是充分条件。信度高效度不一定高,但效度高,信度就一定高。
正常的一个测评流程跑完,其信度与效度应该在0.7以上。
如果某家公司说他测评工具的信度与效度在0.95以上,那一定是骗人的,因为人才测评不是物理测量,根本达不到如此高的信度与效度。
企业在测评实际应用中,如果只看原始分其实是没有意义的,需要配以可供比较的标准(即常模),将原始分转换成有意义的、可供解释的分数(即标准分),才能进行横向对比分析,因此我们在测评报告中看到的分数,都是测评的标准分数。
首先来看,两者的定义有何不同。
原始分,是指测评者在测评中直接获得的分数。它是通过测评者作答时选择的选项所对应的分值而获得的。然而原始分本身并没有什么用,因为它一般不能直接反应出测评者之间的差异情况。
标准分,是指通过将原始分按照一定的规则(与常模对比)转换而成的分数;它能够刻画出测评者在群体中所处的位置。将原始分转换成标准分后,分数本身就具有了意义,直接反映不同测评者之间的水平差异,可以进行相互比较。
例如,小黄人Kevin测得身高1.20m,处于什么样的水平呢?究竟是高还是低,没有对比,无从得知;或者跟不同的群体对比,结果是不一样的。在小黄人群体中,Kevin与其他小黄人相比,其实是高个子;但是跟神偷奶爸相比,Kevin就是矮个子了。
倍智的心理测评产品报告中的测评分数就是采用标准十分的形式,是用1至10分来描述测验的分数,最高10 分,最低1分。标准十分主要是利用正态分布的概念,将正态分布的曲线(即大量测评者的测试结果分布)分为十个部分,每个部分代表一个分值,每个分值在整体中占的比例如下所示:

人才测评在应用之前,需要施测一定的人群,将得到的分数加以统计整理,得出一个具有代表性的分数分布——这就是常模。
测验的原始分必须与某种标准(也就是这里说的常模)比较,得出标准分才能显示出它所代表的意义。
我们还是以小黄人为例,小黄人Kevin测得身高1.20m,与其他小黄人相比,它是高个子,但是跟神偷奶爸相比,Kevin就是矮个子了。这里的小黄人常模和Kevin常模就算一种特殊的常模。
一般来说,一个测评可以基于不同的群体编制多个常模。
倍智TAS人才测评系统拥有超过500万的常模数据,形成了通用、应届生、职业人、基中高管理人员4个常模组。
在
实际应用中,
一般常模的适
用范围广,基本可适用于所有人群。其他
特定的常模组则在测评者与特定群体的性质特点接近时才可用,例如
届生常模则适用于大学生群体的测评者,对于工作几年的职业人可能就不太适用。
当然,在实际操作中,倍智也会建议客户去对测评数据进行更加深度的挖掘,除了对比内部的绩优、绩差人员之外,我们也会提供
标杆企业数据对标
的服务。
在企业日常管理和HR的实际工作中,难免会遇到林林总总的各类测评工具。
好的人才测评工具,是能够帮助企业提高管理效率,提供科学客观的评价工具和选人用人依据。
如果有实施人才测评项目的机会,HR从业者
们一定要聚焦企业人才测评项目的目标,选好常模和对标的测评数据,匹配好合适的、信效度0.7以上的测评工具,才能保证测评的精准性。
大家对市场上的各类测评工具了解如何?
关于人才测评的话题,你还有哪些疑问或者思考呢?欢迎留言与我们交流!