多年以前,研究人员发现了一些在商业社会中需要警惕的事情。
Sara Rynes、 Amy Colbert和Kenneth Brown在2002年发起了一项研究,旨在检验HR从业人员的理念与各种HR实践的理论研究是否一致。他们调查了1000名人力资源管理人员(SHRM成员),包括HR经理、总监、VP等,这些调查对象平均有14年的从业经验。
结果如何?在HR最重要的领域之一——人员配置领域出现了大量的不一致。这在招聘测评中非常普遍,因为50%以上的调查对象都不了解相关领域的研究结果。
已经有非常多的研究揭示了为什么研究成果无法成功转化为HR实践。原因包括:HR从业者没有时间阅读最新的研究论文;研究成果本身是由复杂的专有名词和数据组成的;引入一种非常新颖的甄别方法,从各个角度看都是一项复杂的工作。
与此同时,只要有过招聘员工甚至管理员工经验的人都了解,会有大量因素影响员工的工作绩效。因此,了解个体之间的差异如何影响工作绩效,进而能够聘用最有可能取得成功的候选人,对公司来说至关重要。
问题来了——什么是最有效的甄别方式呢?
针对各种招聘手段和方法是否能够真正预测工作绩效,学术界进行了大量的研究。Frank Schmidt针对上世纪的工作生产数据进行的元分析是这个领域的开创性工作,这项研究最早发表于1998年,并于近期再版。下表展示了一些常用的甄选方法在预测方面的有效性(从高到底排列),信息来自于Schmidt去年11月发表于华盛顿大都会区人才测评协商会议的研究。
最有效和无效的甄别方式——根据从0到1的相关系数,系数越高,表明测试分数和预测的工作绩效相关度越大。
根据上述研究,如果你仅仅根据面试、背景调查和性格测试决定是否雇佣,你就是在选择使用一种相对无效的甄选方式。如果能够使用更多有效的甄选手段,效果可能会更好。
实际上,这(选择相对无效的甄别方式)是大多数公司采用的方法。 根据NBC新闻2011年的一篇报道,采用性格测试的公司正以每年20%的速度增长。4Q性格测试的广泛使用尤为显著,在我工作的咨询领域也已经很常见。
4Q测试是指测试结果由4个不同的维度组合而成,例如4种不同的字母、数字、颜色、动物等。这种测试起源于公元前450年,希腊学者Emprdocles发现他可以将人类的行为分为土、水、火、气四种。Hippocrates作为医生的始祖,将人的性格分为血、粘液、黑胆汁和黄胆汁。自此之后,无数的工具反复被发明,他们都是基于同样的前提和理论。
一般来说,4Q工具包含一系列形容词,被试选择与自己最像或者最不像的词,以此测量自己的风格、倾向或者偏好。虽然这些测试看起来很能反映一个人真实情况,但是当用于像招聘这样高风险的活动时,它们还是有很多明显的短板。还有一点不得不说明,这些测试方法获取的渠道非常广,成本也很低,也是值得公司警惕的因素。
对个人来说,这些测试非常简单易懂,被试可以轻易地操纵结果,以使得他们在管理者看来是合格的。另一方面,因为测试的对象是个人的“状态”而非“特质”,测试结果很有可能因为被试的环境改变而在未来变化。这也是为什么很多4Q测试创始人建议被试在一段时间之后重新进行测试。
问题在于,如果测试结果在很大概率上会随着时间变化,个体的测试结果怎么能够用来预测未来的工作表现?
在使用任何测评工具测验任何潜在员工之前,管理者都要停下脚步问自己一个问题:这项测评能够预测未来的工作绩效吗?对于4Q测试来说,恐怕不行。4Q测试可以在很多方面展现巨大的价值,例如自我发现、团队协作、教导下属、增强沟通等。但是他们并不适用于招聘领域,因为它的预测效度低、再测信度低、缺少常模和一致性测试(针对撒谎的测试者)。
在招聘领域比较可行的性格测试通常具有以下特点:
测试稳定的特质,这些特质通常不会随着时间而变化;
存在常模,管理者可以借此将测试者的分数与其他人进行对比,以确定谁更优秀;
存在测谎条目,以判断测量结果是否能真实反映测试者的情况;
有较高信度(包括再测信度),同时已经被证实可以很好地预测工作绩效。
即使使用了满足上述条件的测量工具,性格特质也不是最有预见性的测量方式。如果将性格测试和其他预测效果更好的测试(例如正直测试和认知测试)结合使用,结果会更加有效。
在选拔公司的明日之星时,使用高效度、高预测性的测试工具会为企业家和管理者提供巨大的帮助。但是,并非所有的测试都同样有效,很多测试不会对你的投入有显著回报。根据2014年Aberdeen的研究,只有14%的公司有数据证明自己的测评策略有正面影响。对于特定的组织目标,如果你知道哪种测评方式最有效,那么你就能选择一种在最坏状况下都能发挥作用的测评工具。
本文作者Whitney Martin作为ProActive咨询的一名测评战略家,将其热情和专业精神都投入于调查和测评领域。
译者 白痴小王子