本院动态
范津砚博士“比较自我报告的人格分数和机器算法估计的人格分数的效标效度——兼谈大数据方法在人事选拔中的应用”学术讲座圆满举行
返回列表
发布时间:2019-05-05

    2019429下午浙江大学行政管理研究所和浙江省人才发展研究院联合举办的“比较自我报告的人格分数和机器算法估计的人格分数的效标效度——兼谈大数据方法在人事选拔中的应用”讲座在浙江大学紫金港校区蒙民伟楼250圆满举行。

本次讲座由浙江大学公共管理学院行政管理研究所所长、浙江省人才发展研究院执行院长陈丽君教授主持,美国奥本大学心理系副教授范津砚博士担任主讲嘉宾,浙江大学公共管理学院四十多位本科生、硕士生和博士生参加了本次讲座并展开了研讨。

讲座开始,陈丽君教授首先介绍了范津砚博士的长期研究方向为人事选拔、新员工入职培训和社会化过程、和跨文化适应和培训等。随后,陈丽君教授介绍了基于大数据方法借助Facebook点赞数据识别个人特征的前沿研究,并引入今天的讲座主题——如何运用大数据方法实现人事选拔?

 

 

在人事测评领域,如何破解“伪装好”现象一直是心理学家们深感兴趣的研究课题,作为新兴热点,日益拓展的大数据方法为解决这一问题开辟了新的道路。那么,大数据方法已经在人事测评与选拔领域得到了哪些运用?这些运用是如何实现的?与传统人事测评手段相比,大数据方法还有哪些缺陷有待弥补?大数据方法的应用前景究竟如何?围绕这些问题,范津砚博士进行了报告。

首先,通过两项有关大数据方法的经典研究,范津砚博士介绍了当前大数据方法在个体人格测评领域的新进展。事实上,大数据方法一般遵循了搜集海量数据、建立数理模型、检验模型效度、推广使用模型等步骤,从而实现了预测功能。这些海量数据的类型众多,大大突破了以往信息数字化的限制,而可以使用文本、声音、面相等新型信息。范津砚博士分享的两个经典研究就分别基于社交动态文本信息(Yarkoni,2010)和点赞信息(Youyou et al.,2015)对个体人格进行了预测。

 

 

 

目前,对社交动态文本信息的处理有两种方式——一种依据词汇类别进行分析,另一种则基于词汇频次进行分析。前者可以借助LIWC软件处理数据,这一软件是美国德克萨斯州奥斯汀分校的心理系老师开发的,能够基于介词、第一人称单数等80多个类别对所有词进行归类分析,从而产生特征分数。在搜集特征分数和借鉴大五人格模型的基础上,就可以建立数理模型,进而预测个体在每个维度上的分数,最终得到个体人格评分。基于词汇类别的分析方式与基于词汇频次的分析方式在程序和方法上大同小异,只是后者没有对词汇进行分类,而是直接关注用词频次,也得到了一些有趣的结果。例如,外向型人格更多地使用第二人称,更高频次地提到朋友、音乐、和性;认真负责型人格更多地使用成就性词汇,更少地提及负面情绪、否定性词汇。

通过点赞数据对个体人格进行预测的研究原理与上一个研究是一样的,只不过采用的预测变量不同。剑桥博士Youyou(2015)等人的研究邀请了7万多Facebook用户参与实验,并用他评的方式得到了这7万多Facebook用户的人格评分。模型是如何建立的呢?每一条横向的数据代表一个人的点赞行为,点赞过为1,没点赞为0。点赞数据很长也可以通过降维到一百条数据,把点赞方面的数据与自我报告的人格分数进行回归,点赞为因变量,自我报告为自变量,做五个模型,每个模型都有一套模型参数90%的样本用来建模,然后运用10%的样本预测分析。研究发现,机器跟人相比,机器的平均精度更高。点赞量越高,机器预测结果越精确,机器对开放型人格的预测精确度更高。点赞量达到10个时,机器预测精度与同事评价精度相同;点赞量达到60-70个时,机器预测精度与朋友或一起居住的人的评价精度差不多;点赞量达到130个时,机器预测精度已经与家庭成员的预测精度相当;点赞量达到270-280个时,机器预测精度可以媲美配偶评价精度。总体来看,点赞量达到100个时,机器预测精度就可以达到人类的平均精度

随后,范津砚博士分享了近期实验室进行的一个研究,这一研究希望通过考察和比较自我报告的人格分数和机器算法估计的人格分数在预测大学生平均绩分点和他评的大学适应的校标效度。研究挑选了473个奥本大学的学生作为被试,做了三个工作,一是请被试填写两份自我报告的人格问卷(IPIP300和专门针对学校情境的自我负责性等检验),二是上公司网站与机器人聊天30-40分钟,从学校教务拿到被试绩点(GPA),三是找被试朋友做他评问卷。由此可以得到几组数据——从自我报告中拿到了人格分数,机器算出来的人格分数,以及他评的大学表现,和教务提供的客观指标GPA。但是研究结果表明,自我报告预测分数具有显著性,机器预测分数并没有显著性。这就需要回过头来看建模过程是否有误。后来发现,建模过程的确出现了问题。计算机公司通过爬虫技术去社交媒体上抓取发言内容,并对发言内容进行人为赋值,这显然是具有重大问题的。下一步,范津砚博士选择将现有的473个奥本大学的学生样本扩大至2000个,调整模型再继续研究。这说明,尽管大数据方法具有精度好、效率高等优势,但是还面临着建模成本高等问题,目前还不能完全取代传统人事测评手段。

 

 

 

最后,范津砚博士对大数据方法的未来应用与研究进行了展望。范津砚博士认为,变革时代已经来临,大数据方法在人事测评领域的运用必将愈加广泛,研究者们还是要主动拥抱变革,而不是排斥变革,这样才能与大数据方法共同进步。

在研讨环节,陈丽君教授、博士生杨帆、硕士生范叔祥就大数据方法建模的样本要求、大数据方法的模型更新、大数据方法预测的合理性等问题进行了深入探讨,范津砚博士均给出了精妙的回答。最后,陈丽君教授对范津砚博士精彩的演讲表示感谢,认为在大数据时代已经来临的背景下,范津砚博士的研究成果对我们继续人事测评相关研究有很大借鉴意义。