弱关系的力量:一项因果检验
摘要:
本研究主要探讨了在领英这个全球最大的职业社交网站上,弱关系对人们找工作的影响。研究团队通过五年时间,对超过2000万人的社会网络进行了多项大规模随机实验,观察了这些改变如何影响他们建立新的职业关系和找到新工作。本研究发现,弱关系确实能够帮助人们获得更多的工作机会,但这种帮助的效果并不是一直增长的。当弱关系的数量达到一定程度后,新增的弱关系带来的帮助就会减少。此外,研究还发现,不同类型的弱关系对工作流动性的影响也不一样。那些有一定共同关系人的中等强度的弱关系,以及互动较少的最弱关系,对于帮助人们换工作最为有效。最后,研究还指出,弱关系的效果受到行业特性的影响。在那些数字化程度较高的行业里,弱关系更能推动工作流动性;而在数字化程度较低的行业里,强关系的作用更为显著。这些发现不仅证实了弱关系在职业社交中的重要性,还为如何有效利用社会网络提供了新的见解。
KarthikRajkumar,领英集团
GuillaumeSaint-Jacques,领英集团
IavorBojinov,哈佛大学商学院
ErikBrynjolfsson,斯坦福大学、美国国家经济研究所
SinanAral,麻省理工学院斯隆管理学院
Rajkumar,K.,Saint-Jacques,G.,Bojinov,I.,Brynjolfsson,E.,Aral,S.(2022).,377(6612),1304-1310.

本文第一作者:KarthikRajkumar
弱关系理论是近一百年来非常有名的社会理论,它对很多网络化的理论都产生了影响,并广泛应用于诸如对信息的传播、社会的动态、人们的集体行动、行业的结构变化、影响力的扩大以及人与人之间的合作进行研究的领域。这个理论主张,那些我们不经常关系的、关系较远的“弱关系”,在给我们带来新的工作机会、职业晋升、薪资增长、创造力和新想法方面,往往比经常关系的“强关系”更有帮助。这是因为弱关系能够让我们接触到社会网络中不同的、多样化的人群,从而获取到新鲜的信息。弱关系不仅仅能提升我们的工作效率和创造力,它还特别有利于帮助我们找到新的工作,因为它能提供不同的劳动市场信息,让工作流动性变得更强。
但是,最近有一些大规模的研究对弱关系理论提出了质疑,他们发现在找工作这方面,强关系可能比弱关系更有用。虽然这些研究构成了对弱关系理论的很大挑战,但研究者们也承认,他们所研究出的结果可能并不是因为关系的强弱真的影响了人们找到工作的概率。总的来说,有两个主要的问题让验证弱关系理论变得困难:一是缺少大量的数据来描述个人如何通过社交关系来获取工作的过程,这让我们很难测量弱关系和劳动市场之间的关系;二是社会网络和劳动市场结果是相互影响的,这使得我们很难弄清楚弱关系和工作之间的因果关系。因为我们的社会网络可能会影响我们的工作情况,同时我们的工作情况也可能影响我们的社会网络。而且,社会网络的变化和工作历程可能还和其他一些我们观察不到的因素有关,比如个人的努力、能力或者社交技巧,这些都可能让弱关系和工作之间的真实关系变得模糊不清。
为了克服这两个实际问题,我们使用了领英(LinkedIn)平台上的大量随机实验数据,对弱关系理论进行了因果关系的验证。领英是全球最大的职业社交网站。通过调整领英“你可能认识的人”(PYMK)功能背后的算法,我们随机改变了超过两千万用户的社会网络中强关系和弱关系的比例。这个功能会向用户推荐他们可能想建立关系的新朋友(实验设计见图1A)。PYMK算法是一个复杂的机器学习模型,它包括以下几个子模型:一个模型预测用户向其他人发送连接请求的可能性;一个模型预测其他人接受这些请求的可能性;一个模型估计用户之间一旦成为朋友后会有多少互动;以及确定这些模型在推荐系统中的权重。实验通过引入新的数据源,并以共同好友的数量作为主要依据,来随机调整弱关系和强关系的推荐比例。我们回顾性地分析了领英在2015年到2019年间进行的两轮PYMK实验的数据。
在第一次实验中,我们回顾了2015年的一个全球性实验,参与人数超过了400万。这其中的人们通过这次实验建立了超过1900万个新的社交关系。我们收集了这次实验中建立的每个关系的强度信息以及工作机会传递的结果。接着,我们又分析了2019年进行的第二次更大规模的全球实验,这次实验覆盖了全球每个大洲和美国所有州,涉及的人数超过了1600万。这其中的人们建立了大约20亿个新的关系,并且在实验期间记录了超过7000万份工作申请,帮助了大约60万人找到了新工作。在这次实验中,我们收集的数据是以每个领英用户为单位的,每个数据点对应一个独特的领英会员(即:每一项节点级别的数据)。而在2015年的实验中,我们收集的数据是以每个关系点为单位的,每个数据点对应两个领英会员之间唯一的关系(即:每一项边缘级别的数据)。具体内容体现在图1B中。


图1展示了实验设计和汇总统计数据。(A)图描述了实验设计以及在节点级和边级分析中结果数据的表现方式;(B)图展示了2015年和2019年实验中各大洲及实验变体的实验单元数量(2015年数据中有98.8%来自美国);而(C)图则展示了我们2019年实验中,按美国各州划分的平均度数、网络多样性,以及实验单元的数量。
我们通过观察领英会员在实验结束后三个月内申请的工作数量来分析劳动力市场的流动性。简单来说,就是看他们在这段时间内通过领英平台寻求了多少新的工作机会。根据已有的研究,我们认为当满足以下三个条件时,就可以认为发生了人与人之间的工作传递:首先,一个用户A在某个时间点D1表示自己在公司C工作;其次,另一个用户B在至少相隔一年后的某个时间点D2也表示自己在同一家公司C工作;最后,用户A和用户B在B开始工作的日期至少一整年前就已经是社会网络上的联系人了。在研究弱关系的文献中,如果这三个条件都满足了,那么这两个用户之间的联系就被认为是一个“顺序工作”(sequentialjob)的联系,这是目前用来衡量社会网络中工作流动性的一种最新方法。
我们评估两个人联系紧密程度的方法主要是依据他们之间的互动的多少,以及他们拥有多少共同好友来进行的。具体来说,我们通过统计领英上会员之间互相发送消息的次数来衡量他们互动的频繁程度。至于他们之间的友谊程度,则是根据他们在建立联系时共同拥有的好友数量来计算的。根据这种基于共同好友的联系情况,我们可以进一步确定他们之间的联系紧密程度如下:

其中i和j是身为领英会员的研究对象,Mij是他们之间的共同好友数量,Di和Dj分别是成员i和j的直接联系总数。网络多样性定义为1-Ci,其中Ci是局部聚类系数。

则不同人之间的结构紧密程度可以被如下表示:

我们发现,人们的社交圈和他们朋友的社交行为都会影响他们关系的紧密程度。所以在实验开始之前,我们就评估了人们之间的关系强度,并观察了他们添加一个新朋友后,这种关系是变得更强还是更弱。我们是根据这个新朋友在所有朋友中关系强度的排名来决定其为强关系还是弱关系的,如果这个新朋友比一半以上的朋友关系得更紧密,我们就认为这是强关系;反之,则是弱关系(如图2C所示)。在建立了新关系之后,我们再观察他们之间的互动有多频繁。我们发现,那些工作机会多的人往往拥有更多的社交关系(如图2A所示),并且在他们的社会网络中,这些关系更加多样化(如图2B所示)。但是,因为这些社会网络的特征往往是自然形成的,所以我们需要利用领英上随机变化的数据来准确评估弱关系对于工作机会流动性的真正影响。
我们采用了一种叫做工具变量(IV)的方法来分析强关系和弱关系对找工作的影响。这个方法通过利用随机分配的新朋友来解决因为社会网络自然形成而带来的问题,从而准确评估新建立的弱关系或强关系对找工作的实际影响。我们用了两步法来计算这些影响:第一步,我们看随机分配的朋友是否增加了弱关系或强关系的数量;第二步,我们用这些新增的关系来评估它们对找工作的实际帮助。
我们从两个不同的角度进行了分析:一是看实验中新增的关系对个人找工作的影响(节点级分析),二是看新增的每一种关系对个人后续找工作的影响(边缘级分析)。在第一步中,我们发现不同的随机分配策略对人们建立新关系的数量有不同的影响,有的让人们建立了更多的弱关系,有的则相反。这些结果帮助我们区分了关系的强度和数量对找工作的不同影响。在第二步中,我们专注于分析那些由实验随机分配带来的新关系对找工作的实际帮助。这样,我们就能够排除其他因素的干扰,比如工作流动性本身对建立新关系的影响,或是人们有意识地根据找工作的需要来调整自己的社会网络,以及那些可能同时影响社会网络和工作机会的其他因素。通过这种方法,我们能够更准确地评估弱关系和强关系对劳动市场行为和结果的影响。

图2展示了网络统计数据和实验处理的第一阶段效应。(A)部分展示了求职者与非求职者的节点级度分布情况;(B)部分则展示了根据成员度的四分位数来区分多样性和网络规模的求职者状态对应的网络多样性分布,其中求职者是指在实验前三个月申请过工作的那些成员;(C)部分展示了2019年实验期间创建的所有关系的边级结构性强度分布,其中判断弱关系或强关系的临界点是实验前LinkedIn网络中的结构性强度的中位数;(D)部分展示了实验处理对成员创建的新关系数量的“第一阶段”效应。图中的点估计和标准误条形图反应了与对照组相比,分配到不同处理变体的成员创建的新关系数量及其在强关系和弱关系之间的相对分配比例。
我们的主要发现详见图3。图3的每个部分的第一列展示了OLS方法的分析结果,第二列则是我们实验中使用的工具变量(IV)方法的分析结果。图中的点表示的是估计的效果大小,而条形表示的是估计的准确性范围。图3A展示了我们在节点级别分析弱关系和强关系对工作机会传递影响的结果。OLS分析再次发现了弱关系的悖论,即强关系与工作传递的关联性更强。但IV分析却显示了不一样的情况,它揭示了关系强度和工作传递之间存在一个非线性的关系,即中等强度的关系在促进工作流动性方面最为有效。由于节点级别的分析统计能力有限,我们进一步在边缘级别进行了更细致的分析。图3B展示了我们对新建立关系的强度(通过共同好友数量衡量)及其对工作传递概率影响的OLS和IV分析结果。OLS分析再次确认了弱关系的悖论,而IV结果与节点级别的IV结果一致,显示了一个倒U型的关系,即在共同好友较少时,新关系的增加会提高工作传递的概率,但当共同好友超过十个时,这种概率会下降。图3C展示了我们对新建立关系的强度(通过互动频率衡量)及其对工作传递概率影响的OLS和IV分析结果。OLS分析显示较强的关系与更高的工作传递概率相关,但IV结果则显示了相反的情况,即新建立的关系越强,工作传递的可能性就越小。这种关系同样也是非线性的,最弱的关系(互动最少)更可能带来工作机会,而最强的关系(互动最多)则可能性最小。此外,对于中等互动强度的关系,它们对工作传递的影响基本保持不变。
图3展示了关系强度对工作流动性的因果影响。这张图展示了在节点级别和边缘级别上,关系强度对工作传递的估计效果。在每个板块中,左列显示的是OLS分析的结果,而右列显示的是2015年进行的第一轮实验的工具变量(IV)结果。(A)图展示了弱关系、中等强度关系和强关系(根据共同好友数量的三分位数定义)对节点级别工作传递的影响;(B)图展示了基于共同好友数量的结构性关系强度对边缘级别工作传递的影响;而(C)图则展示了基于互动强度的关系强度对边缘级别工作传递的影响。
我们的研究主要得到了三个重要发现:第一,通过在领英这个全球最大的职业社会网络上进行的大规模实验,我们解决了弱关系表面上的悖论问题。虽然以往的研究显示强关系对工作流动性很重要,但我们的实验——涵盖了多个样本群体、数年时间以及全球所有地区——证明,相对较弱的关系更有可能提高工作流动性。第二,我们的实验发现,关系强度和工作流动性之间存在一种稳定的非线性关系。与以前的研究结果不同,我们发现,当我们使用关系人之间的共同好友来衡量关系强度时,中等强度的关系最能提升工作流动性,而最强的关系对工作流动性的提升作用最小。当考虑基于互动频率的关系强度时,实验结果甚至直接推翻了以前的相关性证据,表明最弱的关系对工作流动性的促进作用最大,最强的关系则最小。第三,我们的节点级分析评估了实验中增加的弱关系或强关系对整个网络工作传递的影响,而边缘级分析则让我们能够计算添加单个强关系或弱关系的额外效果。结果表明,增加一些互动频率适中且结构上多样化的关系,可以最大程度地提高工作机会的传递概率。以前的研究也发现,弱关系和强关系在不同行业中的影响各不相同。因此,我们研究了强关系和弱关系对工作流动性的不同影响。不过,由于2019年的第二轮实验是在短期内进行的,我们只能将这种不同影响的分析限制在短期内可以观察到的工作申请上。
我们的研究虽然是首次在全球范围内,针对多个行业的大规模样本,提供了关于强关系和弱关系对工作流动性影响的纵向实验证据,但也存在一些局限。首先,尽管PYMK实验为我们提供了一个引入社会网络变化的途径,但我们无法强迫领英用户接受这些建议,因此,谁接受关系建议存在一定程度的自愿性。我们把实验分析视为具有“治疗意图”,并将接受弱关系实验的用户与接受强关系实验的用户和对照组进行了比较。这种方法虽然控制了自愿选择的偏差,但限制了我们结果的适用范围。尽管有些领英用户没有采纳PYMK建议,但大多数人还是接受了,这使得我们的结果在领英用户中具有广泛的适用性。然而,接触和采纳这些建议的程度取决于用户对平台的使用和查看PYMK建议的频率。我们发现接触到我们实验的领英用户相对年轻,工作搜索活动更积极,这明确了我们结果的适用人群。
其次,领英是一个专业的社交软件。领英上的社交活动可能与Facebook这样的在线社交软件上的,或Granovetter最初研究的线下社交关系有所不同。但我们也知道,比如网络聚集性这样的特征,在Facebook、领英和Twitter上是类似的。此外,我们的OLS结果与Facebook上进行的大规模全球性网络和工作流动性研究的结果非常接近,这表明这两个网络中可能发生类似的过程。尽管领英上的工作者人口与美国、欧洲和全球经济体中的工作者人口存在一些差异,但领英作为世界上最大的专业社会网络和最大的工作列表网站之一,许多人依赖它找工作,所以这个网络可能更能代表网络如何在更大的劳动力市场中影响工作流动性。
第三,任何网络实验都必须注意统计干扰的可能性,即一个用户的处理分配可能影响另一个用户的结果。为了尽量减少这种干扰,我们只跟踪了每个用户通过PYMK建议发起的关系。尽管如此,我们的设置中仍然存在三种可能的干扰渠道。首先,如果一个用户的处理分配通过其行为变化影响了其他用户,而这些行为变化对其他用户是可见的,那么干扰就可能发生。然而,这些社交行为并没有受到不同处理的显著影响,使得这种干扰渠道不太可能影响我们的结果。第二个干扰渠道可能发生在,如果用户i打算与用户j建立关系,但因为用户j的处理分配,j在i有机会发送邀请之前就主动发起了连接请求。我们验证了处理是否影响了用户收到的连接请求的数量,结果表明这种影响很小,可以忽略不计。第三,干扰可能发生在新建立的关系改变了其他用户的PYMK建议列表。幸运的是,领英的用户数量足够大,确保了实验期间潜在关系的组成保持一致。此外,PYMK的输入并不频繁改变,新连接不会立即影响任何用户看到的算法推荐类型,确保了实验的稳定性。
尽管存在这些局限性,我们的研究在世界最大的专业社交网络上对几个大规模实验的分析证明了弱关系创造了工作流动性。我们发现中等强度的弱关系最能增加工作申请和工作传递,而强关系对工作申请和工作传递的增加最少。我们还发现了结构性关系强度与工作传递之间存在倒U型关系,以及互动强度与工作传递之间的非单调递减关系,这表明关系强度与工作流动性之间的关系是非线性的。此外,我们发现弱关系对不同数字化程度的行业工作申请的影响存在异质性,弱关系导致了更多的高技术行业工作申请,而强关系导致了更多的低技术行业工作申请。这些结果提供了弱关系强度的首批大规模实验证据,并表明需要修订理论,以纳入关系强度对工作传递的非线性影响、结构性关系强度与通过互动强度测量的关系强度之间的差异,以及弱关系和强关系对行业工作流动性的不同影响。
封面图片来自|588
版权声明:本站所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,不声明或保证其内容的正确性,如发现本站有涉嫌抄袭侵权/违法违规的内容。请举报,一经查实,本站将立刻删除。