书城经济一本书读懂大数据
21532200000027

第27章 名副其实的“情网”(1)

大数据下的人际关系网

在网络世界中,也许没有哪个线上公司对人际关系的影响力能超过社交网站巨头脸谱了。脸谱如今已经在全球范围内拥有10亿多用户,是大家选择分享照片、更新状态、记录自己与他人生活时间轴的地方。

像脸谱这样的社交网站所呈现出来的关系就是所谓的社交图谱。与一对一关系的单一连接线不同,一个社交图谱由许多互相交错的关系组成。如果张三认识李四,而李四认识王五,那么,在社交图谱背景下,张三和王五之间就通过李四有了联系。而这些联系会因为涵盖兴趣爱好、地域、公司、品牌、生日、状态更新以及其他非人为因素而不断延伸、扩展。在社交图谱中,人们不仅与其他人有联系,也和活动、事件、公司以及产品有联系。

六度空间理论普及了这一概念——世界上的任何两个人就社交联系而言,最多只隔着六步,即六个人。商务社交网站领英充分利用了这一概念,向商界人士展示他们是如何通过中间人与别人相联系的。于是,在这些专业人士想与自己并不直接认识,但是是朋友的朋友,或者同事的同事相联系时,就可以利用这种关联。

在脸谱上,人们之间的联系可能比六度空间理论所暗含的联系更加紧密。一位工程经理圣吉夫·库马尔指出,脸谱的用户之间联系非常紧密,任何两个用户间平均只隔着4.74个人。社交图谱中的关系因为地域、爱好和其他因素的联系而更加紧密。

社交图谱代表着大量关联人之间的关系,它可以回答很多有趣的大数据问题。其中包括数据分析师以及数百万用户有意无意间提出的问题,比如:我应当和谁联系?我应当去关注哪些照片?对我来说哪些信息更重要?虽然大多数用户都不会觉得自己在向大数据(也就是社交图谱)提出疑问,但是,这正是他们在做的事情,或者至少是社会性网络服务代表他们在做的事情。

从技术角度来看,大数据中的社交图谱也同样有趣。回答上述问题要消耗大量的计算资源。每一个问题都涉及对整体社交图谱(术语叫工作集)中的很大一个子集进行处理,也对每一个用户具有高度针对性。还有,社交图谱呈现了大量的实际数据,不仅仅是图表自身体现出的相互联系,还有照片、视频、状态更新、生日以及其他用户的相关信息。一个问题必须反馈正确的关系圈,也必须反馈与这些关系相关的数据,并且这种反馈基本上要是即时的。

作为在脸谱上进行自我表达的多种方法中的一种,“感情状态是惟一直接涉及他人的方式”。我们通常会在社交网站上宣布这些感情状态:订婚、结婚、分手和离异。

2010年,大约60%的脸谱用户都在个人资料中设置了感情状态。同年12月,男女用户设置感情状态的比例为1.10∶1.28,设置了状态的女士人数多于男士。2011年,1/3的离婚申请都提到了脸谱,相比2010年的20%有所增长。在线公布我们的感情状态会加深研究者们所说的“感觉规则提醒”。这些规则就是一些社会规范——告诉我们何时该有何种感觉,以及我们的情感该有多强烈。通过线上公布我们的感情状态,我们会深化、加强这些规则。

像脸谱这样的社交网站也会影响到人的健康和性格。有的人会在网站上真实地呈现自我,而有的人则会因为缺乏安全感而呈现一个美化了的自我。根据来自社交数据网站The Social Skinny的卡拉·普林格列举的相关数据,大约24%的美国人和28%的英国人都承认在社交网站上撒谎,或夸大自己的所见、所闻、所做。

而且,太频繁地查看自己的个人资料也会导致自我意识过重,并产生压力和焦虑。

同时,拥有比别人更多的网友可能会让我们感觉自己得到了额外的社交支持,从而增强我们的自信。脸谱用户的社交网络平均包含229个朋友,约有25%的人相信社会关系网增强了他们的自信心。

有人倘若对在线社交对我们的生活有重大影响存在质疑的话,有一个数据可以证明:40%的人更多时候是在网上交流而不是进行面对面的交流。互联网用户有22.5%的在线时间是花费在网络社交活动上的,而超过半数的脸谱用户每天都会登录网站。

网络约会成功的秘密

2011年,世界最大的婚恋网站Match.com曾做过一系列的研究,探索什么样的个人资料是最成功的在线约会个人资料。在一篇题为“个人照片的4大神话”的帖子中,研究员通过分析7000多张个人照片,并基于每个用户收到的信息数量来确定哪些照片最有利于在线约会成功。当然,仅仅收到更多的约会信息并不一定是好事。质量往往比数量更重要。在我们讨论这个话题之前,可以先看看研究结果。

研究者们将照片分类:调情脸,微笑脸和严肃脸。调情脸指人“直接对着镜头调情,”跟微笑或只是看上去高兴的脸不一样。研究者发现女性在线交友资料照片中的眼神接触至关重要。

长着一张调情脸的女性每月都比别人多收到一点信息,更会明显多于被归类为严肃的人。没有眼神接触,结果就会差一大截。先不考虑面部表情,整体来说,与镜头没有眼神接触的人收到的信息会比有眼神接触的人少一些。

与女性情况相反,男性在资料中使用不看镜头且比较严肃的照片时,最有可能成功约到女性。而男士使用看上去调情且不看镜头的照片的话,最难约到女性。研究者还发现,男士照相时穿着随意还是西装革履,并不会对与潜在伴侣的约会造成大的影响。

其中,研究者发现的最有趣的现象之一是:你是否在照片中露了脸并不会影响你收到信息量的多少。不管照片里看到的是穿戴潜水装备的人、在穿越沙漠的人,还是完全没露脸的人,这些照片和能看到脸的照片一样都会激发网站用户的关注。照片中脸部入镜的女性平均每月会收到8.69条信息,而未露脸的女性平均每月会收到8.66条。而使用脸部照片的男性每10次尝试中,会有5.91次约会成功,而未露脸的男士每10次尝试中,会有5.92次成功约到女性。

那么研究者的结论是什么?照片可以说明一切。照片“激起浏览者的好奇心,很大程度上展示了主角是一个什么样的人(或想成为什么样的人)”。值得注意的是,研究者指出:在没有看到一个人的全身照之前下我们不建议你与此人单独见面。

这一切都说明,大数据不仅仅是商业工具,只要有合适的数据源,它同样也可以向我们展示如何最好地展现自我以寻求到合适的另一半。当然,数据也告诉我们,不能忽视选择正确照片的重要性。

众所周知,人们在网上约会时会言过其实。OkCupid联合创始人克里斯蒂安·如德在另一项研究中,对交友网站的大约151万在线用户的数据进行了观察。

在《在线约会时网友撒的弥天大谎》一文中,如德指出,他发现在身高方面,“几乎所有的男性都喜欢给自己加上5厘米”。

事实上,男性身高“越接近180厘米”,他们越会将自己的身高取整,填上180厘米,“以达到梦寐以求的标准身高”。女性“虽然没有向某个标准身高集中的趋势”,但也会夸大自己的身高。那么收入方面呢?宣称自己年薪10万或以上的人真的有赚那么多钱吗?如德发现,线上约会的人实际收入要比声称的收入少20%。

随着年纪增长,就会更加夸大。40多岁和50多岁的人会夸大30%甚至更多。人们不仅会夸大收入,上传的也是很久之前的照片。

如德研究发现“照片越吸引人,就越有可能年代久远”。

那么,在线约会网站何以决定哪样的人与你匹配,并推荐给你呢?

据《金融时报》刊登在网站FT.com上一篇名为《Match.com内部》的文章称,已有100万付费用户的Match.com网站新推出了一系列代码名为Synapse的算法,以分析“各种因素,从而推荐可以适配的对象”。就我们所找寻的对象来说,我们所说和实际所想并不常一致。虽然算法考虑到了人们宣称的喜好类型,但是它也会将用户实际浏览的资料类型考虑进去。比如,用户说自己喜欢哪个特定年龄段的人,但也会在该年龄段之外寻找合适的对象的话,那么,算法就会将此纳入考虑,并且在将来显示搜索结果的时候会将该年龄段之外的人也包括进来。

与推荐电影或书本不一样,推测喜好会更复杂,因为进行配对的算法必须将双方的喜好都考虑进来。“就算你喜欢‘教父’,‘教父’并不一定也会喜欢你。”Match.com的首席分析师阿马尔纳特·桑博尔如是说道。

虽然Match.com自1995年成立以来,收集了7500万注册用户的数据,却依然没有相关数据显示哪些约会是成功的,哪些约会又失败了,这个问题就是该类算法面临的挑战。无法弥补这一缺口是创建终极配对算法的重要缺失。这也就是为什么在人们取消订阅服务时,网站常常询问他们取消的原因:是因为对线上约会的经历感到失望,还是因为已经找到了对象?这些数据不仅有利于进行市场营销,理论上,它们照样可以用于预测算法的创建。

来自西北大学的伊莱·J·芬克尔和加利福尼亚大学洛杉矶分校的本杰明·R·卡尼在杂志《公共利益中的心理科学》以及《纽约时报》舆论篇中共同发表了一项研究,其中指出在线约会真正重要的是彼此单独会面时是如何互动的,而不是他们在网上说了什么。这两位教授表示:“诸如交流模式、问题解决定势、性和谐等因素才是预测一段关系成功与否的关键。”