使用社交账号登陆

当前位置: 主页 > 前沿 > More than Science

定位社交网络用户

时间: 2016年10月31日 | 作者: 廖兰晶 | 来源: 环球科学
研究人员通过数据挖掘的方法,根据用户行为定位了不同社交网络上的相同用户,哪怕他们的用户名和填写信息并不相同。

撰文 廖兰晶

图片5.png

 

    全球约有16.1亿人每月至少使用一次社交网络,很多人在不止一个社交网络上注册,例如Facebook,Twitter,Linkedin等等。不同社交网络的功能各有不同,每个社交网络都记录了用户日常生活中的部分行为模式,如果能通过数据挖掘方法自动发现每个用户在不同社交网络中的账号,实现不同社交网络的自动集成,就能获得网络用户完整的兴趣图谱,这在社交广告、个性化信息推荐、市场营销等方面中有巨大的应用潜力。

    不过,这项研究存在很多挑战。首先,从图论的理论基础来说,实现不同网络节点之间的最佳匹配是一个NP难问题(也就是说,所有NP问题都不会比它更难)。其次,大部分人一般使用12个主要的社交网络,而在其他社交网络上并不活跃,有时甚至故意隐藏身份,很难在这些行为痕迹较少的社交网络中定位某个特定用户。此外,随着社交网络的数据越来越大,实际应用对算法的效率和速度的要求也越来越高。

    清华大学的唐杰教授、加拿大西蒙弗雷泽大学的裴健教授等科学家一起合作,找到了一种新方法,解决了这一难题。他们设计出了一种基于能量的数学模型,可以为每种用户匹配定义一个“能量值”,通过寻找模型的能量全局最低点,从而发现最优的网络匹配结果。研究人员使用了Linkedin、Flickr、Myspace和ArnetMIner等7个社交网络验证了他们的模型,预测准确率达到80%,比目前已有的方法提高1030%左右。

    研究结果发表在了2015年的数据挖掘及知识发现会议(KDD)上。

 


  • 相关文章