在法律威胁之后,从Facebook筛选的数据被抹去了


作者:Jim Giles(图片来源:Pete Warden)来自Facebook的法律威胁导致了即将发布给研究人员的社会科学数据集的破坏社交网站的律师在2月份宣布计划发布他从2.1亿Facebook用户的公开资料中收集的数据后,联系了位于科罗拉多州博尔德市的企业家Pete Warden Warden说Facebook如果不删除这些数据就会威胁要采取法律行动他正式销毁了所有记录,称他没有资金来诉讼 Warden的记录包括一个“社交图”,表示数据集中用户之间的所有朋友关系对于社会科学家和其他对人们如何互动感兴趣的人来说,这将是一个强大的研究工具 Warden说,有超过50位研究人员曾要求提供该数据集的副本他已经使用该图表来显示他所覆盖的数据的1.2亿美国用户的社交关系显然集中在区域集群中一些研究人员希望将Warden的数据与其他来源(如人口普查记录)结合起来,探讨收入,流动性,就业和社会关系等因素之间的联系 Warden通过编写“爬虫”软件获取数据,该软件从Facebook个人资料页面中获取信息,无需登录该网站即可查看他收集了用户的姓名,地点,朋友和兴趣,但计划删除姓名并使用其他匿名方法来阻止特定个人资料与个人相关联 Facebook发言人表示,在没有获得许可的情况下编辑他的数据时,Warden违反了该网站的服务条款,并补充道:“从我们联系他的那一刻起,Warden就与Facebook非常合作,他放弃了他的计划”大学的研究员Ben Zhao加利福尼亚州圣巴巴拉在2008年编制了一份包含1000万张Facebook个人资料的数据集他说,他事先通知了Facebook,并且他与该公司的关系一直很友善但Warden决定不通知Facebook并不是史无前例的许多网站托管了一个名为“robots.txt”的小文本文件,该文件由搜索引擎使用的爬虫软件读取,以确定他们可以访问和无法访问的网站的哪些部分(请参阅新科学家的机器人 txt文件)研究人员通常会参考该文件来确定爬虫软件是否可以在该特定站点上运行,而不是阅读服务条款 Facebook的robots.txt文件并未禁止使用抓取工具来筛选公开的个人资料英国剑桥大学的Joseph Bonneau采用这种方法,然后在Facebook上使用爬虫软件来研究在线安全性 “我从来没有要求也没有获得许可,绝大多数研究人员都是如此,”他说 “很多研究人员都有来自Facebook的数据这些数据的法律地位尚不清楚,但Facebook拥有比研究人员更多的法律资源“为了阻止Warden发布他的数据,Facebook可能担心用户对隐私的反对,或者数据可能被滥用例如,
  • 首页
  • 游艇租赁
  • 电话
  • 关于我们