对数据权利归属的观点进行归纳,对于拥有大量个人数据的平台,可以将平台数据权属的类型或观点归纳为四种。
数据个人所有
数据权属的第一种类型或观点是数据属于用户个人。在上文提到的今日头条与微博之争中,今日头条的意见是此种观点的典型代表。今日头条认为,微博并不具备对用户数据的任何权利,因此只要爬虫是在用户授权的情形下进行的,那么即使头条违反了微博的robot协议,此类行为也不违法。毋庸置疑,微博可以起诉用户特别是某些大V用户违反协议,因为微博的使用协议写明了微博享有对用户内容的独家使用权,而且微博和某些大V还签订了非常明确的合同。这样一来,微博用户特别是大V用户在使用微博平台发布内容又授权今日头条使用时,微博就可以起诉,要求法院认定此类行为属于违约。但即使法院如此认定,今日头条也可以声称今日头条的行为并不违法,用户与大V行为可能违法,但他们违法与今日头条无关。
事实上,如果强化用户数据个人所有权,将用户对个人数据的权利更多视为人格权而非财产权, 或者将此种权利视为法定的消费者权利,那么微博设置的用户协议可能自始无效。一旦将数据个人所有权视为不可让渡的人格权,那么数据的收集者与使用者就不得限制这种数据权利的自由行使。就像私人之间不得通过合同限制公民对个人姓名的自由使用一样, 企业也无法通过合同而要求个人放弃其数据权利。
欧盟新近确立的数据携带权可以被视为这种个人数据权利的另一佐证。如果认同欧盟《一般数据保护条例》中所确立的数据携带权,那么平台不仅不能对个人数据进行限制,还需要对个人数据的自由流转提供帮助。《一般数据保护条例》规定,“数据主体有权获取其提供给控制者的相关个人数据”,而且,这种个人数据格式应当是“经过整理的(structured)、普遍使用的(commonly used)和机器可读的(machine-readable)”,数据主体有权“从其供给的一个控制者那里无障碍地将此类数据传输给另一个控制者。” 按照这一数据权利,个人甚至可以要求微博对其他平台开放端口,以实现其个人数据的自由移转。
数据平台所有
数据权属的第二种类型或观点是数据属于平台。此种观点最为典型的是今日头条与微博之争爆发后微博所发布的新用户协议,该用户协议规定,“用户在微博上发布的信息,包括但不限于文字、图片视频、音频等,不论微博内容是否构成著作权法意义上的可保护客体,用户同意不可撤销地授权微博平台作为微博内容的独家发布平台,用户所发表的微博内容仅在微博平台上予以独家展示”。 这一新用户协议实质上将数据的权属界定为平台所有,排除了用户对于微博内容进行再次授权使用的权利。
可以想见,数据完全归属平台的观点并不受欢迎。在微博发布新的使用协议后,这一协议就受到了用户与媒体的猛烈抨击,而微博也对这一新的使用协议进行了澄清,并且修改了用户使用协议。更新后的用户协议规定,用户对于其所发的内容拥有版权与著作权,微博作为发布平台只享有一定范围的使用权。用户对于自己具有完全权利的内容可以根据自己的意愿发布到其他平台,无须微博批准、审批、同意。但即使如此,更新后的用户协议仍然强调,未经微博平台同意,自行授权、允许、协助第三方非法抓取已发布的微博内容,仍然属于违法。 因此,调整后的微博用户协议意味着微博不享有相对于用户的数据权利,但享有相对于其他平台的数据权利。
数据个人与平台共有
数据权属的第三种类型或观点是数据属于个人与平台共有。在中国法院的判决中,这是较为常见的一种观点。例如,在新浪诉脉脉一案中,法院认为,数据开放的前提是必须获得用户个人与平台的同时授权。而且,法院为了强调个人数据保护的重要性,还提出了“用户授权”+“平台授权”+“用户授权”的“三重授权”模式,即数据的提供方首先取得用户同意而收集数据,在数据提供方向第三方平台授权使用此类信息时,第三方平台还应当明确告知用户其使用的目的、方式和范围,再次取得用户的同意。 法院的这一判决理由意味着,个人和平台对于数据都拥有一定的权利主张,数据在一定程度上为个人与平台所共有。
当然,在数据个人与平台共有的情形中,个人与平台的权力划分与权利边界仍然是一个问题。在具有竞争关系的网络平台进行爬虫时,双重授权或三重授权的规定具有较强的合理性,而且也具有较强的现实操作性,但在其他场景下,要求平台与个人进行双重授权或三重授权可能会面临种种困境。例如,个人将平台的数据用“复制—粘贴”的方式大量拷贝到其他平台,此种行为显然没有获取平台的授权,但此种行为是否违反了数据的共有产权?此外,当平台所属的网络发生产权变更时,此时产权的变更是否需要获取用户同意?2018年,人人网被出售给多牛传媒公司,其出售的资产包括了用户数据,但在这一出售过程中,人人网并没有履行征求用户同意的环节。无疑,要求人人网出售前征求所有用户的同意,这并不现实。
数据公众所有
数据权属的第四种类型或观点是数据属于公众所有。这种观点认为,一旦平台介入互联网,就意味着平台数据具有了公共属性,不为任何私人或企业所有。在上文提到的HiQ诉领英案中,HiQ公司聘请了哈佛大学法学院的劳伦斯?却伯(Laurence Tribe)教授作为顾问,却伯教授认为,数据与信息的访问权是一种言论自由的权利,受到美国《宪法》第一修正案的保护。根据这种观点,数据的本质其实是一种言论,而言论的本质就是流通与共享,具有公共属性。因此,对数据的抓取就不需要网络平台授权或个人授权。
对于互联网的公共属性,网络法学者奥林?科尔(Orin Kerr)教授曾经有过经典描述。在他看来,互联网的一般原则是开放性,这种开放性允许世界上任何人发布信息或数据,数据可以被任何人访问,而无须进行身份验证。当计算机所有者决定在其机器上设置Web服务器,使文件可以通过Web访问时,这就推定了大众都可以访问这些文件。 科尔教授还打了一个比喻,把网络服务器连接到互联网就像在公开交易会上出售商品,任何人都可以访问网络上的数据或交易会上的商品。 只有在比较特殊的情形下,例如当网站设置密码时,网页才会从开放网页转化为封闭网页。
我国的互联网评论家方兴东曾表达过类似的看法。方兴东认为,从互联网的前身阿帕网(ARPAnet)到后来的TCP/IP协议,以及一系列网络治理机制和技术标准组织,“都坚定地确立了互联网开放、共享、自由、平等的核心价值观和技术规则”与“无歧视、无选择、无条件的互联互通”。但当前中国互联网行业对数据与流量却采取了越来越多的“高筑墙”行为。因此,方兴东认为,无论是淘宝拒绝百度搜索店铺页面信息,百度试图通过Robots协议拒绝360搜索的“3B大战”,微信频频对滴滴、淘宝、今日头条、抖音等竞争对手进行选择性的屏蔽,还是百度大规模自我导流,甚至不再显示搜索结果中外部网站的地址,都与互联网的精神背道而驰。