当前位置: 首页 > 法学实务 > 审判研讨
【主题分享】杨德嘉:关于平台数据竞争问题中的认识误区与思考路径
作者:杨德嘉  发布时间:2022-03-10 10:10:48 打印 字号: | |







2月25日,北京知识产权司法保护研究会第一届会员大会第四次会议通过线上方式召开,来自北京法院系统知识产权法官个人会员、单位会员参加了此次会员大会。


本次会员大会主题分享部分,分别邀请了个人会员北京市高级人民法院知识产权庭闻汉东法官、北京市海淀区人民法院知识产权庭负责人杨德嘉法官,以及单位会员京东集团法律合规与知识产权部负责人胡焕刚、贝壳集团法务中心商标及版权部高级经理牛红霞、美图高级法务总监陈劲松,分别就“数字经济下的知识产权保护”主题进行了专业分享。





关于平台数据竞争问题中的认识误区与思考路径



杨德嘉法官以“关于平台数竞争问题中的认识误区与思考路径”为题,结合案例重点分析了涉及平台数据竞争的相关争议,特别是对hiQ Labs v.Linkedin Corp案(以下简称hiQ案)、数据可携带权以及“互联互通”“数据共享”等问题的认识误区,并强调解决此类纠纷的正道,应当是回归法律分析的方法与利益平衡的目标。





一、对hiQ Labs v.Linkedin Corp案的误读


有观点认为该案反映出美国法院已明确认定爬取、使用他人“公开数据”具有合法性。我们首先需要注意的是,美国最高法院在2021年6月已将该案发回重审,并提出参照该院在Van Buren v. United States案(以下简称Van Buren案)中的意见进行审理。而Van Buren案的核心问题在于到底什么是“未经授权/超越权限的访问”。因此至少目前来看,hiQ案尚未有最终结论,至于未来是否会发生重大的变化,也未可知。


即使我们仅从hiQ案的第一、二审观点去看,法院之所以能够支持hiQ爬取数据的请求,也是基于了三个方面的因素进行考量:


第一,是对以往动辄认定爬取数据构成违法甚至入刑的一次纠偏。从美国的司法实践看,在过去,无视数据控制者的网页声明、违反服务条款、不顾警告函件等进行数据爬取,都是可能触发CFAA(《计算机欺诈与滥用法案》),导致民事、刑事责任的,就更不用说违反robots协议或者破坏加密措施了。现在,即使美国对数据爬取有审慎适用CFAA(特别是刑事责任)的趋势,但相对而言,其对数据的保护仍然是非常严格的。在这次的hiQ案中,法院对CFAA的讨论,有这么几个值得关注的重点:一是重申立法目的——当时是为了加强公共安全和金融数据的保护 ;二是强调时过境迁——技术和经济都有了很大的发展变化;三是力求与时俱进——毕竟是一部30多年前的法了,在今天的适用还是应该有所调整,来适应新的市场环境。所以我们看到,美国近期的案例传递出的信息,应当是对以往过激(尤其是刑事)保护手段的纠偏,而恐怕不是对数据爬取的全面放开和松绑。


第二,是充分关注到hiQ对数据使用的方式。Linkedin作为数据控制者,是一个面向个人用户的职场社交平台,其允许各方在其平台检索所有公开的信息。而hiQ作为一家初创公司,主要是通过抓取Linkedin、Facebook以及Twitter等平台中公开的个人信息,以相关数据为基础进行深度加工,进而向其客户即雇主企业提供算法推测服务,如预测员工是否会辞职、工作满意度等。也就是说,hiQ不是简单的搬运和展示源于Linkedin的数据,这一点是至关重要的。首先,hiQ是对Linkedin的数据进行深度加工之后,面向市场推出了自己全新的产品和服务。其次,与Linkedin相比,hiQ面向的是不同的用户、提供的是不同的服务、满足的是不同的市场需求。因此,该案中一二审法院之所以要求Linkedin解除对hiQ数据爬取的屏蔽,其核心理由就是看到了hiQ在促进服务供给、提升社会福利和激发市场活力等方面所能产生的重要增益。这也是该案件与我们国内近几年“复制+粘贴”式的爬取、使用他人数据和内容的案件之间所存在的显著的、本质的不同之处。


第三,也是一个很重要的考量因素,那就是Linkedin具有明显的限制竞争意图。因为此前hiQ以同样方式已经爬取了Linkedin很多年的数据,双方一直相安无事。恰恰是在Linkedin的母公司微软准备推出一个与hiQ类似的产品之后,针对hiQ数据爬取的屏蔽就启动了。这恐怕也是法院决定发出禁令的重要原因之一。


总之,hiQ案禁令的颁布,是包括但不限于上述各方面因素,被美国法院进行综合衡量之后得出的结论。无论这个案子将来会出现什么样的最终结果,与我们国内此前类似“微博v脉脉”“大众点评v百度”,以及复制粘贴式的内容搬运等情况都是有着本质不同的。其中的区别,基本上可以比照著作权领域里,对他人作品进行合理使用、转换性使用等合法性质的使用方式,与图书盗版、文章抄袭等侵权性质的使用方式之间的差异。


当数据控制者拒不提供数据、拒绝爬取的时候,应该怎么办?hiQ案目前给出的答案是:先去通过市场谈合作,不行的话就通过法院进行诉讼。无论如何,我们恐怕都难以解读出,美国法院有鼓励hiQ们去直接、强行爬取他人数据的意思。法治环境下,当通过市场交易难以实现经营目的、获取经营资源的情况下,以诉讼为代表的公力救济毫无疑问应当成为解决争议的首选方式。历史经验告诉我们,对强行爬取他人数据等的所谓私立力救济方式的放任,往往将导致竞争与对抗最终走向野蛮和无序。


对于数据竞争的规则,世界各国普遍还处于探索的过程中。对我们而言,在当前阶段的个案中,具体情况、具体分析、具体判断仍然是主要的方式。在分析和解读在先案例时应避免断章取义、以偏概全,尤其应避免在“以点概面”的基础上提炼“夹生规则”甚至“伪规则”,为将来的进一步探索设置“真障碍”。切勿在“只见树木”阶段,就急着去“定义森林”。


二、对数据可携带权(Right to Data Portability)的误解


欧盟的GDPR中规定,用户有权从数据控制者手中获取自己的数据,且该数据格式应具备被携带至另一数据控制者所必须的通用性。有观点据此认为,用户数据可携带权意味着:只要有了用户的授权,就可以直接去数据控制者的平台上爬取数据。


这种理解恐怕忽视了一些核心要素:


一方面,欧盟制定GDPR的核心目的是保护个人的信息安全,保障个人数据按照数据主体的意愿自由流通;企业、平台之间的商业数据竞争,并不是它规制的目的和重点。


另一方面,GDPR所针对的数据类型和数据迁移方式都是有明确指向和规则限制的。1.数据的类型:自然人、非匿名数据(地址、用户名、年龄;使用设备或服务中形成的数据)。这些都是具有紧密人身属性的数据,而非平台经过集合、加工形成的海量的、商业化的衍生数据。2.数据迁移的发起:应由用户主动向数据控制者提出数据传输,这显然排除了由数据获取方去径行爬取的方式。3.意思表示:各方明确同意或遵循合同约定。其中作为委托方的用户在数据迁移中处于核心地位,数据控制者和数据接收者均为受托方,他们均是依用户指示进行相应操作,二者之间并无直接的意思联络。4.如果其中涉及第三方主体的数据,则原则上须经该第三方同意方可进行传输,仅在银行交易数据等个别情况下设置了例外。对此可以理解为“谁的数据谁做主”。5.技术可行、成本合理:要求数据控制者不得设置传输障碍,但也并未令其主动实施格式兼容。此外,数据控制者也可针对用户频繁的数据传输请求等收取相应费用。


此外我们还可以看到,2021年美国的加利福尼亚、科罗拉多、弗吉尼亚这三个州也通过了有关数据保护的立法,相关规定也都是以消费者的隐私和个人信息为核心作出的,并且还专门明确:用户虽然有权提出数据传输要求,但一年之内不能超过两次。


因此,从域外法律规定的情况看,无论是在数据的类型,数据迁移的发起主体和具体流程,还是在各方权利义务的设定与平衡等方面,其规则与目前我们在国内看到的数据爬取纠纷,都是无法对应和适配的。特别是,与此前一些案件中的大规模、高频率数据爬取,乃至几乎是同步的、海量的内容搬运,都是风马牛不相及的。


三、对“互联互通”“数据共享”的误用


近年来有一种理解或者说倾向,似乎“互联互通”和“数据共享”已经成为了数据市场的最高准则和终极目标,应当被无条件地予以贯彻执行。


在讨论过程中,也有人曾以Facebook 与 Google相互开放数据为例,来印证数据共享是如何地大势所趋。但这个事例,真的是GDPR规定显灵了吗?真的是网络巨头们受到了“互联互通”等口号的感召了吗?其实,只要我们稍微多做些了解就不难发现,Facebook 与 Google的数据合作从启动至今,已经在多个国家触发了反垄断调查和诉讼。由这个情况看,二者之间的合作所指向的似乎并不是数据自由流通与共享,而恐怕是相反的、加强数据垄断的共谋。


在讨论复杂的数据流通与竞争问题时,有一点是非常重要,也是我曾经反复强调的:不能混淆个人数据与平台数据。很多市场经营者打着“促进个人数据流通”“尊重数据主体意愿”旗号所实施数据爬取和搬运行为,针对的都不是原始的、分散的、市场价值较低的、单个主体的原始数据;而是其他平台(数据控制者)投入大量资源收集和加工过的、易于商业应用的、市场价值很高的、集合而成的衍生数据。在这些情况下,其行为表面上看仅仅是在爬取数据,但深层次的本质却是:在自身不付出相应商业成本的情况下,强行攫取他人通过高投入、高风险、长期积累和不断改进而形成的网络产品和服务成果本身。这是典型的食人而肥的数据寄生行为。


我们可以借鉴自然环境中的例子,帮助大家来思考网络环境中的数据竞争:不同主体之间互利式的共生,例如鳄鱼与牙签鸟之间的互取所需,当然是最理想的状态,法律没有任何干预的必要;偏利式的共栖,例如海龟、鲨鱼与带吸盘的小鱼之间的关系,法律也无须介入,因为一方虽然搭了便车、占了点便宜,但不至于实质性影响他人的生存甚至破坏整个生态;但如果是对宿主吸血致死式的寄生,例如菟丝子与被寄生的宿主植物之间的关系呢?这时难道还要让法律的子弹再飞一会吗?我们准备看着这些子弹飞到何时,飞向哪里?宿主如果都这么死掉了,今后哪里还有寄生之所呢?长此以往,整个生态是否还能健康发展甚至维持下去?


互联网的核心是“互”,即有所取,有所予,而不是单向的索取。互联互通的基础和前提是互惠互利。我们应当时刻围绕市场经济的核心,同时也是维护市场竞争秩序的核心,来展开思考和讨论,那就是:平等、自愿、互利。通过“寄生式的损人利己”换取发展和利益,绝不是互联网精神的本质,也不可能具有可持续性。


最后我想说的是,我们在探讨前沿问题的时候,特别需要注意避免落入口号陷阱。如果我们作为法律人,跳过法律的规定、规则、原则和原理,抛弃逻辑思维和分析方法,无视市场竞争中不同主体之间长远的、整体的、动态的利益平衡,而是动辄就基于某些漂亮的口号,给出一些貌似正确的结论,那不仅是非常可怕的,也是非常可悲的。



 
来源:北京知识产权司法保护研究会
责任编辑:范静