大数据环境下的数据利用规则

■新浪网高级法律顾问 王磊   2017-05-29 00:18:06

今天我将从四个方面对大数据环境下的数据利用规则进行介绍, 分别是数据和商业数据的定义、 OPEN API的数据利用规则、 脉脉不正当竞争案的思考以及对于一些数据利用的建议。

大数据时代, 我们更加关注数据, 这正是信息技术的突破性发展。正如开发海量数据进行有效的分析,同时得到商业化的内容, 这个时候我们说数据才具有更多商业价值的属性。 无论是互联网公司还是企业, 甚至之前的运营商, 认为数据有更多的商业价值。

数据的归属不能一概而论

数据到底应该归谁? 数据因为涉及到个人信息、 个人隐私, 肯定有人身权的属性, 还可能被商业化从而具有财产性的属性, 基于这种属性的二元论, 是不是要将其纳入知识产权里? 尤其是个人信息权益相关的法律规定。 也有产业界的人提出是不是可以形成新的权利, 其实我们自己的想法, 实际上和具体的信息、 具体的数据是有差别的。 数据的性质不同, 权属也不同。 像我们所说的数据的类型、 形式, 有些是公共属性。 比如天气信息, 近十年的天气信息是不是有效的商业属性? 如果是有效的商业属性, 它的权属怎么样? 我们的个人信息到底怎么样? 这些都是值得讨论的。 数据应该归谁? 应该和平台的责任一样, 是要进行区分的。 这个区分要看数据的划分, 才能有一定的稳定性。

例如, OPEN API是针对于我们, 尤其是移动互联时代提出的新的接口。 API实际上是为了有些移动应用在使用过程中获取数据, 让信息沟通方便, 由数据开放平台提供API的接口, 一些开发者能够有效的出去。这里面有各方的主体, 像信息来源,大多数情况下都是用户, 当然也不排除大数据的交易平台。 同时, 数据的平台方, 以微博为例的社交媒体平台, 这里可能有一些UGC的内容,个人信息的地理标识、 喜好, 甚至相关的职业信息和教育信息, 这些都是属于平台方自己的数据。 同时, 数据利用方以及各方的移动APP应用,通过OPEN API的一些协议, 获得相关的数据接口, 实际上也是达到了数据导流的方式。 此时, 有效地解决数据应用的冷启动问题, 有些数据平台上的用户, 通过OPEN API的协议获得了新应用的适用。

我们所说的脉脉软件被诉不正当竞争案就是基于OPEN API。 脉脉其实是我们曾经的一个第三方应用软件的合作方, 但微梦公司是微博的实际运营方, 在合作过程中发现, 脉脉的注册用户大量地存在注册用户和非注册用户混用的现象, 比如直接使用了新浪微博的用户头像、 名称和职业信息, 这个具有很明显的指向性, 被认为可能存在侵犯用户个人相关隐私的情况。 考虑到现有的法律制度, 提起了不正当竞争。 此案在2016年12月30日宣判, 被认为是大数据时代针对个人信息和用户信息保护的实案。

数据属性的认定

针对这个案子可以得到一些启示。 第一, 对于数据属性的认定。 通过司法案例确认一个数据信息是重要的商业资源, 像之前给大家介绍的一样, 它在未来被定义为新石油, 对于各个公司的商业价值不言而喻。 用户信息是提升企业竞争力的基础和核心, 对于数据的应用, 以及个人用户信息的滥用, 到底通过什么样的方式进行保护? 这个是通过微梦诉脉脉的案子得到了一定的确认。

第二, 明确了互联网中用户信息的基本原则, 用户明示同意和最少够用的原则, 在此情况下对搜集用户信息形成相关的数据流以及数据库, 后续再进行商业化利用, 这个应该是大数据应用或者大数据时代里面平台所承担的基本商业道德和原则。

第三, 这是非常有意思的地方,叫做三重模式。 之前各位老师也提到了, 用户授权+平台授权, 再回到用户授权。 第三方应用在获得相关信息时, 最初有用户授权才能通过API的接口, 但是 API 又与平台签订了OPEN API的协议, 这个时候已经拿到了用户的初步授权和平台授权, 但它在进行商业化的时候依然需要用户进行再确认, 目的就是通过三重授权的模式得到有效的规制, 同时又明示用户的义务。 脉脉这个应用就是恰恰没有通过用户的再授权, 导致了不正当竞争的行为, 也就构成了侵权。

此外, 我们确定了网络平台提供方的合法商业化数据的提起诉权的主张权利。 无论是数据, 还是个人信息, 对于数据来说, 可能现在的权属还比较模糊, 到底它是什么性质的权利, 大家依然没有确定, 这个时候提起诉讼, 或者通过司法手段保障自己的权利, 还存在着一定的障碍。 通过个人信息保护, 个人信息保护法正在进行立法的进程当中, 此时通过不正当竞争的手段, 由网络平台提供方提起针对商业化数据的保护主张是非常必要的, 而且具有一定的示范意义。

数据利用规则及思考

通过此案例可以总结出平台或者是商业数据利用的基本规则。

第一, 合法、 正当、 必要。 在利用数据的过程中, 首先要是正当性以及必要性, 以及之前提到的最少够用原则。 然后是合法来源, 通过非法手段获取的相关信息, 比如像抓取、 被盗的非法抓取, 商业数据本身存在瑕疵, 在后续的商业化利用中就会存在障碍。 第二, 安全保障原则。 在作为数据平台的过程中, 其实具有一定的义务, 一定要对自己所收集到的数据信息起到安全保障作用。 第三, 用户告知及授权。 在合作过程中, 要通过用户的明示得到使用或者商业再利用的方式, 此时用户如果没有经过告知和授权, 这个时候就没有得到正当合法的源头。 第四, 公平、 合理、 有序。 这是在未来过程中, 认识到整个大数据行业的发展, 其实由于商业的属性和商业价值, 各家的主体, 无论是传统运营商, 还是现在的互联网媒体、 平台, 以及各家电商企业都会意识到, 充分地挖掘商业属性, 这个时候一个有效、 公平、 有序的行业竞争秩序是非常有必要的。 这是我们经常讲的要提供一个好的平台, 设立一个行之有效的标准。 这个标准才能更好地、 更有利地促进我们所说的大数据行业的发展。

最后, 防止数据滥用。 一直以来都存在一个困惑或者存在一个博弈,或者利益考量的方式。 怎么样提供数据, 如果数据脱敏到形成一张白纸,这个时候商业价值是非常有限的。 但如果没有进行脱敏, 这个时候实际上是对用户或者对数据构成了一定的侵害。 此时, 数据滥用的尺度和数据滥用的相关范围, 是需要明确的。 基于数据利用规则, 比如说如何有效地防止数据滥用和以上四个原则结合起来一起使用, 才能保障数据既可能实现商业化的价值, 同时又有利于保护相关的各方主体的权益。

针对数据利用的思考, 提供以下四个方向: 第一, 加强立法建设工作。 无论是数据利用, 还是个人信息范围, 都一直处于比较模糊的状态,无论是立法工作还是行业指导规范,都需进一步加强。 第二, 作为企业在实践过程中, 有一些黑产业进行不规范的使用, 对于整个行业、 整个数据, 甚至对于平台都是非常不利的。此时, 在执法上怎样对黑产业进行有效打击, 这也是我们作为企业非常关注的问题。 第三, 呼吁建立一个数据追溯机制, 很好地解决合法和有效来源的问题。 即使合法有效来源是安全的, 在往上追的时候, 可形成倒逼的追责机制, 有效避免黑产业和非法数据利用的源头。 最后, 授予平台方对于数据的主体角色。 无论是平台方还是数据方, 在数据使用过程中对于数据的商业价值都参与了整个建设工作, 这个时候对于数据的保护也好,还是对于数据的使用利用也好, 其实平台方更有主体便利性。 第四, 如果发生了数据的侵权, 平台方有更好的技术手段和人员配备, 可以有效发现这个问题, 比如说个人信息。 个人信息对于用户本身来说, 可能发现问题会存在一定的延迟性, 也可能造成时间上的延迟, 导致不可避免的后果。从平台方授予相关的主体地位, 有利于数据产业有效的维权, 或者有效净化, 这是非常必要的。

(根据作者在3月29日“大数据法律规则与实践论坛” 上的演讲整理而成, 未经本人确认。)

上一篇回2017年5月第16期目录 下一篇 (方向键翻页,回车键返回目录)加入书签

© 2016 毕业论文网 > 大数据环境下的数据利用规则