数据:转变全球经济的燃料

2022年3月

詹姆斯·纳顿,自由撰稿人

数据具有驱动开发创新产品和服务、改善社会、应对卫生和环境挑战的力量,但是要怎样做,才能在从数据中提取价值与保护知识产权和其他权利之间取得平衡?

你今天早上早餐吃了什么?你有多高?你的车轮胎压是多少?你最近一次在网上购物是什么时候?你的基因指纹什么样?我们生活的方方面面都离不开数据,在过去几年里,我们存储和分析数据的能力成倍增长。这就提出了一些复杂的问题,例如:如何评价数据,如何提取这种价值,如何安全地分享数据,以及需要承认和保护哪些权利?

这些问题正是20219月举行的产权组织知识产权与前沿技术对话会第四届会议(第一天第二天)讨论的部分议题。前沿技术包括人工智能、区块链、物联网和机器人,据估算,到2025年将成为3.2万亿美元的市场。

2021年9月举行的产权组织知识产权与前沿技术对话第四届会议的主题为“数据——在完全互联的世界中里超越人工智能”,讨论了知识产权与数据之间的相互作用。(图:WIPO)

来自130个国家的逾1,600人注册参会。五个小时的讨论涉及数据的保护和监管、数据在人工智能中的作用以及如何平衡获取和控制,并列举了数据在研究和企业中的应用。这些例子包括从使用人工智能制作音乐到监测蜂箱中蜜蜂的行为,不一而足(阅读“恐怖谷:开辟音乐创意新时代”和“Beewise:打破思维定式,拯救世界蜜蜂”)。

产权组织总干事邓鸿森在介绍会议时说,数字化进程因2019冠状病毒病大流行而加速:预计到2023年将有430亿台设备连接到物联网,每天有超过100万个5G新用户。“如果数字化是未来经济的引擎,那么数据就是它的燃料,”他说,并指出,现在世界上60%的人口都能上网:“越来越多的连接和由此产生的数据流正在为前沿技术的崛起提供动力。在这个相互连接的世界中,我们理解数据的性质及其价值至关重要。”

“如果数字化是未来经济的引擎,那么数据就是它的燃料,”产权组织总干事邓鸿森(上图)在2021年9月举行的知识产权与前沿技术对话会第四届会议上说。(图:WIPO/Berrod)

数据的价值

会议第1小组“数据——在完全互联的世界里超越人工智能”的主持人,世界银行的迪安·乔利夫举了一个关于数据能量令人印象深刻的实例。1999年,BOB06旋风摧毁了印度的奥迪萨邦,造成近一万人死亡。作为应对,该邦的灾害管理部门被赋予了收集、评估和分析气象数据的职责。2013年,当类似规模的旋风袭击奥里萨邦时,超过一百万人被疏散,数千人的生命得以挽救。

乔利夫先生说,奥里萨邦这一案例显示了数据的价值——即使是收集和跟踪了多年的数据——在应用了严格的标准后会增加:“通过建立一个数据系统,使数据更具有互操作性和可获取性,并使所得结果能够以及时和可理解的方式进行交流,这些数据就变成了无价之宝。”

随着智能设备和传感器现已无处不在,数据可以改变企业和社会的各个方面。但是,阿联酋迪拜未来基金会的高级研究分析员阿鲁巴·哈立德说:“数据的价值在很大程度上取决于利用其驱动的洞察力,并在一定程度上取决于这些洞察力应用的规模。”

哈立德女士说,数据可以用来简化操作,提高成本效率(例如,飞机制造商空中客车公司通过分享设计和工程数据,将供应商的交货时间从几周缩短到仅几小时)。它还可以用来实现基于创造定制产品的新业务(如亚马逊、NetflixFacebook),并可以创造倘若没有数据则无法想象的全新部门和业务:这方面的例子包括所有依赖卫星信息数据的行业和新兴的精准医疗领域。

随着智能设备和传感器现已无处不在,数据可以改变企业和社会的各个方面。(图:metamorworks / iStock / Getty Images

货币价值和社会价值

正如这些例子所显示的,创新产品往往需要来自多个来源的数据组合在一起,而筑墙可能会阻止这种价值的实现。联合王国剑桥大学公共政策教授黛安娜·科伊尔认为,不仅数据共享是必要的,免费提供某些数据也是必要的。数据有货币价值,但也有社会价值;后者很难计算,可能无法吸引私人投资。出于这个原因,政府长期以来一直将国家统计数据等数据作为公共产品提供。“政策干预可能会取得更好的成果。可能具有私营公司和个人无法捕捉到的社会价值,”科伊尔教授说。

其他发言人表示赞同。肯尼亚斯特拉斯莫尔大学知识产权和信息技术法中心的卡罗琳·万吉鲁·穆奇里强调了影响不同国家的背景。例如,在一些非洲国家,公共服务的提供取决于对数据的获取,而宗教机构和人道主义机构等组织则掌握着大量的关键数据。在一些国家,殖民机构仍在起作用,这带来的后果包括缺乏有关女性的数据。

日本庆应义塾大学综合政策学部教授國領二郎提出问题,因为数据积累起来才具有最大价值,基于私有财产权的西方所有权方法是否不如源自亚洲的仁爱原则更为合适。他说,根据这些理论,数据可能最好被理解为属于整个社会,而不是属于个人。他说:“我们愿意强调和谐和尊重,而不是个人权利和自主权。”抑或可以找到第三种方式,纳入对原始数据提供者的忠诚?“我们需要思考应该崇尚什么样的数字经济风气,”國領教授说。

结构化和可互操作

积累海量数据(“大数据”)的能力是我们的数字足迹扩展所致;它是由设备互联和更便宜的存储所驱动的,而且可能加速。产权组织总干事邓鸿森说,世界上90%的数据是在过去两年中产生的,每天产生的数据量比大英图书馆的馆藏量大2,500倍。但这些数据的规模自身就提出了挑战:怎样识别相关数据,怎样促进互操作性,确保公平和包容,减少共享效率低下的问题?

积累海量数据(“大数据”)的能力是我们的数字足迹扩展所致;它是由设备互联和更便宜的存储所驱动的,而且可能加速。(图:sefa ozel / E+ / Getty Images

背景是关键,科伊尔教授说:“我的体温只有在我知道人均体温是多少的情况下才能提供有用的信息。”医疗数据在诊断或预测疾病方面可能非常强大,但只有当它与其他信息相结合时才能做到这点。有些数据即使在使用后也能保持价值,但有些数据(如交通或天气数据)会很快失去价值。

对数据的细化理解,在考虑到不同的背景的同时,需要创建在不失去其价值的情况下可以转移的结构化数据,以及促进互操作性的程序。新加坡管理大学法学教授刘孔中在其发言中提出了一个统一的数据格式标准,以促进包括跨境的数据交易。

医疗数据在诊断或预测疾病方面可能非常强大,但只有当它与其他信息结合在一起时才能做到这点。有些数据即使在使用后也能保持价值,但有些数据(如交通或天气数据)会很快失去价值。

监管矩阵

关于共享和交易数据的讨论引发了关于如何定义、分类和监管数据的难题。这些难题涉及安全、道德、隐私、所有权和其他事项。有一系列复杂的区域和国家协议处理这些问题。许多问题还涉及基本权利。

例如,隐私权与敏感数据或个人数据特别相关。自互联网兴起以来,立法部门对保护隐私给予了很大关注。其中一个范例是《欧盟一般数据保护条例》。相对于对安全漏洞、尊重保密性和对个人数据失去控制的关切,隐私权仍然是许多立法者的优先事项。

关于共享和交易数据的讨论引发了关于如何定义、分类和监管数据的难题。

但科伊尔教授认为,过于关注隐私“会增加遗漏有价值用途的危险”。其他发言人与她有同样的关切。需要找到解决这一困境的方法。这些方法可以包括确保数据只用于特定目的;要求所有的使用都要征得同意;建立公平和诚信等原则;或者甚至为数据提供者创设忠诚的受信责任。无论何种解决方案,数据必须都是可追踪的,这样才能保证诚信。

在个人、企业和政府处理这些问题时,值得退一步考虑推动数据利用的价值观。正如联合国教科文组织生物伦理和科学伦理科科长达芙娜·法因霍尔茨在她的演讲中所说:“法律是经过编纂的伦理,人工智能技术不是价值中立的。”

202111月,联合国教科文组织大会在经过多方利益相关方的磋商进程和成员国的意见后,通过了《人工智能伦理问题建议书》。该建议书包括十项原则,以确保“使人工智能技术的开发和应用做到以健全的科学研究以及伦理分析和评估作为指导。”建议书还包括数据隐私、共享和治理问题,并承诺为持续的数据辩论提供一个模板。

关于共享和交易数据的讨论引发了关于如何定义、归类和监管数据的难题。大多数数据无法无缝整合到现有的监管框架,如现有的知识产权制度之中。(图:utah778 / iStock / Getty Images Plus

知识产权在何处发挥作用?

大多数数据无法无缝整合到现有的监管框架,如现有的知识产权制度之中。正如国际知识产权保护协会(AIPPI)的布雷特·赫里夫纳克所说:知识产权保护“头脑的创造产物”,但大多数数据都不是创造性的。专利可以保护应用数据所用的工艺或数据产生的方式,但不能保护数据本身,而版权保护可以保护某些类型的数据,但一般只有在有结构和有独创性的情况下才能保护。“这些知识产权权利是有限的——替代办法是商业秘密和合同法,”赫里夫纳克先生说。

商业秘密提供了可以保护数据的“灵活制度”,巴西Kasznar Leonardos事务所高级合伙人伊丽莎白·卡斯纳尔·费克特说,并补充说她看到“更细化的合同”规定了数据的所有权和许可,以及权利的平衡。“我们需要在数据所有者和对许可感兴趣的人之间建立一体化系统和模式,”她说。“知识产权必须遵循常规业务路径。”

数据给知识产权制度带来了复杂的问题。知识产权既可以激励对生成数据的投资(例如通过数据库的权利),也可以因受限的文本和数据挖掘条款构成对数据获取的阻碍。

在欧盟,自1996年以来一直有特殊保护,以回报制作数据库的投资,但是在收集和汇编构成数据库的数据方面必须确有大量投资。“数据库保护能否对人工智能数据挖掘产生的数据的法律保护发挥作用?人工智能系统所做的处理是创造数据还是获取数据?”塞浦路斯大学私法和商法副教授塔蒂亚娜·埃莱妮·西诺季努问道,她总结说:“法律是否保护这类数据库尚不明确。”

数据挖掘——提取大量数据集的过程——引发了若干有争议的问题,特别是在所涉及的数据受到或可能受到版权保护的情况下。一些国家,特别是日本,已经为文本和数据挖掘提供了广泛的版权例外,以促进人工智能的发展。然而,根据美国版权法,是否允许数据挖掘属于一般的合理使用例外。在欧盟,已经实施了一项文本和数据挖掘条款,允许为研究而挖掘。然而,商业和非商业用途之间的区别会导致不确定性。正如瑞士巴塞尔的Lenz Caemmerer事务所合伙人卡洛·斯科洛·拉维扎里所说:“阅读的未来是挖掘——而挖掘的未来是值得挖掘的内容。”

结论:在知识产权背景下

讨论的广度显示出围绕数据的问题是多么广泛和复杂。在会议的最后部分,来自世界各地的利益攸关方就多个议题作了发言,包括知识产权制度如何支持数据驱动的创新、文本和数据挖掘、透明度和信任的必要性,以及如何在相互竞争的利益之间取得适当的平衡。这体现了这些问题的广泛影响,以及许多人真正怀有的关切。

所表达的各种观点表明,数据给知识产权制度带来的问题是非常复杂的。知识产权既可以激励对生成数据的投资(例如通过数据库的权利),也可以因受限的文本和数据挖掘条款阻碍对数据的获取。

对话会强调了知识产权与其他考虑因素在管理数据方面发挥的重要作用。虽然产权组织的任务授权直接相关的是建立兼顾各方利益的有效知识产权制度,但这一版图的所有这些其他部分都需要得到考虑,以确保对这些问题采取连贯一致的做法。

关于产权组织对话会

产权组织对话会是关于前沿技术与知识产权的领先的全球论坛。它汇集了来自世界各地的不同声音,旨在通过交流信息和想法,提高人们对前沿技术给知识产权带来的问题的认识,并旨在协助作出知情决策。

产权组织对话会每年最多举行三届会议。会议向所有人开放,并以虚拟形式举行,以便所有地区的与会者都能够参会。讨论的录像和摘要以及其他信息材料可在产权组织网站上查阅。产权组织对话会下届会议将于2022年4月5日至6日举行,将重点讨论如何利用前沿技术来加强知识产权行政管理。

现已开放注册

鸣谢:乌尔丽克 ·蒂尔,产权组织知识产权和前沿技术司

《WIPO杂志》旨在增进公众对知识产权和产权组织工作的理解,并非产权组织的官方文件。本出版物中所用的名称及材料的呈现方式,不意味着产权组织对于任何国家、领土或地区或其当局的法律地位,或者对于其边界或边界线的划分,表示任何意见。 本出版物不反映成员国或产权组织秘书处的观点。 提及具体公司或具体厂商的产品,不意味着它们得到产权组织的认可或推荐,认为其优于未被提及的其他类似性质的公司或产品。