人工智能数据带来的知识产权法律问题
关键词:人工智能,AI数据
当下人工智能的开发已经上升到国家战略的高度,它的应用正在渗透到社会生活中的各种领域中,包括交通运输、金融、医疗、制造业等。人工智能正在给人类社会带来全方位的变革,毫不夸张地说,人类已经进入了人工智能的时代。
人工智能的大多数应用需要“大数据”支持。没有大数据的积累,机器就没有学习的对象,就无法进行分析、判断,也就无法模拟人的思维决策。换言之,没有高质量、丰富的学习数据,就会影响人工智能的开发。日本学者冈本义则也指出:“对于供AI学习用的数据,能够收集到多数品质良好的信息,直接关系到人工智能的性能。”[1]人工智能所立足的数据信息含有丰富的商业价值,未来发展潜力巨大。
不过,目前人工智能数据的权属、域外立法经验都没有得到充分研究,这不仅为司法实践带来了巨大的困难,也为人工智能技术的发展和人工智能数据的开发与利用带来隐患。我们有必要通过立法来保护开发者制作优质的数据,进而促进人工智能的发展。否则,当人工智能开发者面临其所依托的数据被盗取时,盗用者往往通过钻法律空子,剽窃到有价值的数据,这将损害开发人工智能团队或个人的原动力。因此,以何种法律来保护人工智能数据,已成为今天我们所面临的热点问题。
人工智能数据到底是物权、知识产权,还是创设的新型“数据产权”?本文尝试结合域外相关经验考察,对我国知识产权相关法律制度应做如何应对作初步探讨。文中所定义的人工智能数据(简称AI数据)是指人工智能训练和深度学习时所依托的数据,[2]它既包括未经加工处理的最早产生的裸数据,也包括运用算法、计算机系统等技术生成的衍生数据,不包括未经处理的个人数据信息。
(一)人工智能数据与物权
法学定义的物权要符合三大特征,即稀缺性、有用性和可控制性。人工智能数据在商业领域中具有商业价值,符合物权定义,是一种稀缺资源。为了保有人工智能数据的价值,企业通常会采取技术安全措施来阻止竞争对手猎取其已收集的数据信息,以保持数据的商业价值,因此它具有稀缺性。从物理性质上看,AI数据可以为人类所支配与控制,具有可控制性。因此,人工智能数据是一种无形的物权,但这样的认识存在一个重大缺陷。AI数据保护的范围则仅限于以电子格式收集、处理、存储和呈现的内容,而非信息本身。如数据属于无形物权,那么当人工智能数据被非权利人控制后,权利人主张AI数据的返还,即可实现权利救济。然而,由于数据的无形性,一旦数据被他人非法占有,将会变成无法更改的事实。数据的虚拟性、无形性将导致返还的数据财产价值落空。因此,当人工智能数据被他人非法侵占后,按照物权来保护数据,无法将其恢复到数据未被侵占前的状态。
(二)人工智能数据与知识产权
1992年,国际保护工业产权协定(AIPPI)东京大会将知识产权划分为“创造性成果权利”与“识别性标记权利”。基于此,学者们对定义对象做了新的概括,代表性的观点主要有三种:第一种,知识产权是基于创作性智力成果和工商业标记依法产生的权利的统称;第二种,知识产权是人们对自己的智力活动创作的成果和经营管理活动中的标记、信誉依法享有的权利;第三种,知识产权是民事主体依据法律的规定,支配其与智力活动有关的信息,享受其利益并排斥他人干涉的权利。[3]由此可概括:知识产权具有创造性、非物质性和公开性的特征。
人工智能数据系依照算法、程式、规则而产生的智力成果,符合知识产权的构成和特性,应被纳入知识产权的法律范畴。不过,还有人工智能数据可能无法被纳入到知识产权范畴内的情形,比如说被匿名化的非结构性数据,部分群体上传到手机等设备中的跑步数据,它只是纯粹的数据信息。对此,是否要对这些数据信息进行法律保护,取决于人工智能开发者的意志,即有无进行数据挖掘、训练的必要。如认为有必要,人工智能数据开发者则可用商业秘密法律制度予以保护。如认为无必要,该数据则作为“开放数据”可以对外公开、共享。对此我国的法律制度没有明确的回应。目前人工智能数据流通市场上,人们通过订立协议,比如说数据许可使用协议或依靠“以物易物”进行交易,尽管短期内企业可以各安其事、各取所需,但长期看,这不利于人工智能数据保护的合法化,不利于人工智能技术发展。
(一)美国的立法现状
美国没有关于人工智能数据或与大数据相关的专门立法。2016年10-11月,美国连续发布了《为人工智能的未来做准备》《国家人工智能研究与开发战略规划》《人工智能自动化和经济》3份白皮书。从这些报告中可以看出,人工智能数据或大数据不是人工智能研究或相关法律制度研究的重点。2017年12月,美国提出《人工智能未来法案》,从该法案可以看出,未来美国对人工智能数据的关注点更多在于实现人工智能领域数据和研究的共享与开源,促进数据开放,而非人工智能数据的私有化保护。是否可以由此得出人工智能数据的法律保护在美国并不受到重视呢?答案是否定的。
实际上,1979年,美国统一州法全国委员会(The National Conference of Commissioners On Uniform Statelaws)出台了《统一商业秘密法》(Uniform Trade Secrets Act,简称UTSA)。时至今日,美国超过四个州都已采用UTSA。1996年美国总统克林顿签署了《美国经济间谍法》,这是美国第一部联邦商业秘密法,该法主要是对商业秘密进行刑事保护。为制裁商业秘密侵权行为,商业秘密权利人可以向法院申请签发立即停止侵害的相关禁令。由于美国有如此完善、成熟的商业秘密保护制度,当面临人工智能数据被他人盗取或以不正当手段获得时,美国企业或个人完全可以运用现有的商业秘密、刑法以及反不正当竞争法律来予以保护。
(二)欧盟立法现状
当下,随着物联网(IoT)的发展,欧洲高度重视AI和大数据技术相关的数据财产利益的保护问题,赋予数据类似知识产权的财产权保护之呼吁也日益增多,但人工智能数据如何保护仍是未决难题[4]。如果AI数据符合版权法中的作品要求,比如存储在电脑或手机中的图片、语音、视频等数据,则受到版权法相关法律制度的保护。如AI数据在选择、编排上有独创性,符合数据库的可版权性要求,则可按照欧盟于1998年通过的《数据库指令》予以保护。
欧盟委员会法律事务委员会于2016年5月31日提交一项动议,要求欧盟委员会把正在不断增长的最先进的自动化机器“工人”的身份定位为“电子人(electronic persons)”,并赋予这些机器人依法享有著作权、劳动权等“特定的权利与义务”。该动议也建议,为智能自动化机器人设立一个登记册,以便为这些机器人开设涵盖法律责任(包括依法缴税、享有现金交易权、领取养老金等)的资金账户。如果此项法律动议通过,欧盟将成为首个通过立法手段赋予人工智能法律身份的地区。这将给确立人工智能数据的归属问题提出挑战。人工智能数据是由人工智能所有,还是人工智能开发者所有?如果人工智能享有对作品的版权,那么作品所依照的素材(人工智能数据)是否也同样地享有版权?如果人工智能对其创作物享有版权并由此获得报酬,人工智能数据开发者是否能获得相应报酬,毕竟人工智能使用了其提供的数据才使得创作完成?如果法律赋予“机器人”人工智能主体身份,将会给人工智能数据带来新的法律问题。
(三)日本立法现状
日本2017年和2018年的知识产权推进计划都将用于AI数据的知识产权保护作为重点内容。《知识产权推进计划2017》中提出了六点构建促进数据利用的知识产权制度的建议:支持数据利用的相关契约;构建完整的数据流通基础;确保公正的竞争秩序;宣传数据结构的专利审查相关事例;为促进数据利用,讨论相关权利的限制;厘清确保数据利用的竞争力等。[5]《知识产权推进计划2018》又进一步指出,加强数据和人工智能等新型信息财产的知识产权保护仍然是重点战略,具体做法是:普及不正当竞争防止法;官民合作推动信息信托认证计划及示范;制定数据政策和数据管理计划;利用信息和通信技术,建立可广泛获取、共享和利用数据的农业数据库。[6]从中可以看出,日本已经意识到AI数据对人工智能发展的重要作用。目前,日本并没有关于数据财产保护制度的立法,学界也一直有“率先建立数据财产权保护须慎重”的呼声[7]。值得注意的是,日本于2018年5月30日修改了《不正当竞争防止法》,在第二条关于“不正当行为”定义的例举中,新设了非法获取、使用和提供受用户账户和密码等系统管理方式保护的、仅向特定使用者提供的数据之情形,并基本全盘复制关于商业秘密的保护规则,对权益受损的权利人提供申请禁令、赔偿等民事救济。[8]
与美国、欧盟、日本一致,我国确实也没有创立关于人工智能专门法律。人工智能数据在实践中多是人工智能开发者收集、整理、分析形成,是否采取保密措施,需要看人工智能数据具体使用的场景。如果没有采取保护措施,属于在选择、编排上体现独创性的数据,也可以受到版权保护。由于我们立法上对此没有具体的规制条款,AI数据如何保护已成为司法实务中的难题。例如,著名的“新浪微博起诉脉脉抓取使用微博用户信息案”、 淘宝诉美景公司大数据产品不正当竞争案,二级法院均通过触发《反不正当竞争法》一般条款来保护数据权益问题——机器人抓取数据行为的合法性边界问题。这些案例让我们感受到为了保护人工智能数据,我国法院正在不断扩张适用《反不正当竞争法》的一般条款,以满足数据保护的发展需求。但是,选择原则性条款来保护法律未明文规定的权益,不仅容易受到学界对原则性条款可能被滥用的疑虑,还容易引发法律适用存有较大不确定的争议。由此,笔者建议,关于人工智能数据的法律保护,应从以下三个方面着手:
(一)建议尽快出台专门的《商业秘密法》,完善人工智能数据的保护体系
从商业秘密属性上看,数据不是一项类似于知识产权的排他性权利,只是类似于《反不正当竞争法》框架下的一种防御性权利。由于我国《反不正当竞争法》目前未设立“不当侵占”或“盗用”(Misappropriation)他人合法利益的相关条款,那些虽不符合商业秘密和作品保护条件、但经营者投入了大量资金与劳动且能带来竞争优势的数据信息若被“扒取”,则难以用具体的条款加以禁止。因此,建议将在《商业秘密法》中增设条款,合理扩大商业秘密的保护范围。2018年1月1日起施行的新《反不正当竞争法》第九条第(三)款的规定,商业秘密是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息和经营信息。将商业秘密主体限定为经营者,将会大大限制涉及商业秘密的适用范围以及适用主体。未来出台的《商业秘密法》有必要将人工智能数据单独列为商业秘密保护的对象之一,同时侵犯商业秘密主体扩大到个人,如此才可以更好地制裁非法获取人工智能数据的行为。
(二)明确规定在人工智能数据被开发、训练过程中使用他人作品行为是合理使用行为
机器学习所依托的原始数据和衍生数据都是人工智能数据。输入的原始数据以及被训练得来的衍生数据发生在整体机器学习过程中,构成合理使用,该过程的复制行为应属于不侵权行为。理由如下:首先,该过程出现在人工智能开发系统中,消费市场上并未出现同样作品,输入、利用行为不会影响作品的正常利用;其次,人工智能进行机器学习时,并非再现作品的独创性元素,这些元素仅作为“数据”被用于解构与分析,挖掘人类语言与人类表达,发现人类创作规律;最后,使用行为符合转换性使用的内涵。在不断优化算法的“学习”过程中,使用行为符合“转换性使用”内涵,是“创造性且以不同原作的方式或目的使用既有材料”。【9】
(三)国家行政管理部门应制定明确的人工智能相关专利审查标准
美国人工智能数据保护以专利保护和商业秘密保护为主,我国也应如此。众所周知,商业秘密的保护存有明显的缺陷,首先,这要求权利人对人工智能数据必须采取保密措施,人工智能社会需要大量的数据进行深度学习,如采取保密措施模式将会阻碍人工智能产业的发展;其次,采取保密措施,不利于数据的流通,造成相同资源反复收集、浪费的局面;最后,商业秘密保护无期限限制,如长期投入人、财等资源进行维护,不仅不利于数据开发,也不利于人工智能开发者自身的发展。人工智能技术应用构思只要构成一个完整的技术方案即可申请专利保护。然而,目前我国《专利法》第二、二十二、二十五、二十六、五十九条等条款的理解和适用在专利审查中存在诸多的不确定性。国内许多企业因此对用专利法保护人工智能数据望而却步,转而求助于商业秘密保护。如此,企业援引商业秘密也可能会导致一个意想不到的弊端——支持了企业对数据的垄断,不利于人工智能产业的蓬勃发展。因此基于现状,笔者建议我国专利行政管理部门尽快出台人工智能技术方的授权和权利要求解释标准。同时为便于把控专利申请的质量和效率,应对相关的审查标准予以明确化,例如,2017年国家知识产权局修改的《专利审查指南》中增加了“商业模式”创新的保护,但没有明确的审查标准,对此应尽快出台具体的细则或指导意见来引导业界认知,让人工智能数据专利申请具有更强的可操作性。