涵摄能否延续:人工智能生成内容的特点与版权认定

涵摄能否延续:人工智能生成内容的特点与版权认定

   生成式人工智能的广泛运用,带来了明显不同于以往计算机生成内容的特点。如前所述,无论是在立法还是判例中,对计算机生成内 

的认知都是通过操作软件实现的稳定输出,程序设计者对该结果是可预见的,因此所生成内容并未超出计算机软件设计者的预期。但生成式人工智能的突出特点,就在于其具备了深度学习的能力,使计算机得以基于对海量数据的分类和整理而从中提炼出所学习数据的典型特征和表达风格,最终在上述数据所构建的场景中生成类似特征和风格的新内容,并由此脱离原程序的设定。以现今引起广泛讨论的文本生成、图像生成和视频生成人工智能为例,用户仅需要以提示的方式输入其所需内容的描述和要求,人工智能就会自动调用其通过深度学习获得的数据,再经过多次调整和修正后生成与用户描述尽可能接近的内容。以图像生成人工智能软件Midjourney和文本生成人工智能软件ChatGPT为例,两者生成内容的方式,都是使用者首先输入一段描述所需内容的提示文本,待人工智能根据提示输出一项或多项内容后,使用者基于已生成的内容调整提示文本,以引导人工智能生成新的内容,如此反复直到使用者获得满意的结果。

人工智能生成内容的整个实现过程,可归纳为三个必要阶段,先后分别是人工智能算法设计,机器学习和内容生成。在三个阶段中,仅有第一阶段完全由人类以程序设计者的身份完成人工智能的算法模型,而且该算法模型已经借助计算机软件的方式在《著作权法》中得到承认和保护。第二阶段的机器学习,人工智能就已经可以通过对海量同类型数据进行分析来找到其中的共性特征和风格,人类仅在为训练人工智能模型而提供数据时,通过数据标注和评分机制提升生成内容质量和准确性时参与其中。到最后第三阶段的内容生成,人工智能就直接以用户的简要提示为指导,再基于对海量同类型数据分析中获取的共性特征和元素来生成新的内容。很显然,在第二和第三阶段,人工智能的设计者和使用者都只能看到输入的数据和输出的内容,但无法直接理解生成的过程中人工智能如何进行具体选择和取舍,导致该过程成为一个黑箱。因此,比起建立在完全执行程序设计基础上的计算机生成内容,人工智能生成内容与程序既定设计之间的关联性更为疏远,程序设计者无法解释算法黑箱中产生的内容。人类在创作时从抽象到具体的构思和从无到有的实施过程,被人工智能算法以文本与图像之间的关联规律所替代。也正因为如此,有观点即认为由于人对创作过程丧失了控制力,人工智能生成内容就不应被视为作品。

  美国版权局在2023年撤销以人工智能生成漫画版权登记的一封回复函中就明确指出,用户用提示语的方式引导图像生成人工智能软件Midjourney生成的18页漫画不具有可版权性,因为图像生成过程中缺乏人的创作,而是由Midjourney随机生成。没有作者参与创作的原因是作者对生成的结果不可预期。但美国版权局又同时认为,如果艺术家能够把控这种图像生成工具的实施过程,即可享有所生成图像的版权。在20233月颁布的《人工智能参与生成作品的版权登记指南》中,美国版权局再次强调,以收到提示的方式生成内容,由于使用者缺乏对创作实施阶段的把控,凸显独创性的具体构思都是由人工智能所选择和决定,所以该内容不应被视为作品。换言之,上述判定标准仍然延续了19世纪末机器首次介入创作时以构想实施作为创作行为来源的思路。我国法院对人工智能生成内容可版权性的判断,同样将人类创作与作品独创性的关联作为认定依据,一方面仍然以传统的作品构成要件来判断人工智能生成内容的可版权性;另一方面同样强调人在作品独创性中的贡献。由此可见,司法机关和行政机关迄今为止对人工智能生成内容可版权性的认定,仍集中于创作是否来源于自然人。但在裁判结果上,由于生成式人工智能技术的迭代,自2018年开始美国就已陆续出现不保护以提示方式生成内容版权的裁决,这说明自然人在如今的生成式人工智能中更加难以与创作相关联,仍然是回归对独创性来源的判断。之所以延续百余年来以作品独创性与人的关联来涵摄人工智能生成内容的传统,而不考虑进行立法论上的创新,主要原因在于两点:

  第一,从规范层面出发,在人工智能生成内容的可版权性认定中坚持自然人对独创性的贡献,是维持确权和侵权体系稳定的需要。作品作为《著作权法》中的核心概念,其必须来源于人的创作一直是应有之义。虽然《伯尔尼公约》没有对何谓作者加以明确界定,但从体系解释的角度出发,人作为作者也在关于收益对象和精神权利等大量条款中得到确认。所以即使是非大陆法系国家,非自然人也是以视为作者的拟制方式被认定为更需要激励且行使权利更有效率的主体。各国《著作权法》及历史上的相关典型判例,也始终将人对独创性的贡献视为客体认定的必要前提。正因为如此,无论是现在的人工智能生成内容还是计算机生成内容,都因为缺乏人的创作而不被认为是作品。之所以坚持以既有规范涵摄对人工智能生成内容的可版权性判断,从法教义学的角度看主要是为了保障版权法基本功能的实现。在客体认定上,如果因为内容来源于人工智能就采取差异化的判定标准,甚至将其排除在作品范畴之外,只会导致法律适用的混乱。当同一作品会因来源于人工智能还是人而存在是否受《著作权法》保护的差异时,就会出现大量以署名的方式宣称自己是该作品的作者,以规避《著作权法》对人工智能生成内容的排除,司法实践中不得不耗费大量资源去认定该内容是否来源于人工智能,以此确定能否将该内容视为作品。另外,由于人工智能在深度学习和内容生成过程中会大量借鉴已有的同类作品,一旦生成内容与训练所输入的内容出现实质性相似,原作品权利人将因为人工智能生成内容被归入公共领域而无法向任何人追责,大规模内容生成反而遮盖了大规模侵权的现实。因此,人工智能技术虽然有着突飞猛进的发展,但其生成内容与人类创作行为相关联的需求,则因实践中确权和侵权认定的需要而不可动摇。

    第二,从效用层面出发,人工智能生成内容并未完全解决版权市场失灵问题,赋权相关主体仍然是激励创作和传播的有效手段。对人工智能在生成内容问题上的独立判断,不符合《著作权法》的立法目标。自现代《著作权法》产生以来,其立法目标始终是通过赋权来激励人对作品创作和传播,但对于人工智能生成内容是否还需要激励这一问题,学界已有不同观点。首先,人工智能生成内容的常态化,意味着普通网络用户都能通过该渠道来进行创作,形成了用户创造内容UGC)与人工智能生成内容AIGC)叠加的社会现象。本来用户创造内容就已经因为内容生成门槛的降低而造成网络上同质化内容数量激增;生成式人工智能的普及,进一步降低了创作门槛,使得内容不再是稀缺资源。既然不再稀缺,作为赋权正当性前提所预设的版权市场失灵也就得到了缓解,是否仍应通过赋权来激励创作和传播就需要重新考量。更有学者认为,如果一视同仁地将人工智能生成内容视为作品,将破坏《著作权法》所构建的激励机制,鼓励更多的人工智能而非人来完成创作。既然对人工智能设计者的激励已通过赋予其软件版权来实现,就无须进行重复激励。但需要注意的是,海量作品的存在自用户创造内容普及甚至互联网时代到来后就已成为常态,并非因为生成式人工智能的广泛适用。同时,内容数量的增加并不是不存在市场失灵的理由。激励的功能不仅仅是实现作品从无到有的转变,更重要的意义还在于提升创作和传播质量,以及弥补因传播技术转换而导致的传统版权市场失灵。在版权制度变革的历史中,每当作品借助新兴传播技术形成新版权市场时,《著作权法》基本都以赋权方式涵盖新的传播渠道来保证激励的延续性,以新的收益渠道来弥补因传播渠道的替代所导致的传统市场的萎缩。由于生成内容的质量取决于人工智能算法和训练的质量,更与训练输入的内容质量相关,这种激励机制的转移也意味着持续鼓励对硬件和训练数据的投资以及对算法的改进。

  既然继续以涵摄的方式去说明自然人是否对人工智能生成内容存在独创性贡献,就仍要回到人工智能生成内容三个阶段中是否包含了人对构想实施的贡献这个基础逻辑上。事实上,正如创作摄影作品和视听作品时无须要求创作者理解摄影设备内部运作原理一样,人工智能的设计者或使用者亦无须知晓被训练后的人工智能如何通过数据之间关联生成新的内容。深度学习之所以能够赋予机器以智能化,原因在于其能够通过已输入的训练数据和样本去寻找和确定数据中的规律和范式,由此优化形成一个新的模型来探索解决特定问题的新路径,使人工智能获得了对新数据进行分类和整合的能力。换言之,人工智能并非如自然人一般去理解语言或图形的含义,而是通过对海量数据的学习来发现其中的规律,并以此生成内容。其中探寻规律和范式的方法,则仍然是由人工智能的设计者所决定。深度学习阶段是人工智能能够生成内容的前提,但人工智能的学习和分析方式与人类截然不同。人工智能并非如人类一般通过语法和词义来理解被输入的数据,而是把词语在训练中出现的概率和训练者的评价作为标准。在此过程中,人工智能对输出数据的评价,其实是学习人类评估输出数据质量的结果所形成的一个反馈模型。人工智能的设计者和训练者如何选择数据样本范围以及如何对算法反馈结果进行标注,事实上决定了人工智能生成内容的方式和范围,最终来判断反馈结果好坏的,仍然只能是人。

  生成式人工智能的运用,不会完全排除人在创作中的地位。即使在实施阶段人工智能已基本取代人的参与,但在构思阶段仍然是人基于算法设计和数据选择在发挥作用。人工智能算法模型和训练数据的差异,对所生成内容的风格会起到重要影响。训练数据的来源和人工标注的偏好,都会决定所生成内容的风格和质量。而上述训练的完成,都是人工智能设计者直接主导和安排的结果。有鉴于此,以构想实施的过程来涵摄人工智能生成内容,人工智能的设计者仍然通过决定人工智能的核心代码、训练数据来源和偏好,以及自身发展方向来决定构想,因此应该将人工智能的设计者视为作者,实践中由于计算机软件的开发设计者众多,所以版权一般由作为人工智能投资者的法人享有。直接否定人工智能生成内容的可版权性,不但会导致作品判定要件上的双标,还会破坏《著作权法》长期构建的激励功能。

 

三咖有话说:

     本期更新未完待续,下期不见不散哦~