1、全国首例涉及AI绘画大模型训练著作权侵权案开庭
6月20日,北京互联网法院在线开庭审理了四起画师起诉AI绘画软件开发运营者的著作权侵权案件。四起案件的原告均为插画师,同时也是某内容分享平台的注册用户,长期在平台发布其绘画作品。原告发现,有用户在该平台上发布了带有明显模仿原告作品痕迹的图片,系通过某AI绘画软件创作,涉案某内容分享平台上线了该AI绘画软件。对此,原告认为,涉案AI软件为北京某科技公司、上海某科技公司及某内容分享平台运营者三被告共同开发运营。三被告未经原告允许,将原告作品用于训练AI模型并应用于商业用途,已经远超合理使用范畴,共同对原告权益造成严重侵害。原告主张,被告抓取原告作品输入AI模型的行为,侵犯了原告的复制权;涉案AI绘画软件提供原告作品与其他图片杂糅、混合产生新图的技术服务,侵犯了原告的改编权;被告行为还侵犯了原告的作品作为物料训练AI的权利。被告应当停止对原告著作权的侵害,包括但不限于停止在AI模型中使用原告作品、剔除模型中与原告作品相关的学习成果等,并赔礼道歉和赔偿原告经济损失。
各方围绕“原告是否享有主张作品的著作权?被诉侵权行为是否存在,是否构成侵权或合理使用?如构成侵权,侵权的内容如何确定?侵权责任又应如何承担?”等问题进行了举证质证和法庭辩论。原告申请技术辅助人员出庭,就AI大模型训练相关技术问题进行了说明。本案仍在进一步审理中。(来源:北京互联网法院)
评论:训练数据来源问题一直是困扰AI模型发展的核心问题及主要风险,实践中已经发生了多起训练数据相关的侵权诉讼。例如,2024年1月,美国媒体《纽约时报》将OpenAI及其投资方微软公司告上法庭,指控二者未经授权使用该媒体的数百万篇文章来训练人工智能大模型,要求销毁相关数据并对媒体损失负责。2024年2月,广州互联网法院宣判“奥特曼”侵权案件,判决认定被告提供的AI服务侵犯“奥特曼”版权方著作权,因未尽到法律规定的注意义务,需要承担停止侵权、赔偿损失的法律责任。
此前广州互联网法院的“奥特曼”侵权案件被称为AIGC平台侵权的第一案,但是遗憾的是该案判决没有充分论述数据训练是否可以适用合理使用,也没有明确生成内容侵犯版权的情况下是否应当删除训练数据,更没有说明未能遵守行政规章与平台应承担版权侵权责任的因果关系。希望本案北京互联网法院可以正面回应该等核心法律问题,为行业带来相应指引。但同时,由于目前AI工具普遍存在着算法黑箱的不透明性、不可知性,我们也特别关注在原告如何举证查明AI工具是否使用了画师的作品这一最基本的事实问题。毕竟设身处地,如果我们某一天成为AI训练的被侵权人,我们应该如何搜集证据呢?
2、美三大唱片公司联合起诉两家音乐AI模型“大规模侵犯版权”
6月24日,包括环球音乐集团(UMG)、索尼音乐娱乐公司(Sony Music Entertainment)和华纳唱片公司(Warner RecordsInc.)在内的一批唱片公司正式向人工智能音乐制作领域的两大巨头Suno和Udio发起诉讼,指控两家公司非法使用其版权音乐训练AI模型。唱片公司认为,Suno和Udio的用户能创作出来自某些歌曲的元素,例如歌手玛丽亚·凯莉的《All I Want for Chrismas Is You》、詹姆斯·布朗的《I Got You(I Feel Good)》,并能生成与迈克尔·杰克逊等歌手相似的人声。在诉讼中,唱片公司展示了一些AI生成的歌曲,以证明Suno和Udio正在使用受版权保护的音乐训练大模型。针对Suno的起诉书还引用了Suno投资者Antonio Rodriguez的话,以说明该投资者知晓公司没有获得相应音乐授权,并认为这是投资时必须承担的风险。唱片公司要求法院对被告涉嫌抄袭的每首歌作出支付赔偿金的判定,每首歌赔偿高达15万美元,并指控Suno抄袭了662首歌曲、Udio抄袭了1670首歌曲。(来源:每日经济新闻)
评论:这个案件再次强调AI数据训练是否具有合法性是生成式人工智能发展所必须面对的核心的法律问题。虽然实务界、学界都在积极探索解决AI数据训练难题的路径,但在法律最终定纷止争之前,该类案件依然将会持续发生。这次我们希望换个视角,谈谈唱片公司起诉的诉讼策略问题。正如相关评论指出,如果从诉讼目的出发,三大唱片公司的目的并非要求相关AI音乐关闭,而是要用各种手段在博弈中增加筹码和议价能力,希望与AI音乐公司达成版权合作,让版权方可以享受到AI技术的红利,实际上此前在行业内已有相关先例,例如在《纽约时报》起诉OpenAI之后,OpenAI接连与《金融时报》《华尔街日报》、新闻集团等多个版权方达成合作,使用合作方式建立OpenAI市场竞争的版权壁垒。此外,三大唱片公司起诉的金额来看,600多首歌,每首歌15万美元,诉讼整体标的超过10亿,实际上也能给AI音乐公司带来极大的诉讼压力,特别是在美国的司法背景下,律师每小时的工作都要额外支付费用,相关诉讼的成本压力可能会逼迫AI音乐公司进一步考虑和解或合作的解决方案。尽管直接的“拖垮”或“逼迫谈判”的说法可能过于直接,但是这也警示国内的AI开发者们需要提前做好准备,暴风雨可能很快就要来了。
3、OpenAI对中国地区的API服务“断供”
6月25日,OpenAI向中国API用户发送一封邮件,表示将采取措施,以阻止来自不再支持的国家和地区的API流量。自7月9日起,OpenAI将封锁不支持的国家API。如果用户在OpenAI不允许的国家使用其API,将面临封杀。这意味着,OpenAI首次单方面宣布终止对中国提供API服务。这一决定的直接影响是,此前希望借助OpenAI大模型套壳创业的公司,将迎来毁灭式打击。换个角度来看,OpenAI将倒逼中国企业全部使用国产大模型。(来源:i黑马)
评论:实际上从提供服务的第一天起,OpenAI便从未向中国大陆用户开放,不再向中国提供服务的解读未免言过其实。OpenAI的公告针对的是来自中国的API调用,只是对原有使用政策限制的一种延续而已。目前,中国大陆使用OpenAI的技术主要有两种主流渠道,第一是对接OpenAI官方提供的API,第二对接微软Azure提供的OpenAI技术(据了解,主要是个别外资企业内部使用)。但无论哪种模式在国内其实都不合规,因为OpenAI大模型本身未通过网信办大模型备案及算法备案,本身不能在国内向社会公众提供服务。2023年4月,上海市徐汇区市场监管局就对上海某云网络科技有限公司仿冒ChatGPT对用户按次收费不正当竞争的违法行为作出罚款人民币62692.7元的行政处罚。有意思的是,前述新闻公开报道后,阿里、腾讯、百度集体推出“搬家”生意,第一时间就着手推出各类优惠活动,以此吸引开发者接入。这足以说明,与其说是“挑战”,这次的断供更是国产大模型难得的发展机遇。
4、GPT-4顶替大学生参加考试,94%作弊未被揭穿
近日,英国雷丁大学研究发现发布了一篇研究论文,论文研究的是人工智能在大学考试系统中的潜在影响,特别是它们如何可能被学生用来作弊而不被发现。研究团队在英国一个知名大学的心理学学士学位课程中进行了一个实际测试,涉及五个不同年级的模块。他们将完全由AI编写的答案混入真实学生的在线考试提交中,这些答案占每个模块总提交量的大约5%,并且是在不违反考试规则的情况下提交的。
研究发现,94%的AI提交的答案没被识别出来并非人类所作,而且这些AI提交的答案平均比真实学生得到的成绩高出半个等级。在各个模块中,AI提交的答案有83.4%的概率会优于随机选取的真实学生答案。这表明,当前的评估系统在检测AI生成的内容方面存在局限性,可能无法确保学术评估的诚信。(来源:新智元)
评论:AI生成内容的应用可能比我们所感知的要更广,这是因为很多内容已经在不知不觉之间就通过了人们日常生活中的“图灵测试”。实际上无论是刷抖音还是使用网页搜索,可能都会碰上真假难辨的AI内容。如何有效的鉴别这些AI内容依然是一个难题。假设你在网上购买了某知名艺术家的画作,拿到之后发现有人举报他的画作都是AI生成,你要如何举证对方构成合同欺诈呢?目前司法鉴定依然无法处理,如果仅依据图像内容的不自然,比如人物的手、服装、光线等又缺乏说服力。当前的第三方检测工具也没有足够的好用。似乎在当前的司法实践中,这种举证成为了技术性难题。而举证和检测方式的不足,又进一步的纵容了这种冒用。我们期待随着技术的发展和法律的完善,未来可能会有更成熟的解决方案出现。