1、斯嘉丽·约翰逊怒斥OpenAI模仿其声音,OpenAI停用争议语音模型“Sky”
据外媒报道,全球票房最高女演员、《复仇者联盟》系列电影中“黑寡妇”扮演者、被影迷称为“寡姐”的斯嘉丽·约翰逊(Scarlett Johansson)发表声明,OpenAI GPT-4o中使用的声音之一Sky与斯嘉丽声音极为相近,斯嘉丽对OpenAI此举感到“震惊”和“愤怒”,因此她的律师联系了OpenAI,要求撤下Sky。
昨日晚间,OpenAI宣布撤下GPT-4o语音交互功能中的Sky声音,并用另一种名为Juniper的语音代替。OpenAI在声明中明确指出:“我们认为AI声音不应该刻意模仿名人独特的声音——Sky的声音不是模仿斯嘉丽·约翰逊,而是属于不同专业女演员使用她自己自然说话的声音。”
评论:随着多模态大语言模型的发展,语音模型的价值越发重要。这是因为高度拟人化的语音输出,能够创造出更具真实感与沉浸感的交互过程,可以有效提高用户的使用体验。但语音模型的训练来源问题依然没有形成有效的操作规范,甚至有的企业直接模拟、重现了某些自然人的声音。例如,此前北京互联网法院就审理了AI生成声音人格权侵权案,明确了在具备可识别性的前提下,自然人声音权益的保护范围可以扩展至AI生成的声音。
本次寡姐与OpenAI的纠纷正是诞生在这个背景下,寡姐认为“GPT-4o中的声音Sky与斯嘉丽声音极为相近”。虽然本次事件最终以OpenAI停用Sky声音结束,但OpenAI依然没有承认其模仿了寡姐的声音。这也表明在当前的技术背景下,由于人工智能训练模式及算法属于“黑箱”,自然人如何举证AI模型使用了其声音权依然是个棘手的问题。特别是,如果AI的语音合成了由多个自然人的声音合成产生,即使进行声纹鉴定也可能无法获得有效结果。自然人应如何取证证明其声音被侵权使用,可能最终还需司法实践进一步予以指导并明确。
2、欧盟《人工智能法案》正式批准
2024年5月21日,欧盟理事会批准了一项旨在协调人工智能治理规则的开创性法律,即欧盟《人工智能法案》(EU AI ACT)。这项旗舰立法遵循“基于风险”的方法,即对社会造成危害的风险越高,规则就越严格。这是世界上第一部此类法律,可以为监管人工智能制定全球标准。
新法案旨在促进私营和公共部门在整个欧盟单一市场上开发和采用安全可信的人工智能系统。同时,它还旨在确保尊重欧盟公民的基本权利,并促进欧洲在人工智能方面的投资和创新。《人工智能法案》仅适用于欧盟管辖范围内的领域,并为专门用于军事和国防以及研究目的的系统提供豁免条款。
评论:从法律视角来看,欧盟《人工智能法案》是一个旨在平衡创新与安全、保护个人权利与公共利益的重要立法。它通过建立全面的风险规制体系和监管框架,试图在全球范围内树立欧盟在AI监管方面的领导地位。例如,该法案的创新之处包括AI系统的风险划分,法案将AI系统划分为高风险AI系统及禁止的AI领域;又如,该法案要求AI系统的透明性和问责机制,要求高风险AI系统必须具备可解释性,能够向用户和监管机构提供系统决策的逻辑和依据。
该法案作为全球第一个针对AI技术进行监管的立法文件,其批准实施可能给我国AI企业带来直接影响。首先,该法案为我国提供了宝贵的监管经验,考虑到人工智能法草案进入国务院2024年度立法工作计划,该法案中分类监管策略和对透明度的要求等制度,将有助于我们制定本土化的AI监管政策。其次,国内AI企业正积极谋求出海发展,如需进入欧盟市场,可能还需预先确定企业本身涉及的AI技术及角色,确定系统的风险等级,根据《人工智能法案》规定采取相应等级的合规措施。
3、索尼音乐发700封警告信打击AI侵权
索尼旗下的音乐集团警告700多家公司,未经许可不要使用其音乐数据训练AI大模型。搜集数据的方式包括文本挖掘、网络爬取以及其他数据,包括录音、音乐作品(包括歌词)、封面艺术作品和元数据等,任何没有得到索尼授权的使用数据协议。索尼在一封置评信中指出,技术的创新可能会改变创意产业的工作方式和流程,AI大模型便是一种高效的工具。但是,AI模型厂商必须尊重歌曲作者和唱片艺术家的知识产权,如果没有他们的数据贡献,AI模型将无法获得进步。索尼还表示,如果已经获得授权使用其音乐数据的AI公司,必须明确提供AI模型是如何在预训练过程中使用这些数据的详细流程。
4、 OpenAI与新闻集团达成数据合作,用于AI训练和回答问题
5月23日,OpenAI在官网宣布与全球最大媒体“新闻集团”达成多年合作,将使用其旗下的媒体数据用来训练和增强ChatGPT。新闻集团旗下的媒体包括:《华尔街日报》《巴伦周刊》《MarketWatch》《投资者商业日报》《FN》《纽约邮报》《泰晤士报》《星期日泰晤士报》《太阳报》《澳大利亚人报》等几乎西方所有的著名媒体。合作允许OpenAI访问并使用新闻集团刊物的历史和当前文章,旨在提高ChatGPT的训练和响应质量。此合作引发公众担忧和批评,关注点在于新闻集团的报道可能带有偏见,影响AI输出的中立性。
评论:AI数据训练是否具有合法性是生成式人工智能发展所必须面对的核心的问题,也是当前各家大语言模型因此产生诉讼的最直接原因。目前国内就有广州互联网法院判决的“奥特曼”诉AIGC平台案件、小红书画师起诉侵权纠纷等案件,美国地区则有纽约时报起诉 OpenAI、三名漫画艺术家起诉Midjourney等公司的多个案件。随着AI行业的蓬勃发展,相关权利人将会更加关注其作品被未经许可使用及数据训练的问题,例如索尼音乐集团主动发起侵权警告信,将来可能会发生更多的相关纠纷。
当前,国内的《生成式人工智能服务管理暂行办法》第七条、《生成式人工智能服务安全基本要求》5.2条均要求大语言模型的开发者使用涉及他人知识产权的内容进行训练前应取得同意。我们理解,数据训练行为与人类阅读作品的“思考、吸收、再创作的行为”非常相似,本身不应落入《著作权法》项下的专有权利。因涉及数据训练的内容数以百万计,很多作品都存在版权状态不明、权利人不明确、权利人过于分散、许可成本过高等诸多问题,开发者取得训练数据授权过程将非常漫长、复杂,不具有基本的操作性、可行性。但在当前法律没有做出明确规定之前,开发者的相关义务无法当然予以免除。包括OpenAI在内的开发者正在采取逐一与大版权方获得集体授权的方式进行探索。虽然这种模式无法从根本上解决大语言模型的侵权隐患,但至少有效的降低了其直接侵权诉讼的风险,也能够与其他开发者之间建立相应的知识产权壁垒,不失为当前行业实践中一种可调和的解决方案。
5、多家大模型企业调整调用价格,大模型进入免费时代
近日,多家大模型企业宣布面向企业市场的API(应用程序编程接口)价格下调,动辄下调90%以上,甚至直接宣布免费。
5月21日,阿里云发布降价公告,将旗下通义千问的多款商业化及开源模型进行大幅降价。其中,对标GPT-4的商业化模型Qwen-Long的API输入价格直降97%,输出价格直降90%。阿里降价消息发布后,百度智能云也发布公告称,百度文心大模型的两款主力模型ENIRESpeed、ENIRELite将全面免费,并即刻生效。5月22日,腾讯宣布,主力模型之一混元-lite模型,API价格从0.008元/千Tokens调整为全面免费。腾讯云正式对外宣布旗下AI代码助手全面对外开放,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。同在22日,科大讯飞宣布旗下大模型讯飞星火API能力正式免费开放。
评论:今年4月,周鸿祎在其AI公开课中声称企业拥抱AI技术要走的是“越做越专”的路,也就是找垂直场景,做专业技能的大模型。而随着各家大模型调整其调用价格,企业创业发展专用大模型的条件正变得越来越成熟,这意味着只要有相应的行业知识及数据,任何人都可以低成本的设立部署AI Agent,大模型免费带来的效应可能将普惠至每一个普通公民。而随之而来的,将是更加剧烈的市场竞争,各方竞争者将持续探索AI技术爆发下的市场竞争秩序及商业道德规则,相关侵权、不正当竞争纠纷也会越来越多。对企业来说,提前发现和规避业务上的法律风险,将变得更加重要。
- 相关领域
- 高科技与人工智能