本文作者:admin

澳门一肖一码100%准确1,科技巨头被曝使用未经授权的 YouTube 内容训练 AI 模型

澳门一肖一码100%准确1,科技巨头被曝使用未经授权的 YouTube 内容训练 AI 模型摘要: 澳门一肖一码100%准确1,科技巨头被曝使用未经授权的 YouTube 内容训练 AI 模型今年年初,YouTube的母公司谷歌被曝利用该平台的视频来训练旗下模型,谷歌当时回应称,...

当地时间7月16日,据外媒报道,包括苹果、英伟达、谷歌在内的一些大型科技公司被曝在训练AI模型时使用了谷歌视频网站未经授权的数据。这些公司使用了第三方提供的数据集,其中包含大量从谷歌抓取的视频字幕文字,违反了禁止从该平台未经授权抓取内容的规定。

报道指出,这些科技公司在训练AI模型时解析一码一肖100准,都使用了一个名为“(字幕)”的数据集。该数据集大小为5.7GB,包含4.89亿个单词,来自互联网上超过4.8万个频道的17.35万个视频。数据集由视频字幕纯文本组成,包括视频博主上传的部分和自动转录的文本。除了英文外,通常还附带日文、德文和阿拉伯文等语言的翻译。

该非营利组织是这一争议数据集的创建者,目前该公司尚未对此事作出回应。据其官网介绍,AI的目标是“降低AI开发的门槛,通过训练和发布模型,让每个人都能接触到前沿的AI技术。”此前,AI发布了一个名为“Pile”的数据汇编,其中大部分内容都向公众开放,其中包括。

数据显示,该公司在今年 4 月苹果在终端发布小模型的几周前曾使用 Pile 进行训练。但值得注意的是,苹果本身并没有下载这些数据。因此从技术角度来看,它违反了使用条款。

这家 AI 初创公司的发言人证实,Pile 数据集已用于训练该公司的生成式 AI 助手,使用条款仅涵盖“直接使用其平台”,建议任何违反服务条款的行为应与 Pile 的原作者讨论。苹果、 和其他公司尚未对此事作出回应。

此次事件受影响的创作者包括、和等知名博主,以及美国《纽约时报》、英国广播公司(BBC)和 ABC News 等大型新闻出版商。此外,数据集中的一些材料宣传“地球平坦论”等阴谋论澳门一肖一码100%准确1,科技巨头被曝使用未经授权的 YouTube 内容训练 AI 模型,甚至包含已删除视频的内容。目前,Pile 已从官方下载网站下架,但仍可通过文件共享服务访问。

对此,一位知名科技博主在X(原推特)平台上表示:“苹果从几家公司获得了他们AI所需的数据,其中一家公司从视频中抓取了大量数据/转录文本,包括我的视频。从技术上讲,苹果并没有‘犯错’,他们并没有主动抓取数据。但这将是一个长期的问题。”

来源:X平台

虽然苹果等公司可能使用了公开数据集澳门一肖一码100精准2023,没有违反任何规定,但此次事件再次让人们关注到AI训练背后的数据问题。今年早些时候,母公司谷歌被曝出使用该平台上的视频来训练其模型。谷歌当时回应称,这一行为并不违反平台与创作者之间的协议。

今年 3 月,首席技术官 Mira 在接受采访时对 视频模型 Sora 的训练数据来源含糊其辞。4 月,首席执行官 Neal Mohan 在接受采访时表示,他没有直接证据证明这些视频确实被用于改进其 视频 AI 工具 Sora。如果真的被使用,那将是“明显违反”平台使用条款的行为。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,30人围观)参与讨论

还没有评论,来说两句吧...