
全球最大的影子藏书楼Anna's Archive在本周末震悚互联网,通知已"备份Spotify"并启动通过种子文献大领域分发300TB的元数据和音乐文献。这个日益受到AI开垦者资助的平台此举激勉平凡热心。
据Anna's Archive称,这次数据获取涵盖了Spotify上跳动99%的播放内容,酿成了"领有2.56亿首歌曲的最大公开音乐元数据库"。该档案库还宣称这是"全球首个完全绽开的音乐'保归档案'",包含8600万个音乐文献。
这些音乐文献据称约占2025年7月Spotify可用歌曲的37%。持取的文献按照受接待进度进行了优先排序,Anna's Archive过滤掉了很多从未被播放或质料较差的歌曲,比如AI生成的歌曲。
Spotify在周一告诉Android Authority,正在考核Anna's Archive是否确乎如其博客所宣称的那样"大领域"持取了其平台。
"针对未经授权走访的考核发现,第三方持取了全球元数据,并使用违纪工夫绕过数字版权处理来走访平台的部分音频文献,"Spotify暴露。"咱们正在积极考核此事件。"
当今尚不了了内容持取了些许Spotify数据,Android Authority指出,也省略情该公司是否可能承袭法律行径来删除这些种子文献。当被条目驳倒时,Spotify发言东谈主告诉Ars,"Spotify依然识别并禁用了参与违纪持取的坏心用户账户。"
关于Anna's Archive来说,在"一段时候前"随机发现了"大领域持取Spotify的标准"后,持取数据的眩惑可能太大了。
"咱们看到我方在这里的作用是开垦一个主要以保存为野心的音乐档案库,"该档案库暴露。持取Spotify数据是一个"很好的启动",他们说,野心是开垦一个"旨在代表总共音乐作品的巨擘种子列表"。
该档案库暴露,这么的列表"在音乐领域并不存在",雷同于LibGen——这个被Meta等科技巨头和Anthropic等初创公司污名显然地用来盗版竹帛数据集以测验AI的平台。
Anna's Archive暴露,12月发布元数据种子是完毕这一"保存"责任的第一步。接下来,该档案库将发布音乐文献的种子,领先从最受接待的流媒体启动,然后最终发布不太受接待歌曲和专辑封面的种子。博客中说,改日"若是有饱和的兴味,咱们不错在Anna's Archive中添加单个文献的下载功能"。
Spotify告诉Ars,正在承袭法式幸免改日的任何持取步履。
"咱们依然为这类反版权挫折实施了新的保险法式,并正在积极监控可疑步履,"Spotify发言东谈主说。"从第一天起,咱们就与艺术家社区一皆反对盗版,咱们正在积极与行业相助伙伴相助,保护创作家并爱戴他们的权益。"
用户惦记数据持取将烧毁档案库
Anna's Archive宣称持取Spotify数据是为了匡助保存"东谈主类的音乐遗产","长期"保护它免受"天然灾害、买卖、预算削减和其他祸殃的松弛"。
然而,一些Anna's Archive的粉丝——他们主要使用该搜索引擎查找竹帛、学术论文和杂志著作——对Spotify数据被持取的音信感到震悚。在Hacker News上,一些用户质疑这些数据是否对AI连系东谈主员之外的任何东谈主有效,因为在多数种子中搜索单个歌曲对音乐醉心者来说似乎不切内容。
一位用户指出"依然有器具不错自动定位和流式传输盗版电视和电影内容"——这标明音乐醉心者可能会找到流式传输这些数据的标准。但其他东谈主惦记Anna's Archive可能被引导去持取Spotify,可能承担了那些倾向于详尽其测验数据泉源的AI公司但愿幸免的法律风险。
"这太纵脱了,"一位热点驳倒者写谈。"皆备念念知谈这是否是对但愿获取这些贵府的AI连系东谈主员/公司需求的报酬。或者主要唱片公司是否依然低价地许可其总共这个词目次用于测验方针,是以这简直仅仅纯合法作保存致力于?"
但Anna's Archive昭着在致力于扶植AI开垦者,另一位用户指出,Anna's Archive践诺向"企业级"大言语模子数据销售"高速走访",包括"未发布的吞并"。该档案库在其网页上建议,任何东谈主都不错捐赠"数万好意思元"来获取这种走访权限,任何有兴味的AI连系东谈主员都不错干系连系"咱们何如相助"。
"AI可能不是他们原始/主要的动机,但他们昭着扶植促进AI实验室的盗版最大化,"第三位驳倒者建议。
与此同期,在Reddit上,一些东谈主惦记Anna's Archive可能因为持取数据而注定了我方的运道。对他们来说,在看到互联网档案库致力于在昨年以守秘息争贬抑的唱片公执法律挫折中活命后,档案库似乎"仅仅让我方成为野心"。
"我对AA把这个野心背在我方身上感到盛怒,"一位Reddit用户在一个通知"这次Spotify黑客步履只会烧毁委果要紧的文体档案库"的帖子上写谈。
跟着Anna's Archive粉丝的情感螺旋式下落,以至有东谈主提倡贪心论,以为该档案库仅仅"为AI昆仲们作念的,他们是在幕后付费撑持档案库运行的东谈主"。
Ars无法立即干系到Anna's Archive就用户的担忧或Spotify的考核发表驳倒。
在Reddit上,一位用户对档案库"遐想为抗打击"的事实感到安危,这可能辞谢法律行径委果烧毁档案库。
"域名之类的不错解除,天然,但中枢软件和其数据不错一次又一次地从头浮出水面,"该用户讲解注解说。
但并非总共东谈主都笃信Anna's Archive概况在如斯肆丧胆怯地种子Spotify多数数据后活命下来。
"这就像说泰坦尼克号不会千里没,"该用户警告说,默示若是Spotify激勉的下架不断让下载受挫,Anna's Archive可能会失去捐赠。"天然,表面上数据确乎不错一次又一次地从头自大,但每次这么作念都需要财富和资源,而这些是有限的。在东谈主们摈弃之前,他们惬心作念些许次呢?"
Q&A
Q1:Anna's Archive是什么?为什么要持取Spotify数据?
A:Anna's Archive是全球最大的影子藏书楼,宣称这次持取Spotify的300TB数据是为了保存"东谈主类的音乐遗产",开垦一个包含总共音乐作品的巨擘档案库,辞谢这些文化资产因天然灾害、买卖等身分而丢失。
Q2:Spotify对数据被持取有什么报酬?
A:Spotify暴露正在积极考核此事件,依然识别并禁用了参与违纪持取的坏心用户账户,并实施了新的保险法式来辞谢此类反版权挫折,同期与行业相助伙伴相助保护创作家权益。
Q3:Anna's Archive的这一溜为会带来什么风险?
A:用户惦记此举可能让Anna's Archive靠近法律风险,就像互联网档案库昨年遭逢唱片公执法律挫折同样。天然该档案库遐想为抗打击,但不绝的法律压力可能导致资金和资源破钞,最终影响其闲居运营。