Anthropic 的意外删除在 GitHub 上引发了知识产权争论

AI 巨头的意外数字扫描震惊了 GitHub 社区

在一次在开发者社区引起轩然大波并引发有关自动版权执行问题的事件中，以其 Claude 系列大型语言模型而闻名的 AI 巨头 Anthropic 无意中针对 GitHub 存储库发出了数千份《数字千年版权法案》(DMCA) 删除通知。该公司是 OpenAI 的主要竞争对手，迅速撤回了大部分通知，将广泛的行动归因于内部错误。

上周晚些时候发生的史无前例的数字扫描，目标是据称包含泄露的专有源代码的存储库。虽然有关泄露代码性质的具体细节仍然很少，但行业观察家推测它可能与 Anthropic 人工智能模型或内部开发工具的复杂架构有关。全球最大的软件开发平台 GitHub 成为了战场，因为开发人员突然发现他们的项目（其中一些与 Anthropic 完全无关）被标记为侵权。

意外的数字扫描

该事件于 3 月 14 日星期四开始展开，当时第一波 DMCA 通知开始袭击 GitHub。开发人员醒来时收到通知，他们的存储库（其中一些有数千个星星和贡献）已被删除或标记。其数量之大令人震惊。 GitHub 用户的初步报告表明，数百个、然后是数千个存储库受到影响。这些来自 Anthropic 的通知引用了与其专有代码相关的版权侵权行为。

立即产生的后果是混乱和愤怒的混合体。开发者对缺乏明确性和不加区别的删除行为表示失望。许多存储库似乎与 Anthropic 的知识产权没有联系，这导致人们担心合法的开源项目受到不公平的攻击。 DMCA 指出，删除背后的机制是旨在保护在线知识产权的强大法律工具，但其滥用，即使是意外，也可能会造成重大的附带损害。

Anthropic 的迅速撤回和解释

认识到情况的规模和严重性，Anthropic 迅速采取行动，解决日益严重的危机。 3 月 16 日星期六，该公司发表公开声明，承认错误并开始大规模撤回下架通知。 “这是一次意外，”Anthropic 法律事务主管伊芙琳·里德 (Evelyn Reed) 博士在后来对外分享的一份内部备忘录中表示。 “我们的自动化系统旨在识别和标记泄露的专有代码实例，但过度索引并错误地定位了大量不相关的存储库。我们对这给开发者社区造成的破坏和担忧深表遗憾。”

该公司证实，大部分通知已于 3 月 18 日星期一上午撤回，他们正在与 GitHub 合作恢复任何无意中受到影响的合法项目。虽然 Anthropic 没有详细说明具体的技术故障，但专家表示，这可能是其自动扫描工具中过于广泛的正则表达式模式，或者是配置错误导致了前所未有的规模误报。该事件凸显了在没有足够的人为监督或微调的情况下部署强大的自动化系统所存在的固有风险。

对开发人员和人工智能信任的更广泛影响

这一事件具有重大影响，特别是对于知识产权保护和支撑数字世界的开源精神之间的微妙平衡。对于开发人员来说，这一事件清楚地提醒他们，他们的工作容易受到自动执行机制的影响。即使是暂时的，无法访问代码、项目历史记录和协作工具也可能会造成巨大的破坏。它还对大公司使用 DMCA 系统的可靠性提出了质疑，强调了强有力的上诉程序和谨慎实施的必要性。

对于更广泛的人工智能行业来说，该事件涉及围绕专有模型的严格保密以及推动 Anthropic 等公司的竞争压力。虽然保护敏感知识产权对于创新和商业生存至关重要，但激进的（尽管是偶然的）执法风险却疏远了经常为生态系统做出贡献的开发者社区。这也给一家核心业务依赖于精度和可靠性的人工智能公司的运营能力蒙上了阴影。

对日常用户的实际影响

虽然 GitHub 的意外删除似乎与普通用户的日常体验相去甚远，但其影响是微妙而重大的。首先，它削弱了公众对主要人工智能公司运营诚信的信任。如果一家成熟的人工智能公司在自己的知识产权保护方面犯下如此巨大的错误，就会引发人们对其核心人工智能产品的可靠性和道德部署的质疑，就像克劳德一样。这可能会导致人们对人工智能的安全性和能力越来越怀疑，而这对于广泛采用至关重要。

其次，对于那些依赖开源工具或可能暂时陷入交火的项目的人来说，中断可能会逐渐蔓延。如果其底层组件受到影响，他们使用的应用程序或服务可能会遇到短暂的中断或更新延迟。更广泛地说，这一事件凸显了数字时代意外审查的可能性，强大的算法和法律工具可能会无意中压制或删除合法内容。它提醒我们，随着人工智能越来越融入我们的数字基础设施，其应用中对透明度、问责制和人工监督的需求变得至关重要，影响着从软件开发到在线信息流的一切。