验证势在必行：密码学溯源为何将成为人类文明的下一个关键基础设施

执行摘要

检测已经失败。人类对高质量深度伪造的识别准确率已跌至24.5%——比抛硬币还糟糕。随着合成媒体能力每年增长900%，而检测市场难以跟上步伐，我们面临着一个令人不安的事实：唯一可持续的前进道路是从询问"这是假的吗？"转变为要求"这可以被密码学验证吗？"本文探讨了作为VAP框架一部分的CAP（创意AI档案）如何实现AI内容系统迫切需要的"飞行记录仪"架构——以及2026年8月EU AI法案截止日期为何对每个生产或部署生成式AI的组织都是紧迫的。

2500万美元的视频通话

2024年2月，Arup工程公司的一名财务高管——这家拥有18,000名员工的全球性公司的项目包括悉尼歌剧院——加入了与CFO和几位同事的视频会议。对话是例行的：讨论需要资金转账的机密交易。

他转账了2500万美元。

那次通话中的每个人都是合成的。

攻击者使用公开可用的视频素材创建了受害者共事多年的高管们的实时深度伪造。声音模式、面部表情、对话节奏——全部被令人信服地复制。

这不是受害者判断力的失败。这是我们认识论基础设施的失败。我们建立数字文明的基础是一个隐含的假设：眼见为实，视频证据具有固有的真实性。这个假设现在已被证明是错误的。

而且情况还会更糟。

应该改变一切的数字

在提出解决方案之前，我们必须完全认识到问题的规模。这些统计数据不是预测——它们是当前的测量值：

900%

AI生成虚假内容的年增长率

24.5%

人类对高质量深度伪造的检测准确率

45-50%

准确率下降：从实验室到真实世界

400亿美元

预计到2027年美国GenAI欺诈损失

年增长900%的AI生成虚假内容。不是9%。不是90%。九百个百分点。合成媒体的数量不是线性增长；而是指数级爆炸。
24.5%的人类检测准确率对高质量深度伪造视频。这低于随机概率。抛硬币的效果更好。2025年的iProov研究发现，只有0.1%的参与者正确识别了所有虚假和真实的媒体样本。训练人类识别虚假内容不仅困难——而且徒劳。
45-50%的准确率下降当检测系统从实验室条件转移到真实世界部署时。Facebook深度伪造检测挑战赛的获胜者在测试数据上达到82.56%，但在未见过的视频上下降到65.18%。这一差距代表的是根本性限制，而不是可解决的工程问题。
400亿美元是德勤预计到2027年美国生成式AI欺诈损失。随着能力持续提升，这个数字可能会被证明是保守的。
1美元和20分钟创建了压制新罕布什尔州初选投票的拜登机器人电话——导致600万美元的FCC罚款和刑事起诉。

这些数字讲述了一个一致的故事：基于检测的方法在结构上正在输掉合成媒体军备竞赛，而且差距正在扩大。

检测为何无法获胜

理解检测为何失败需要检验生成和验证之间的根本不对称性。

生成从压缩中受益

生成模型学习其训练数据的压缩表示，然后从这些表示中合成新的输出。每种新的生成技术都发现更高效的压缩，以更少的计算开销产生越来越令人信服的输出。

检测需要枚举

检测系统必须识别可能表明合成来源的所有可能伪影。每种新的生成架构都会引入现有检测器未曾见过的新伪影。检测永远落后一步，是在对技术做出反应而不是预测它们。

这种不对称性是结构性的，而非暂时性的。无论在检测研究上投入多少，都无法克服生成所拥有的根本优势。发表的每篇检测论文都成为下一代旨在绕过它的合成器的训练数据。

考虑军备竞赛的动态：当研究人员发布检测方法时，这些方法就成为优化目标。生成器被明确训练以产生在已发布检测器上得分为"真实"的输出。改进检测的行为本身加速了生成的改进。

结果是一个跑步机，检测必须跑得越来越快，仅仅是为了维持当前的（不充分的）性能——而生成能力则在没有这种限制的情况下复合增长。

范式转变：从检测到溯源

检测的失败指向一种完全不同的方法。与其问"这内容是假的吗？"我们应该问"这内容的来源可以被密码学验证吗？"

这就是"不信任，去验证"原则。它颠覆了我们与数字内容的当前关系：

当前范式

默认信任内容。当有疑问时，尝试检测虚假。接受检测在很多情况下会失败。

建议的范式

以适当的怀疑态度对待未验证的内容。要求溯源的密码学证明。将举证责任从检测转移到证明。

这种范式已经在高风险领域占主导地位：

航空：飞机携带飞行记录仪，创建系统状态、飞行员输入和环境条件的防篡改记录。事故发生后，调查人员不会试图"检测"发生了什么——他们验证记录的证据。
核电：监控系统创建反应堆状态、操作员行为和安全参数的连续、防篡改日志。监管合规需要这些记录，而不是事后重建。
金融市场：交易监控系统以微秒精度记录每笔订单、执行和取消。市场操纵调查审查的是经过验证的记录，而不是近似的重建。

做出影响数十亿人生活的数百万决策的AI系统一直在没有同等问责基础设施的情况下运行。合成媒体危机使这一差距变得不可持续。

CAP：AI内容的飞行记录仪

CAP（创意AI档案）是VeritasChain为内容创建流水线实现的密码学溯源。它是VAP（可验证AI溯源）框架中七个领域配置之一，每个配置都针对AI故障会造成不可逆损害的领域：

配置	领域	范围
VCP	金融	算法交易、高频交易系统
CAP	内容	游戏、电影、动画、出版
DVP	汽车	L3-5级自动驾驶、ADAS
MAP	医疗	AI诊断、医学影像
EIP	能源	智能电网AI、电力基础设施
PAP	政府	信用评分、福利决策
IAP	工业	特定行业扩展

所有配置共享一个共同的密码学核心：JCS规范序列化、UUIDv7事件标识符、SHA-256/SHA-3哈希、Merkle树批处理、为后量子迁移保留Dilithium的Ed25519签名，以及标准化的验证程序。

CAP事件类型

CAP专门跨AI内容流水线跟踪四种事件类型：

每个事件都通过哈希链密码学地链接到其前身。修改任何历史事件，每个后续哈希都会失效。链可以用Ed25519密钥签名，并锚定到外部时间戳机构或区块链系统以进行第三方证明。

突破：否定证明

CAP最重要的能力不是证明发生了什么——而是证明什么没有发生。

考虑AI版权诉讼的法律格局：

Getty Images诉Stability AI：Getty声称Stability AI未经授权使用数百万张受版权保护的图像进行训练。
纽约时报诉OpenAI：时报声称OpenAI的模型复制了受版权保护的新闻报道的大部分内容。
待决案件：数百名艺术家、作家和内容创作者已经提起或正在准备类似的诉讼。

在每个案件中，被告都面临哲学家所说的"魔鬼的证明"——证明否定的挑战。你如何证明你没有使用特定资产？没有全面的日志，这变得不可能。法院必须依赖机构信任，陪审团必须评估可信度而不是证据。

CAP通过完整链覆盖解决这个问题

如果哈希链是全面的且经过验证：

进入流水线的每个资产都有相应的INGEST事件
每个INGEST事件都记录资产的加密哈希
争议资产的哈希要么出现在链中，要么不出现

如果哈希不出现，你就有了非使用的密码学证明。不是证词。不是文件证据。是数学确定性。

这将知识产权诉讼从可信度之战转变为验证练习。影响远超版权：

监管合规：EU AI法案第12条要求对AI系统操作进行全面记录。CAP提供使合规可证明的审计跟踪架构。
保险和责任：当AI系统造成损害时，CAP记录能够精确归因责任——故障是在训练数据、模型架构、生成参数还是部署配置中？
尽职调查：涉及AI系统的收购和合作伙伴关系可以验证训练数据溯源，而不是依赖陈述。

CAP与C2PA：互补架构

行业观察者经常询问CAP与C2PA（内容溯源和真实性联盟）的关系——后者是由Adobe、微软、谷歌、BBC和300多个成员组织支持的标准。

答案：它们是互补的，而非竞争的。

C2PA的焦点

最终产品凭证。回答："谁创建了这个最终图像，应用了哪些编辑？"将内容凭证作为防篡改元数据嵌入。

CAP的焦点

流水线审计跟踪。回答："产生此内容的完整决策链是什么，以及什么数据接触了这个AI系统？"

维度	C2PA	CAP
主要受众	消费者、平台	企业合规
关键问题	"这是真实的吗？"	"我们的流水线可审计吗？"
附加模型	嵌入内容	独立证据包
否定证明	不支持	核心功能
信任模型	集中式PKI	去中心化验证

对于大规模生产AI内容的组织，最佳方法是两者都使用：

内部运营：CAP维护全面的流水线审计跟踪，实现合规证明和知识产权防御。
外部分发：最终输出携带C2PA凭证用于平台验证和消费者透明度。

VAP框架的密码学原语与C2PA的技术基础保持一致，在没有当前依赖的情况下实现未来的互操作性。

监管催化剂：EU AI法案第50条

密码学溯源不仅仅是最佳实践——它正在成为法律要求。

EU AI法案第50条为生成合成内容的AI系统建立了透明度义务。提供商必须确保输出：

"以机器可读格式标记，并可检测为人工生成或操纵"

法规明确提到适用技术包括"水印、元数据标识、用于证明内容溯源和真实性的密码学方法、日志方法、指纹，或其组合"。

执行时间表

日期	里程碑
2024年8月	AI法案生效
2025年2月	禁止实践生效
2025年8月	GPAI模型义务生效
2026年8月	第50条透明度义务强制执行

处罚达到1500万欧元或全球年营业额的3%——以较高者为准。

2025年12月的实践守则草案规定了包括持久标签、开放标准（RDF、JSON-LD）、自动标记和第三方验证检测接口在内的要求。

在欧洲生产或部署生成式AI的组织有19个月的时间来实施合规的溯源系统。这不是未来的考虑——这是当前的实施要求。

平台实施：进展与障碍

即使是完美的溯源也面临实际挑战：大多数主要平台在上传时会剥离元数据，在此过程中破坏凭证。

当前平台支持

平台	C2PA支持	实施
YouTube	✓	2024年10月起的验证标签
TikTok	✓	首个强制C2PA集成（2025年1月）
LinkedIn	✓	元数据保留
Facebook	✗	上传时剥离元数据
Instagram	✗	上传时剥离元数据
X（Twitter）	✗	上传时剥离元数据

这造成了鸡和蛋的问题：如果平台丢弃签名，创作者不会签署内容；如果创作者采用率低，平台不会保留签名。

架构解决方案

C2PA通过结合硬绑定（密码学哈希）和软绑定（不可见水印和内容指纹）的"持久内容凭证"来解决这个问题。当元数据被剥离时，水印仍然嵌入在像素数据中，能够从云清单存储库恢复凭证。

CAP采用不同的方法：审计链独立于内容存在。平台元数据剥离不影响证据包，证据包可以独立呈现以供验证。这种分离还实现了隐私保护验证——你可以证明溯源而不透露内容本身。

采用时间表预测

2024-2026年：早期采用阶段（专业相机、企业工具）

2026-2028年：监管压力阶段（EU AI法案执行、额外司法管辖区）

2028-2030年：平台基础设施阶段（主要平台保留凭证）

2030年以后：主流采用（消费设备集成、浏览器级验证）

在Let's Encrypt使证书免费且浏览器将HTTP标记为"不安全"后，HTTPS过渡急剧加速。内容真实性可能需要类似的催化剂——免费签名工具和对未签名内容的明确警告。

更广阔的VAP愿景

CAP解决的是内容创作，但验证的必要性延伸到AI做出重大决策的每个领域。

VAP框架反映了对AI故障会造成不可逆损害的领域的系统分析——对人类生命、社会基础设施或民主机构。每个领域配置将相同的密码学架构应用于特定领域的事件类型和合规要求。

VeritasChain已向50个司法管辖区的67个监管机构提交了VAP和VCP材料，为在全球新兴AI治理体制中的考虑定位该框架。

实施指南

对于考虑实施密码学溯源的组织，我们建议分阶段进行：

阶段1：流水线审计

映射资产进入、转换和离开AI系统的每个点。识别数据摄入点、模型训练操作、生成端点和内容导出流。此映射揭示了日志要求的范围并识别集成点。

阶段2：事件日志

为已识别的事件实施日志，从INGEST开始。对于进入流水线的每个资产：计算并记录加密哈希，记录权利基础和来源，以足够的精度进行时间戳。仅INGEST日志就为知识产权防御提供了重要价值。

阶段3：链安全

实施哈希链和数字签名：通过哈希合并将每个事件链接到其前身，在适当的密钥管理下用Ed25519密钥签署事件，考虑外部时间戳或区块链锚定以进行第三方证明。

阶段4：合规集成

将日志映射到特定监管要求：EU AI法案第12条（日志）和第50条（合成内容标记）、特定行业要求（金融的MiFID II RTS 25、医疗的HIPAA）、ISO、NIST和特定领域机构的新兴标准。

阶段5：外部集成

考虑为分发内容附加C2PA凭证：为最终输出实施C2PA签名，注册内容凭证云服务，测试平台保留和验证。

资源

CAP规范可在veritaschain.org/vap/cap/获取，采用CC BY 4.0许可。参考实现和SDK文档可在GitHub获取。