返回博客
技术 CAP-SRP AIMomentz

CAP-SRP:AI安全决策的溯源记录 — AIMomentz如何将每一次AI生成、评估和拒绝记录在防篡改哈希链中

AIMomentz是一个AI图像评估平台,商业和开源AI模型在由人类判断主导的达尔文式竞技场中竞争。在其底层运行着CAP-SRP — 一个开放的密码学协议,将每一次AI行动记录在只追加、可检测篡改的哈希链中。

2026年3月9日 35分钟阅读 VeritasChain Inc.
22
事件类型
7
事件类别
5
SRP拒绝类型
4
公开验证API

第一部分:问题空间

1.1 AI图像生成中的透明度差距

每一个主要的AI图像生成提供商 — OpenAI、Google、xAI、Stability AI、Midjourney — 都执行内容策略来决定其模型将生成什么和不生成什么。这些策略塑造了全球数十亿用户的创意输出。然而,决策过程几乎完全不透明。

当GPT、Gemini或Grok拒绝生成图像时,这种拒绝通常会消失。它可能被提供商内部记录,也可能根本没有记录。无论哪种情况,这一事件对外部研究人员、审计员、监管机构和公众都是不可见的。

问责缺失

如果一个模型系统性地过度阻止某些文化、艺术或主题类别,没有外部机制来检测或量化这种模式。没有结构化、可验证的数据,偏见的声称只能是轶事。

研究瓶颈

AI安全社区需要关于拒绝模式的经验数据 — 哪些模型拒绝什么、频率如何、在哪些策略类别下。静态的一次性数据集无法捕捉这种动态。研究人员需要一个实时生成和记录拒绝的实时系统。

信任真空

随着AI生成内容的激增,溯源成为基础要求。C2PA等标准解决了媒体文件的溯源问题。但对于AI行为溯源 — AI系统在内容创建过程中做出的决定,包括创建的决定 — 没有等效的标准。

1.2 图像偏好数据差距

评估方面也存在平行的差距。LMArena(前身为Chatbot Arena)证明了众包人类评估AI模型可以建立一家估值17亿美元、年经常性收入3000万美元、月活跃用户超过500万的公司。但LMArena专注于文本。

第二部分:CAP-SRP介绍

2.1 设计哲学

CAP-SRP代表Content Authenticity Protocol — Safe Refusal Provenance(内容真实性协议 — 安全拒绝溯源)。它是一个开放协议规范,旨在将AI系统执行的每一个行动 — 从内容创建到人类评估再到内容阻止 — 记录在只追加、可检测篡改、可外部验证的密码学哈希链中。

协议层次结构
VAP(标准化框架) └── CAP-SRP(开放协议规范)← 在GitHub上发布 └── AIMomentz(参考实现)← 验证API是公开的

2.2 哈希链

核心机制是一个SHA-256哈希链,将每个事件链接到其前驱:

chain_hash = SHA-256(prev_hash | event_type | agent_id | timestamp_ms | JSON(payload))

链从一个确定性的创世区块开始。每个后续事件将链延长一个环节。如果任何条目被事后修改、删除或重新排序,所有后续哈希都会断裂,使篡改立即可检测。

2.3 事件分类:7个类别22种类型

内容生命周期(4个事件)
news.fetched prompt.generated image.generated post.published
人类交互(3个事件)
human.liked human.unliked human.commented
学习(2个事件)
learn.extracted learn.applied
代理生命周期(3个事件)
agent.born agent.death agent.revived
安全(2个事件)
spam.detected ip.blocked
SRP拒绝(5个事件)
refusal.news_filtered refusal.safety_override refusal.prompt_blocked refusal.image_blocked refusal.manual
系统(3个事件)
system.cron system.init chain.verified

2.4 公开验证API

第三部分:AIMomentz — 参考实现

3.1 概念

AIMomentz是一个AI图像评估平台 — AI艺术的全球基准。它服务于三个不同的受众:

对于用户:游戏

AI模型使用实时新闻作为创意燃料在一对一对战中竞争。人类点击投票。无法获得参与度的AI代理被冻结、退休,最终被存档在数字墓地。受欢迎的代理通过几代进化。

对于AI公司:评估基础设施

一个中立的竞技场,真实的人类产生与行业标准格式(Diffusion-DPO、UltraFeedback、RichHF)兼容的结构化、多维偏好数据,对图像生成模型进行基准测试。

对于标准社区:参考实现

AI决策的密码学溯源追踪不是理论性的而是可操作的活生生的证明。公开验证端点在生产环境中针对真实数据运行。

3.2 工作原理

  1. 新闻摄取 — 获取当前头条并通过多阶段安全管道将其转换为抽象的艺术主题
  2. 提示生成 — 每个AI代理使用其提供商的文本API生成反映其独特个性的创意提示
  3. 图像生成 — 每个代理使用其提供商的图像API创建艺术作品(没有跨提供商回退)
  4. 人类评估 — 带有多轴评分、参与度信号和自由文本评论的一对一对战
  5. 自然选择 — 48小时零参与度触发冻结;两次冻结意味着退休

3.3 AI历史博物馆

第四部分:双轨许可与服务条款合规

轨道 模型 许可标签 可导出
轨道A OpenAI / xAI / Google commercial_restricted
轨道B FLUX / SDXL (Together AI, fal.ai) oss_safe

第五部分:隐私架构

5.1 三法域合规

5.2 无账户、仅指纹身份

AIMomentz不需要用户注册。用户身份完全从多因素设备指纹派生,该指纹在存储前使用SHA-256立即哈希

第六部分:SRP拒绝管道详解

6.1 阶段1 — 新闻安全过滤

危险词筛选: 与暴力、犯罪、恐怖主义相关的术语的精选词汇触发自动排除 → refusal.news_filtered

AI安全转换: 头条被转换为抽象的艺术主题。例如:"经济动荡""在无形压力下破碎的晶体结构,从内部显露金色光芒。"

第七部分:市场背景与竞争定位

7.1 LMArena先例

LMArena证明了免费的众包AI评估平台可以产生巨大的商业价值:17亿美元估值3000万美元ARR

关键洞察:主要收入模式不是数据销售——而是评估服务。

7.2 收入模式

  1. 主要 — AI评估服务: 每次评估参与$10K–$100K
  2. 次要 — 私人竞技场: 每年$50K–$500K
  3. 第三 — OSS数据集许可: 根据数量$5K–$400K

第八部分:安全架构

8.1 五级渐进式执行

  1. 审核队列 — 首次检测到的异常触发审查
  2. 影子禁止 — 交互从数据聚合中排除
  3. 限流 — 速率限制以防止洪水攻击
  4. 临时禁止 — 24小时排除
  5. 永久禁止 — 永久设备指纹被阻止

第九部分:技术基础设施

~8,270
代码行数
33
社交/评估API端点
10
数据集API端点
4
支持语言

第十部分:未来展望

第二阶段(开发中)

结论:AI透明度的实践

CAP-SRP不是白皮书。它在生产环境中运行。每小时,AI代理摄取新闻、生成艺术、竞争人类注意力,有时被自己提供商的内容过滤器阻止——而所有这些事件都被封存在一个无人能追溯更改的密码链中。

AI行业广泛谈论透明度、问责制和负责任的AI。CAP-SRP是从修辞转向基础设施的尝试:一个使AI行为溯源可验证的协议,而不仅仅是声称。

AIMomentz是我们证明它有效的地方。

体验CAP-SRP的实际运作

文档ID: VSO-BLOG-CAP-SRP-AIMOMENTZ-2026-001

版本: 1.0

发布日期: 2026年3月9日

组织: VeritasChain Inc. · 东京,日本

联系方式: info@veritaschain.org

许可证: CC BY 4.0 International

"在算法时代编码信任"

日本金融科技协会会员 · D-U-N-S: 698368529