这两天 2 个新闻
英伟达 5.23 ATH, 市值 2.55 万亿美金
ZK 硬件加速公司 Cysic 5.24 完成由 Hashkey Capital 和 OKX Ventures 领投的 1200万美元 Pre-A 轮融资
你会好奇,这 2 条新闻的关联是什么?ZK 硬件是什么?
的确,ZK 硬件对大多数人还是比较陌生的,但其对区块链的意义,不亚于 GPU 对人工智能的意义。
于是我写了一篇科普小文,欢迎阅读 👇
总所周知,15 年前比特币/区块链的诞生,是为了对抗中心化的世界:比特币对抗法币(中心化货币),区块链(以 ETH 为代表)对抗中心化服务器;
区块链对抗中心化服务器的方法,是把自己变成一个“世界计算机”,任何人都拥有自己的数据,同时可以帮助操作和验证。这也是区块链的最大创新之一;
但这个“世界计算机”最被人诟病的一点是,交易成本太高速度太慢,随便一个操作动辄几 U, 拥堵的时候甚至上百 U, 不利于更多人来使用和操作;
于是大家探索出来一种方案:L2 Rollup, 将数百个已处理的交易汇总成一个批次与ETH主网平行成本更低的 L2 链上执行交易,交易完成后再一次性发布到ETH主网(L1),提升交易速度,降低交易费用;
有 2 类主流的 L2 Rollup 方案,OP (Optimistic) 和 ZK (Zero Knowledge)
OP 假设所有的 2 层交易都是有效的,通过欺诈证明(fraud proofs)来验证交易,具有较快的链下交易处理速度和较低的交易成本,但链上验证可能需要更长时间(几天到 2 周不等),同时存在一定的安全风险;
ZK 使用基于零知识证明(Zero Knowledge Proof)的复杂密码学来确保交易的有效性,需要一定的链下计算资源和计算时间,好处是一旦生成证明,链上非常快,同时在安全性和隐私方面具有优势;
值得一提的是,V 神在多个场合表示看好 ZK, 并在 4 月的香港 Web3 大会上提到了多个解决方案,包括并行化、聚合树和 ASIC 加速。
从人工智能的发展历史来看,硬件至关重要
现代人工智能/机器学习算法的基础「神经网络」,用计算机来模拟人脑,其实 1950 年代,也就是 70 多年前就出现了。但受限于算力,神经网络的研究从 1970 开始进展缓慢;
一个标志性的转折点是 2012 年李飞飞组织的第三届 imagenet 图像识别比赛上,Geoffery Hinton 团队的算法 AlexNet 以 84% 的准确率轻松斩获冠军(历史最好成绩 75%),秘诀是使用了2块英伟达的 GTX580 显卡 + 卷积神经网络;BTW, 谷歌用了 16000 颗 CPU, 只实现了74.8%的识别准确率;
Why GPU? 因为神经网络的每个计算任务都是独立的,可以采用高度并行的方式进行,这正是 GPU 擅长的地方,而 CPU 擅长的是复杂的逻辑控制和串行计算。正如它们的名字,CPU = Central Processing Unit(中央处理器),GPU = Graphics processing unit(图形处理器),GPU 最早是用来支撑游戏和影视里面的大量图形并行计算,误打误撞被用来做神经网络训练,以及各种 Crypto 挖矿;
至此一战,学术界和产业界同时被轰动,Geoffery Hinton 奠定了自己在人工智能的宗师级地位,把自己和 2 位学生打包成一家公司(其中一位学生就是大名鼎鼎的前 OpenAI 联合创始人Ilya Sutskever),4400万美元卖给了谷歌;全世界的高科技公司开始不计成本地做两件事:买光英伟达的显卡,挖光大学里的AI研究员;
这届挑战赛被视为人工智能的“大爆炸时刻”。
在帮助区块链成为“世界计算机”的 L2 Rollup 上,ZK 硬件同样至关重要
上面有提到,ZK证明一旦生成,链上非常快,同时在安全性和隐私方面具有优势,缺点是因为使用了复杂的密码学,需要进行大量的指数级运算,需要一定的链下计算资源和计算时间,完全通过CPU计算需要数小时,甚至数天的计算,这对项目来说是不可接受的,同时也阻碍了 ZK 的发展(是不是想到了神经网络的早期状况?);
ZK证明生成的过程,主要由NTT和MSM计算构成,这 2 类都是逻辑简单且大量重复的计算,和神经网络类似,也非常适合用硬件做并行计算加速,降低链下计算资源和计算时间,最终把ZK证明生成加速到秒级或者分钟级,实现 1000 倍以上的加速;
ZK加速硬件分 3 类:GPU、FPGA、ASIC;
GPU 并行算力的确很强,但缺点也很明显,功耗高,体积大,价格贵;
ASIC(Application Specific Integrated Circuit,专用集成电路),可以基于特定的任务(比如 ZK 证明里面用到的NTT和MSM计算)来设计专有芯片,用更低成本实现更高性能;
FPGA(Field Programmable Gate Array,现场可编程门阵列):通用可编辑的半定制芯片,可以基于不同的任务来编程,成本比 ASIC 高,适合用作产品原型的开发、低产量的特定应用、还可以用于用于ASIC的验证。
综上所述,GPU和FPGA的使用成本较高,ASIC 需要特定的设计和生产但成本更低,一定会成为ZK硬件加速的主力,这也是 V 神提及的重要原因。
ZK硬件加速中,Cysic @cysic_xyz 作为龙头项目值得一提
上面有提到,ZK证明生成的过程,主要由NTT和MSM计算构成;
Cycis 使用赛灵思的公版 FPGA 设计了一个 MSM 加速器(代号SolarMSM),展示出了迄今为止最佳的性能,在 40ms 内完成了 BN254 曲线上的 2^26 MSM计算任务,比 ZPrize 竞赛的冠军性能还要高1–2个数量级,展示出来强大的技术实力;
在基于 FPGA 完成了 POC 后,Cycis 下个阶段的目标是研发ASIC芯片,在提升算力的同时降低功耗,将 ZK证明生成的时间和成本降到极致
在 Cycis 的路线图中,会推出基于自研的ASIC芯片的硬件,包括企业级的 ZK Pro 和消费者级的 ZK Air, 为 Scroll 等 ZK Rollup L2 提供 ZK 硬件加速服务;
ZK Air 的大小与移动电源、笔记本电脑电源接近,用户可通过 Type-C 接口将其连接到笔记本电脑、iPad,甚至智能手机,为 ZK 提供加速
这里就很有意思了,Cycis 要做的不仅是硬件厂商(比特大陆)或中心化算力提供方(AWS),同时也会构建一个 ZK Prover Network, 基于 Tokenomics 激励更多用户使用 Cysic 硬件和闲置 GPU 来提供算力,增强区块链 Proof 的能力,让 Web3 变成 Read, Write, Own, Proof
这也是我认为这个项目值得关注的原因,每个人都可以参与其中,通过算力的贡献获取 Token (DePIN 来了哈哈) . 按照现在硬件速度的发展,不知道 3-5 年内能不能实现用手机来生成 Proof : )
另外,零知识证明不仅仅是用在 L2 Rollup 上, 还可以支持匿名支付、身份证明、匿名投票等传输敏感数据的场景,以及打击非法金融和虚假信息。也就是说,ZK 硬件以及ZK Prover Network, 可以从 Web3 延伸到 Web2,迎来十亿的用户规模,具有巨大的空间。
参考人工智能的发展历史, ZK & ZK 硬件对于区块链的发展至关重要。希望 ZK 硬件的不断成熟,可以推动区块链向“世界计算机”更进一步,支撑更多的去中心化服务,迎来 Crypto 的“大爆炸时刻”。
参考资料