欧易OKX官网地址

首次购买¥200 及以上的数字货币,您可以在新手福利中领取价值¥20 奖励!

当前位置:首页资讯详情

Bitlayer Research:Binius STARKs原理解析及其优化思考

14hoursago(10,222024(UTC))LikeDislikeComment作者:mutourend&lynndell,BitlayerLabs

原文标题:《BiniusSTARKsAnalysisandItsOptimization》

原文链接:https://blog.bitlayer.org/Binius_STARKs_Analysis_and_Its_Optimization/

摘要:第1,2,3代STARK证明系统位宽分别为252,64和32bit,编码效率虽有提高,但仍有浪费空间;Binius直接对位操作,编码紧凑高效,很可能是未来的第4代STARK。Binius使用基于塔式二进制域的算术化、改进版的HyperPlonk乘积与置换检查、小域多项式承诺等技术,从各个角度提升效率。在二进制域乘法、ZeroCheck、SumCheck、PCS等方面可进一步优化,以进一步提高证明速度和降低proofsize。

1引言区别于基于椭圆曲线的SNARKs,可将STARKs看成是hash-basedSNARKs。当前STARKs效率低下的一个主要原因是:实际程序中的大多数数值都较小,如for循环中的索引、真假值、计数器等。然而,为了确保基于Merkle树证明的安全性,使用Reed-Solomon编码对数据进行扩展时,许多额外的冗余值会占据整个域,即使原始值本身非常小。为解决该问题,降低域的大小成为了关键策略。

如表1所示,第1代STARKs编码位宽为252bit,第2代STARKs编码位宽为64bit,第3代STARKs编码位宽为32bit,但32bit编码位宽仍然存在大量的浪费空间。相较而言,二进制域允许直接对位进行操作,编码紧凑高效而无任意浪费空间,即第4代STARKs。

表1:STARKs衍化路径相比于Goldilocks、BabyBear、Mersenne31等近几年新研究发现的有限域,二进制域的研究可追溯到上个世纪80年代。当前,二进制域已经广泛应用于密码学中,典型例子包括:

高级加密标准(AES),基于F28域;

Galois消息认证码(GMAC),基于F2128域;

QR码,使用基于F28的Reed-Solomon编码;

原始FRI和zk-STARK协议,以及进入SHA-3决赛的Grøstl哈希函数,该函数基于F28域,是一种非常适合递归的哈希算法。

当采用较小的域时,扩域操作对于确保安全性愈发重要。而Binius所使用的二进制域,需完全依赖扩域来保证其安全性和实际可用性。大多数Prover计算中涉及的多项式无需进入扩域,而只需在基域下操作,从而在小域中实现了高效率。然而,随机点检查和FRI计算仍需深入到更大的扩域中,以确保所需的安全性。

基于二进制域来构建证明系统时,存在2个实际问题:STARKs中计算trace表示时,所用域大小应大于多项式的阶;STARKs中Merkletree承诺时,需做Reed-Solomon编码,所用域大小应大于编码扩展后的大小。

Binius提出了一种创新的解决方案,分别处理这两个问题,并通过两种不同的方式表示相同的数据来实现:首先,使用多变量(具体是多线性)多项式代替单变量多项式,通过其在“超立方体”(hypercubes)上的取值来表示整个计算轨迹;其次,由于超立方体每个维度的长度均为2,因此无法像STARKs那样进行标准的Reed-Solomon扩展,但可以将超立方体视为方形(square),基于该方形进行Reed-Solomon扩展。这种方法在确保安全性的同时,极大提升了编码效率与计算性能。

2原理解析当前大多数SNARKs系统的构建通常包含以下两部分:

信息理论多项式交互预言机证明(Information-TheoreticPolynomialInteractiveOracleProof,PIOP):PIOP作为证明系统的核心,将输入的计算关系转化为可以验证的多项式等式。不同的PIOP协议通过与验证者的交互,允许证明者逐步发送多项式,使得验证者通过查询少量多项式的评估结果即可验证计算是否正确。现有的PIOP协议包括:PLONKPIOP、SpartanPIOP和HyperPlonkPIOP等,它们各自对多项式表达式的处理方式有所不同,从而影响整个SNARK系统的性能与效率。

多项式承诺方案(PolynomialCommitmentScheme,PCS):多项式承诺方案用于证明PIOP生成的多项式等式是否成立。PCS是一种密码学工具,通过它,证明者可以承诺某个多项式并在稍后验证该多项式的评估结果,同时隐藏多项式的其他信息。常见的多项式承诺方案有KZG、Bulletproofs、FRI(FastReed-SolomonIOPP)和Brakedown等。不同的PCS具有不同的性能、安全性和适用场景。

根据具体需求,选择不同的PIOP和PCS,并结合合适的有限域或椭圆曲线,可以构建具有不同属性的证明系统。例如:

•Halo2:由PLONKPIOP与BulletproofsPCS结合,并基于Pasta曲线。Halo2设计时,注重于可扩展性,以及移除ZCash协议中的trustedsetup。

•Plonky2:采用PLONKPIOP与FRIPCS结合,并基于Goldilocks域。Plonky2是为了实现高效递归的。在设计这些系统时,选择的PIOP和PCS必须与所使用的有限域或椭圆曲线相匹配,以确保系统的正确性、性能和安全性。这些组合的选择不仅影响SNARK的证明大小和验证效率,还决定了系统是否能够在无需可信设置的前提下实现透明性,是否可以支持递归证明或聚合证明等扩展功能。

Binius:HyperPlonkPIOP+BrakedownPCS+二进制域。具体而言,Binius包括五项关键技术,以实现其高效性和安全性。首先,基于塔式二进制域(towersofbinaryfields)的算术化构成了其计算的基础,能够在二进制域内实现简化的运算。其次,Binius在其交互式Oracle证明协议(PIOP)中,改编了HyperPlonk乘积与置换检查,确保了变量及其置换之间的安全高效的一致性检查。第三,协议引入了一个新的多线性移位论证,优化了在小域上验证多线性关系的效率。第四,Binius采用了改进版的Lasso查找论证,为查找机制提供了灵活性和强大的安全性。最后,协议使用了小域多项式承诺方案(Small-FieldPCS),使其能够在二进制域上实现高效的证明系统,并减少了通常与大域相关的开销。

2.1有限域:基于towersofbinaryfields的算术化塔式二进制域是实现快速可验证计算的关键,主要归因于两个方面:高效计算和高效算术化。二进制域本质上支持高度高效的算术操作,使其成为对性能要求敏感的密码学应用的理想选择。此外,二进制域结构支持简化的算术化过程,即在二进制域上执行的运算可以以紧凑且易于验证的代数形式表示。这些特性,加上能够通过塔结构充分利用其层次化的特性,使得二进制域特别适合于诸如Binius这样可扩展的证明系统

其中“canonical”是指在二进制域中元素的唯一且直接的表示方式。例如,在最基本的二进制域F2中,任意k位的字符串都可以直接映射到一个k位的二进制域元素。这与素数域不同,素数域无法在给定位数内提供这种规范的表示。尽管32位的素数域可以包含在32位中,但并非每个32位的字符串都能唯一地对应一个域元素,而二进制域则具备这种一对一映射的便利性。在素数域Fp中,常见的归约方法包括Barrett归约、Montgomery归约,以及针对Mersenne-31或Goldilocks-64等特定有限域的特殊归约方法。在二进制域F2k中,常用的归约方法包括特殊归约(如AES中使用)、Montgomery归约(如POLYVAL中使用)和递归归约(如Tower)。论文《ExploringtheDesignSpaceofPrimeFieldvs.BinaryFieldECC-HardwareImplementations》指出,二进制域在加法和乘法运算中均无需引入进位,且二进制域的平方运算非常高效,因为它遵循(X+Y)2=X2+Y2的简化规则。

如图1所示,一个128位字符串:该字符串可以在二进制域的上下文中以多种方式进行解释。它可以被视为128位二进制域中的一个独特元素,或者被解析为两个64位塔域元素、四个32位塔域元素、16个8位塔域元素,或128个F2域元素。这种表示的灵活性不需要任何计算开销,只是对位字符串的类型转换(typecast),是一个非常有趣且有用的属性。同时,小域元素可以被打包为更大的域元素而不需要额外的计算开销。Binius协议利用了这一特性,以提高计算效率。此外,论文《OnEfficientInversioninTowerFieldsofCharacteristicTwo》探讨了在n位塔式二进制域中(可分解为m位子域)进行乘法、平方和求逆运算的计算复杂度。

图1:塔式二进制域

2.2PIOP:改编版HyperPlonkProduct和PermutationCheck——适用于二进制域Binius协议中的PIOP设计借鉴了HyperPlonk,采用了一系列核心检查机制,用于验证多项式和多变量集合的正确性。这些核心检查包括:

GateCheck:验证保密见证ω和公开输入x是否满足电路运算关系C(x,ω)=0,以确保电路正确运行。

PermutationCheck:验证两个多变量多项式f和g在布尔超立方体上的求值结果是否为置换关系f(x)=f(π(x)),以确保多项式变量之间的排列一致性。

LookupCheck:验证多项式的求值是否在给定的查找表中,即f(Bµ)⊆T(Bµ),确保某些值在指定范围内。

MultisetCheck:检查两个多变量集合是否相等,即{(x1,i,x2,)}i∈H={(y1,i,y2,)}i∈H,保证多个集合间的一致性。

ProductCheck:检测有理多项式在布尔超立方体上的求值是否等于某个声明的值∏x∈Hµf(x)=s,以确保多项式乘积的正确性。

ZeroCheck:验证一个多变量多项式在布尔超立方体上的任意点是否为零∏x∈Hµf(x)=0,∀x∈Bµ,以确保多项式的零点分布。

SumCheck:检测多变量多项式的求和值是否为声明的值∑x∈Hµf(x)=s。通过将多元多项式的求值问题转化为单变量多项式求值,降低验证方的计算复杂度。此外,SumCheck还允许批处理,通过引入随机数,构造线性组合实现对多个和校验实例的批处理。

BatchCheck:基于SumCheck,验证多个多变量多项式求值的正确性,以提高协议效率。

尽管Binius与HyperPlonk在协议设计上有许多相似之处,但Binius在以下3个方面做出改进:

ProductCheck优化:在HyperPlonk中,ProductCheck要求分母U在超立方体上处处非零,且乘积必须等于一个特定值;Binius通过将该值特化为1,简化这一检查过程,从而降低计算复杂度。

除零问题的处理:HyperPlonk未能充分处理除零情况,导致无法断言U在超立方体上的非零问题;Binius正确地处理了这一问题,即使在分母为零的情况下,Binius的ProductCheck也能继续处理,允许推广到任意乘积值。

跨列PermutationCheck:HyperPlonk无此功能;Binius支持在多个列之间进行PermutationCheck,这使得Binius能够处理更复杂的多项式排列情况。

因此,Binius通过对现有PIOPSumCheck机制的改进,提升了协议的灵活性和效率,尤其在处理更复杂的多变量多项式验证时,提供了更强的功能支持。这些改进不仅解决了HyperPlonk中的局限性,还为未来基于二进制域的证明系统奠定了基础。

2.3PIOP:新的multilinearshiftargument——适用于booleanhypercube在Binius协议中,虚拟多项式的构造和处理是关键技术之一,能够有效地生成和操作从输入句柄或其他虚拟多项式派生出的多项式。以下是两个关键方法:

Packing:该方法通过将词典序中相邻位置的较小元素打包成更大的元素来优化操作。Pack运算符针对大小为2κ的块操作,并将它们组合成高维域中的单个元素。通过多线性扩展(MultilinearExtension,MLE),这个虚拟多项式可以高效地评估和处理,将函数t转换为另一个多项式,从而提高了计算性能。

移位运算符:移位运算符重新排列块内的元素,基于给定偏移量o进行循环移位。该方法适用于大小为2b的块,每个块根据偏移量执行移位。移位运算符通过检测函数的支持来进行定义,确保在处理虚拟多项式时保持一致性和效率。评估该构造的复杂度随块大小线性增长,特别适用于处理大数据集或布尔超立方体中的高维场景。

2.4PIOP:改编版Lassolookupargument——适用于二进制域Lasso协议允许证明方承诺一个向量a∈Fm,并证明其所有元素均存在于一个预先指定的表t∈Fn中。Lasso解锁了“查找奇点”(lookupsingularities)的概念,并能适用于多线性多项式承诺方案。其效率体现在以下两个方面:

证明效率:对于大小为n的表中的m次查找,证明方只需承诺m+n个域元素。这些域元素很小,均位于集合{0,...,m}中。在基于多次幂运算的承诺方案中,证明方的计算成本为O(m+n)次群运算(如椭圆曲线点加),外加证明多线性多项式在布尔超立方体上是否为表元素的求值成本。

无需承诺大表:如果表t是结构化的,则无需对其进行承诺,因此可以处理超大表(如2128或更大)。证明方的运行时间仅与访问的表条目相关。对于任意整数参数c>1,证明方的主要成本是证明大小,承诺的域元素为3·cm+c·n1/c个。这些域元素都是较小的,位于集合{0,...,max{m,n1/c,q}−1}中,其中q为a中的最大值。

Lasso协议由以下三个组件构成:

大表的虚拟多项式抽象:通过将虚拟多项式组合,实现在大表上的操作,确保在表内进行高效的查找和处理。

小表查找:Lasso的核心是小表查找,作为虚拟多项式协议的核心构建,使用离线内存检测验证一个虚拟多项式在布尔超立方体上的求值是否是另一个虚拟多项式求值的子集。这一查找过程将归约为多集合检测的任务。

多集合检查:Lasso引入虚拟协议来执行多集合检查,验证两个集合的元素是否相等或满足特定条件。

Binius协议将Lasso适应于二进制域的操作,假设当前域是一个大特征的素数域(远大于被查找列的长度)。Binius引入了乘法版本的Lasso协议,要求证明方和验证方联合递增协议的“内存计数”操作,不是通过简单的加1递增,而是通过二进制域中的乘法生成元来递增。然而,这一乘法改编引入了更多的复杂性,与递增操作不同,乘法生成元并非在所有情况下递增,在0处存在单一轨道,这可能成为攻击点。为防止这种潜在的攻击,证明方必须承诺一个处处非零的读取计数向量,以确保协议的安全性。

2.5PCS:改编版BrakedownPCS——适用于Small-Field构建BiniusPCS的核心思想是packing。Binius论文中提供了2种基于二进制域的Brakedown多项式承诺方案:一种是采用concatenatedcode来实例化;另一种采用block-levelencoding技术,支持单独使用Reed-Solomoncodes。第二种BrakedownPCS方案,简化了证明和验证流程,但proofsize要比第一种略大一点,但所带来的简化和实现优势,做该取舍是值得的。

Binius多项式承诺主要使用小域多项式承诺与扩展域评估、小域通用构造和块级编码与Reed-Solomon码技术。

小域多项式承诺与扩展域评估:Binius协议中的承诺是在小域K上的多项式承诺,并在更大的扩展域L/K中进行评估。这种方法确保了每个多线性多项式t(X0,...,Xℓ−1)属于域K[X0,...,Xℓ−1],而评估点可以位于更大扩展域L中。承诺方案专门设计用于小域多项式,并能在扩展域上进行查询,同时保证承诺的安全性和效率。

小域通用构造:小域通用构造通过定义参数ℓ、域K及其相关的线性块码C,确保扩展域L足够大,以支持安全评估。为了在保持计算效率的同时提高安全性,协议通过扩展域的特性,以及采用线性块码对多项式进行编码,保证了承诺的稳健性。

块级编码与Reed-Solomon码:针对字段比线性块码字母表更小的多项式,Binius提出了块级编码方案。通过这一方案,即使在小域(如F2)中定义的多项式,也可以使用如F216这样的大字母表的Reed-Solomon码高效承诺。Reed-Solomon码之所以被选中,是因为它具有高效性和最大距离分离特性。该方案通过将消息打包并逐行编码,之后利用Merkle树进行承诺,简化了操作复杂度。块级编码允许小域多项式的高效承诺,而不会产生通常与大域相关的高计算开销,从而使得在F2等小域中承诺多项式成为可能,并在生成证明与验证中保持计算效率。

3优化思考为了进一步提升Binius协议的性能,本文提出了四个关键优化点:

GKR-basedPIOP:针对二进制域乘法运算,借助GKR协议,来替换Binius论文中的的LassoLookup算法,可大幅降低Binius的承诺开销;

ZeroCheckPIOP优化:在Prover与Verifier之间进行计算开销权衡,使得ZeroCheck操作更加高效;

SumcheckPIOP优化:针对小域Sumcheck的优化,进一步减少了小域上的计算负担;

PCS优化:通过FRI-Binius优化,降低证明大小,提高协议的整体性能。

3.1GKR-basedPIOP:基于GKR的二进制域乘法Binius论文引入一种基于lookup的方案,旨在实现高效的二进制域乘法运算。通过Lassolookupargument改编的二进制域乘法算法依赖于lookups和加法操作的线性关系,这些操作与单个word中的limbs数量成比例。虽然这一算法在某种程度上优化了乘法操作,但仍需要与limbs数量线性相关的辅助承诺。

GKR(Goldwasser-Kalai-Rothblum)协议中的核心思想是,证明方(P)和验证方(V)针对一个有限域F上的layered算术电路达成一致。该电路的每个节点有两个输入,用于计算所需的函数。为了减少验证方的计算复杂度,协议使用SumCheck协议,将关于电路输出门值的声明逐步简化为更低层的门值声明,直至最终将声明简化到关于输入的陈述。这样,验证方只需检查电路输入的正确性即可。

基于GKR的整数乘法运算算法,通过将“检查2个32-bit整数A和B是否满足A·B=?C”,转换为“检查中(gA)B=?gC是否成立”,借助GKR协议大幅减少承诺开销。与之前的Biniuslookup方案相比,基于GKR的二进制域乘法运算只需一个辅助承诺,并且通过减少Sumchecks的开销,使该算法更加高效,特别是在Sumchecks操作比承诺生成更便宜的场景下。随着Binius优化的推进,基于GKR的乘法运算逐渐成为减少二进制域多项式承诺开销的有效途径。

3.2ZeroCheckPIOP优化:Prover与Verifier计算开销权衡论文《SomeImprovementsforthePIOPforZeroCheck》在证明方(P)和验证方(V)之间调整工作量的分配,提出了多种优化方案,以权衡开销。该工作探索了不同的k值配置,使得在证明方和验证方之间达成了成本的权衡,特别是在减少传输数据和降低计算复杂性方面。

减少证明方的数据传输:通过将一部分工作转移给验证方V,从而降低证明方P发送的数据量。在第i轮中,证明方P需要向验证方V发送vi+1(X),其中X=0,...,d+1。验证方V检查以下等式以验证数据的正确性

vi=vi+1(0)+vi+1(1).

优化方法:证明方P可以选择不发送vi+1(1),而是让验证方V自行通过以下方式计算出该值

vi+1(1)=vi−vi+1(0).

此外,在第0轮,诚实的证明方P始终发送v1(0)=v1(1)=0,这意味着无需进行任何评估计算,从而显著减少了计算和传输成本,降低至d2n−1CF+(d+1)2n−1CG。

减少证明方评估点的数量:在协议的第i轮中,验证者在之前的i轮中已经发送了一个值序列r=(r0,...,ri−1)。当前协议要求证明者(P)发送多项式

vi+1(X)=∑δˆn(α,(r,X,x))C(r,X,x).x∈H−−1

优化方法:证明方P发送以下多项式这两个函数之间的关系是:

vi(X)=vi′(X)·δi+1((α0,...,αi),(r,X))

其中δˆi+1因为验证者拥有α和r,所以是完全已知的。这个修改的好处在于vi′(X)的次数比vi(X)少1,这意味着证明者需要评估的点更少。因此,主要的协议变化发生在轮次之间的检查环节。

此外,将原本的约束vi=vi+1(0)+vi+1(1)优化为(1−αi)vi′+1(0)+αivi′+1(1)=vi′(X)。则证明者需要评估和发送的数据更少,进一步减少传输的数据量。计算δˆn−i−1也比计算δˆn更高效。通过这两项改进,成本降低为大约:2n−1(d−1)CF+2n−1dCG。在常见的d=3情况下,这些优化使成本降低了5/3倍。

代数插值优化:对于诚实的证明者,C(x0,...,xn−1)在Hn上为零,可表示为:C(x0,...,xn-1)=∑xi(xi-1)Qi(x0,...,xn-1)。虽然Qi不是唯一的,但可以通过多项式长除法构造一个有序的分解:从Rn=C开始,逐次除以xi(xi−1)来计算Qi和Ri,其中R0是C在Hn上的多线性扩展,且假设其为零。分析Qi的次数,可以得出:对于j>i,Qj在xi上的次数与C相同;对于j=i,次数减少2;对于j