英伟达推出NVQLinK架构,GPU将加速量子计算落地

近日,美国英伟达(NVIDIA)公司及多家互助机构(包含多所美国国度试验室)结合颁发了题为“Platform Architecture for Tight Coupling of High-Performance Computing with Quantum Processors”的论文。该论文提出了一种名为NVQLinK的新型软硬件协同架构,并正在10月28日的英伟达GTC年夜会上正式发布。NVQLinK将传统的高机能GPU计较与量子处置惩罚单位举行了深度集成,以撑持量子纠错等要害使命,为完成可扩大的量子计较机供给了可行的工程路径。@ NVIDIA量子纠错:完成量子计较的焦点想要构建具备实用价值的量子计较机,就必需完成对年夜范围量子比特的准确把持。然而,因为量子比特极为懦弱,任何来自外界的弱小噪声或节制掉误城市招致量子比彪炳现不对,从而招致量子计较的掉败。实在,经典计较也面对着堕落的问题。没有同的是,经典计较比特可以经由过程简略的复制“备份”和彼此比拟来成立一套靠得住的纠错机制。但正在量子世界,这套要领却彻底掉效:起首,量子不成克隆道理让咱们无奈完善复制一个未知量子态;其次,咱们一旦试

  近日,美国英伟达(NVIDIA)公司及多家互助机构(包含多所美国国度试验室)结合颁发了题为“Platform Architecture for Tight Coupling of High-Performance Computing with Quantum Processors”的论文。该论文提出了一种名为NVQLinK的新型软硬件协同架构,并正在10月28日的英伟达GTC年夜会上正式发布。

  NVQLinK将传统的高机能GPU计较与量子处置惩罚单位举行了深度集成,以撑持量子纠错等要害使命,为完成可扩大的量子计较机供给了可行的工程路径。

英伟达推出NVQLinK架构,GPU将加速量子计算落地

@ NVIDIA

量子纠错:完成量子计较的焦点

  想要构建具备实用价值的量子计较机,就必需完成对年夜范围量子比特的准确把持。然而,因为量子比特极为懦弱,任何来自外界的弱小噪声或节制掉误城市招致量子比彪炳现不对,从而招致量子计较的掉败。

  实在,经典计较也面对着堕落的问题。没有同的是,经典计较比特可以经由过程简略的复制“备份”和彼此比拟来成立一套靠得住的纠错机制。但正在量子世界,这套要领却彻底掉效:起首,量子不成克隆道理让咱们无奈完善复制一个未知量子态;其次,咱们一旦试图间接读取量子态来查抄不对,就会激发量子态塌缩,从而粉碎其叠加状况。

  有甚么要领可以正在没有间接读取量子态信息的条件下“捉住”不对呢?量子纠错应运而生,它大抵分为编码、探测、解码这三步:

  1. 编码:将数据经由过程精妙的体式格局,疏散存储到多个“物理量子比特”上,行将多个物理量子比特编码为一个逻辑量子比特。

  2. 探测:没有间接丈量存储信息的物理量子比特,而是经由过程丈量与之互动的“帮助比特”来获得与不对无关的信息,这些信息被称为“不对病症(Syndrome)”。

  3. 解码:将Syndrome正在经典计较机长进行解码阐发,终极揣度登程生的不对并举行改正。解码后的Syndrome能通知人们“产生了甚么不对”和“不对产生正在那里”,但没有影响“逻辑量子比特”存储的量子信息。

以后架构无奈让量子计较降地?

  虽然量子纠错正在道理上是可行的,但工程完成上却面对着伟大的应战:它时刻发生海量的Syndrome信息,这些信息必需被当即处置惩罚来保障量子纠错的波动运转。这就对信息处置惩罚器提出了很高的要求:

  1. 高频采样:量子处置惩罚器必需以极高频次(如每一秒百万次)连续丈量帮助量子比特发生Syndrome。

  2. 及时解码:海量的Syndrome必需当即被发送到一个经典计较单位举行解码。该单位卖力运转庞大的“解码算法”,实在质是一个高机能计较使命。

  3. 高算力需要:据NVIDIA的论文预算,要是要维持100个逻辑量子比特的波动正确运转,解码器可能需求高达50PFLOP/s的经典算力,并处置惩罚约1Tbps的数据流。

  4. 及时前馈:解码器必需鄙人一个量子纠错周期(微秒量级)起头前,将计较出的改正指令发还量子节制器来履行物理改正操作。

  而以后险些一切的量子计较体系架构都无奈同时餍足上述要求。详细来讲,量子节制器与经典GPU超算之间是“疏松通信”的,这类通信依赖于传统的HTTP收集等,这就招致了两个问题:

  1. 高提早:传统收集的提早正在毫秒量级,而量子纠错环路要求的“反映时间”必需正在微秒量级。太高的提早会招致改正操作滞后于不对产生的速率,使患上逻辑量子比特的正确率降落,终极招致计较掉效。

  2. 低吞吐:传统收集无奈承载量子纠错要求的高达Tbps的持续数据流。解码器处置惩罚速率一旦跟没有上量子处置惩罚器的数据发生速率,就会招致数据积压,量子纠错计较机则将被迫停机。

NVQLink 怎样破局?

  NVQLinK的焦点逻辑正在于,它再也不将GPU视作内部的“后处置惩罚器”,而是将其视为量子处置惩罚器运转必不成少的、及时的内禀组件,从而从头界说了量子计较机的界限。详细包含:

  1. “精密耦合”的硬件体系:此中包含能间接履行量子节制以及读出的量子体系节制器、一个公用于及时优化量子处置惩罚器事情负载的GPU主机,和基于商用以太网的超低提早、高带宽通讯。

  2. 及时挪用:NVQLink扩大了NVIDIA的编程模子,此机制许可量子程序正在履行中间接挪用GPU或CPU上的经典计较使命,完成了量子—经典无缝协作。

  3. 异构内存与运转时:撑持跨设备内存经管,确保数据正在量子节制器与GPU间疾速流淌。

英伟达推出NVQLinK架构,GPU将加速量子计算落地

NVQLinK处置惩罚架构首要机能

  基于以上设计,团队搭建了一个观点验证平台,完成了高达400Gpbs的GPU-QPU数据吞吐量和仅3.96微秒的最年夜来回提早,这些机能已靠近维持100个逻辑量子比特正确运转的要求。这一成果显示,应用成熟的商用收集技能彻底可能餍足量子纠错严苛的及时性要求,为架构的工程可完成性以及可扩大性供给了无力证据。

  NVQLinK架构不只是一项技能前进,更可能对寰球量子计较的研产生态发生重要影响。它打破了经典计较与量子节制之间的边界,确立了“经典算力必需深度集成到量籽实时节制环路中”的设计思惟,这可能成为将来年夜范围量子计较机事实上的体系架构尺度。

  同时,依附CUDA生态的壮大根底以及商用硬件的易患性,NVIDIA有才能将寰球的GPU创造商、使用开发者吸引到其技能线路中,从而主导下一代量子计较平台的开发。

英伟达推出NVQLinK架构,GPU将加速量子计算落地

@ NVIDIA

  NVQLinK架构的提出,标记着量子计较研究正从“试验室物理演示”转向“高机能计较体系工程”。它清楚地界说了完成容错量子计较所需的经典算力脚色,并供给了一套高机能、可扩大的解决方案,加快了量子计较的降地使用。