Future Tech

[转贴] 对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

Tan KW
Publish date: Fri, 08 Jul 2022, 02:27 PM
Tan KW
0 463,609
Future Tech
对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西7月8日报道,近日,NVIDIA网络技术专家崔岩对NVIDIA今年5月新发布的网络产品NVIDIA DOCA 1.3进行了详细解读,并透露了NVIDIA授权合作伙伴DPU&DOCA卓越中心的最新消息。

“它(DOCA)的定位就是DPU的灵魂,相当于用软件解锁DPU相关的功能。”崔岩说,NVIDIA围绕DOCA提供社区资源、NVIDIA专家交流的平台、开发文档、相应的视频及培训课程等,来支持开发者在DOCA上做开发。

NVIDIA在发展DPU的同时,也在积极发展DOCA生态,这和其此前发展GPU的同时发展CUDA异曲同工。在他看来,DPU+DOCA软硬皆施,才是DPU最好的市场形态。

谈及DPU大规模应用层面的主要门槛,崔岩分享了三个角度:

一是通过数据中心加速计算模型带来的大规模应用,DPU为CPU的业务应用负载和GPU的人工智能、机器学习工作负载提供数据传输及数据处理,性能成本比、基础架构通用性与软硬件可迭代成为关注要素;

二是针对客户自身的数据中心基础设施应用场景定制的设计,通过大规模部署DPU来满足特定应用场景的需求及解决特定场景的问题,但对客户的开发能力与资源投入带来挑战;

三是通过生态体系带来的大规模应用,从客户多样化应用需求出发,基于开放、标准化平台来提供创新应用的通用集成解决方案,买来即可集成、即可部署,但需要构建优质的生态体系。

一、DOCA:为DPU量身定做的软件框架

NVIDIA BlueField DPU是一款片上数据中心基础设施,可用于卸载、加速、隔离,在主机CPU上运行的各种软件定义的基础设施服务,能够突破性能、可扩展性和安全方面的一些瓶颈。

不论是各种微服务、容器、带来的各种I/O还是数据安全隔离的需求,都对DPU芯片应具有的硬件卸载能力提出了需求,同时还要求DPU的软件是灵活自由的,可以适应不同的应用场景。

为了充分发挥DPU的硬件能力,简单、高效的NVIDIA DOCA编程框架应运而生。

DOCA是Data-Center-Infrastructrue-On-A-Chip-Architectrue的缩写,即“线上数据中心基础设施体系结构”,它为BlueField DPU量身定做,支持开发者在BlueField上进行简单灵活的软件开发。

崔岩告诉我们,DOCA依托于面向未来的API驱动的思维模式而构建,能让BlueField硬件加速变得更加易用,从而优化性能、效率和安全性。

DOCA使开发者可以利用行业标准API,在BlueField DPU上做快速创建应用程序和服务,类似于NVIDIA GPU上的CUDA,能解锁数据中心中创新功能,并且能更好地向下平滑兼容持续演进的新一代BlueField DPU,包括今年下半年上市的BlueField-3和未来的BlueField-4 DPU。

最早的DOCA 1.0在2020年NVIDIA GTC大会上与BlueField-2 DPU一同发布。后续DOCA 1.1版本更加完善了整个DOCA软件栈,提供了DOCA SDK运行时以及相关的服务;DOCA 1.2进一步加强在零信任、分布式安全解决方案上的支持。

今年5月最新发布的DOCA 1.3,提供了121个新的API开发接口,还有一些全新和增强的功能。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

DOCA软件开发套件主要是为了来创建和构建应用程序所需的所有组件。到DOCA 1.3版本,它已经是比较完善的软件栈,开发者可以轻松地基于这个软件栈在DPU或x86的开发容器上搭建开发环境,来快速地开发应有程序或服务。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

DOCA框架即插即用,能够给开发者提供一个一致的开发体验,允许统一访问BlueField DPU上各种硬件资源,从而简化网络存储安全和基础设施管理服务相关的开发,开发者也无需担心开发环境和构建的部署复杂程度。

同时,DOCA还为开发者提供了基于底层API抽象封装的高级API库,能大幅节约开发时间,使应用更快投入市场。DOCA还提供了相应的容器化的DOCA服务,可以在BlueField DPU上直接进行部署,来提供相应的应用和解决方案。客户不需要在DOCA服务上再做进一步的开发。

二、DOCA 1.3:三项重点优化功能详解

崔岩重点介绍了DOCA 1.3优化的三项功能。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

一是正则表达式库,也被称作Regular Express(RegEx),是许多脚本语言使用标准模式匹配的工具,有了它可以创建与文本模式匹配的一些过滤器,而不仅是单个单词或短语的匹配。

正则表达式专为高吞吐量、低延时、深度包检测的应用程序而设计,为应用程序提供正则表达式模式匹配字符串来实现相应功能。它还可以实现安全遥测功能,相关DOCA参考应用和库包括应用识别、入侵防御系统、URL过滤器、文件扫描、深度数据包检测库以及App Shield内存扫描等。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

二是OVN数据路径加密功能。DOCA 1.2版本实现了把主机内的IPsec相应功能卸载到DPU上,可以在vSwitch上做控制平面和IPsec加密和解密。新版本把该功能扩展到整个OVN范畴,不同主机之间都可以用这个IPsec方式来创建不同的通道,进行数据加密。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

三是DOCA基于主机的网络(HBN)。这个功能是在NVIDIA BlueField DPU上基于主机的网络可以管理和监控同一节点上虚拟机和容器之间的流量,也就是说在一个服务器主机上可能创建了多个虚拟机或多个容器,它们之间会有一些数据流量,不仅是二层数据流量,三层有一些路由上的功能,NVIDIA通过HBN也把它实现在BlueField的DPU上。

它还可以做加密和解密,进行节点流量的监控,同时也会把一些原来依赖TOR交换机的功能在DPU上得到实现,这种方式会改变客户思考整个数据中心网络构建的方式。

随着BlueField DPU智能化程度的提高,在整个网络把功能都会集中在BlueField DPU上做相应的实现,这样就会降低对TOR交换机的相关要求,BlueField DPU还能做一些网络配置,去提供一个隔离的环境,实现更好的安全性部署。

归根到底,HBN是一个DOCA服务,不需要客户再在上面做过多的开发,直接就能通过容器的方式,在BlueField DPU上做部署,通过作为BGP的路由器来使用,可以做主机内的虚拟机或容器之间的三层数据转发路由,也可以对主机外相应的其他节点上的数据进行三层转发,使二层网络和三层网络都得以扩展,也会扩展到云计算里多租户的环境之下。

在整个DPU上实现了这些动态的路由协议,就能大大加速整个网络数据流量处理性能,同时DPU还可以提供相应的安全保障。

三、DPU&DOCA卓越中心:面向中国开发者,免费并可远程访问

近日,NVIDIA还发布了NVIDIA授权合作伙伴DPU&DOCA卓越中心。

其工作内容包括为DOCA中国开发者提供在线实践的DOCA开发环境,与NVIDIA一道构建和拓展DPU和DOCA生态体系,推动DOCA中国开发者社区的发展,提供培训课程和专业讲师,组织DOCA中国开发者社区活动,支持DOCA开发者训练营和DPU黑客松竞赛等。

有两家合作伙伴为其第一期做卓越中心的试运行,分别是丽台(上海)信息科技有限公司、上海信弘智能科技有限公司。这两家公司分别会给整个中国的DOCA开发者提供一个免费的DOCA开发环境。

对话NVIDIA网络技术专家:为什么DOCA是DPU的灵魂?

这个开发环境有三个要点:

1、免费,可远程访问,近似于云服务方式来提供给开发者和科研人员,支持远程地登录到数据中心,来体验DOCA开发的环境,或者在上面跑一些已经做好的开发程序。

2、远程环境可提供完整的开发平台,支持开发者在上面做程序编译、运行和相应的测试。

3、主要支持中国的DOCA开发者,加速在应用方面的创新,来拓展开发者社区。卓越中心有相应的工程师和NVIDIA专家来支持开发者,DOCA中国开发者社区也会有相应的资源来帮助开发者解决技术问题。

现在开发环境第一期已经启用,每一个卓越中心的运营公司在其数据中心里都会提供两套开发环境。在中国,NVIDIA首先启用四套开发环境,供DOCA开发者免费使用。免费开发环境的使用方式是通过Internet远程来做登录。

开发者需要自备登录设备和相应的软硬件环境。卓越中心会给开发者提供完整的软硬件DOCA开发环境。

开发环境的开放时间是每周一到周四的9点到15点。开发者可向卓越中心提交申请,审核批准后可获得2-6小时的免费开发环境。开发者如需额外两个小时使用时间,则需再次发起申请。

申请免费开发环境,需要提前48小时发邮件预留时间段。在卓越中心上来运营免费的DOCA环境,要按照开发环境要求条款和条件来进行管理,由卓越中心来决定开发者是否能够获得申请的批复。

由于目前提供的环境有限,为了让更多开发者都能上线体验,每一位开发者最长半年时间之内总使用时间不超过10个小时。

资格方面,开发者需首先完成NVIDIA DOCA开发者早期访问注册(注册网址:https://developer.nvidia.cn/zh-cn/nvidia-doca-sdk-early-access),才会被提供免费开发环境。

结语:DOCA社区持续拓展,超半数注册开发者来自中国

总的来说,借助DOCA,开发者能够加快应用程序和服务的上市时间,并基于BlueField DPU服务场景发挥关键作用,释放DPU的潜力。

崔岩透露,DOCA中国开发者社区正持续拓展,中国的DOCA开发者在全球占一半以上。在构建DOCA应用程序及行业解决方案方面,裸金属云加速网络平台、高性能分布式存储、数字孪生基础设施、超级计算网络平台都有合作进展。由于项目都在进行中,现在无法发布相关细节。

在举办NVIDIA DPU中国黑客松、开通BBS官方论坛、DOCA文档库、建设DOCA微信群、与合作伙伴推动成立卓越中心后,他们还将为DOCA社区提供更多丰富的内容和支持。

目前,已有多家客户下载刚刚发布的DOCA 1.3软件包在测试环境里做试用。崔岩说,他们会持续关注客户反馈,来帮助客户在DOCA 1.3上实现其技术功能。

 

https://zhidx.com/p/337583.html

Discussions
Be the first to like this. Showing 0 of 0 comments

Post a Comment