Centos7.6 腾讯云TI平台AI训练加速框架

TI-ONE是腾讯云TI平台一站式机器学习平台,基于腾讯云的基础设施,TI-ONE对业界常用的深度学习框架做了全栈式的深度优化,显著提升了深度学习训练的性能。本镜像提供预装了TI-Horovod的TensorFlow/PyTorch/TI-TensorFlow的conda环境。

服务商信息:腾讯云计算(北京)有限责任公司
支付方式:镜像

商品参数

ImageId
img-jd96w7yr
操作系统
CentOS 7.6 64位
集成软件
Horovod,TensorFlow,PyTorch,Centos7.6
版本
v1.0.0
依赖云服务
云服务器
支持地域
ap-bangkokap-beijingap-chengduap-chongqingap-guangzhouap-hongkongap-mumbaiap-nanjingap-seoulap-shanghaiap-shanghai-fsiap-shenzhen-fsiap-singaporeap-tokyoeu-frankfurteu-moscowna-ashburnna-siliconvalleyna-toronto

商品介绍

面向对象:

    需要使用多种深度学习框架和需要高性能分布式训练场景的研究人员和开发人员。


功能特性:

TI-Horovod 分布式训练通信优化库包含以下优化特性:

  1. 在保留原生 Horovod 的易用性上,增加了更好的性能通信方式,HorovodAllgather 支持 ncclAllgather 通信

  1. 实现了 2D-allreduce 通信,相对于全局 allreduce,能够更加充分的利用云上带宽

  2. 实现了 top-k 梯度压缩通信,进一步减小通信量,支持精度补偿,降低对精度影响

  3. 针对 tf 框架,增加了多种梯度融合方式,比 Horovod 原生的梯度融合机制更加高效

  4. 支持 fp16 梯度通信和混合精度训练

  5. 支持梯度累积

TI-TensorFlow 深度学习框架库包含以下优化特性:

  1. 针对高维动态稀疏特征进行了相关优化。例如动态 embedding,稀疏优化器 SparseAdam

  2. 提供了模型编译优化相关的特性

  3. 支持自适应混合精度训练

  4. 支持更多的数据 IO 操作

  5. 大规模收敛算法支持 LAMB


应用场景:

    使用深度学习框架在各种场景下的研究,开发工作。


使用说明:

    目前该镜像支持腾讯云 GN7/GN10/GN10Xp 全系列机型,镜像安装到云服务器后,通过 conda 命令激活相应的深度学习环境,环境名称可以通过 conda env list 查看。

售后服务

为保障您的权益,请勿线下交易!90%的欺诈、纠纷、资金盗窃均由线下交易导致。腾讯云市场为您提供以下服务保障:

优质服务商家

严格准入 提供海量上云服务

7*8小时在线客服

全程在线咨询 助您安心购物

专业测试保证品质

安全监测 保障商品质量

售后无忧

不满意可退款 保障售后无忧