日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
PyTorch1.8發(fā)布,支持AMDGPU和Python函數(shù)轉(zhuǎn)換

近日,PyTorch 團隊發(fā)布了 PyTorch 1.8 版本。該版本整合了自去年 10 月 1.7 版本發(fā)布以來的 3000 多次 commit,提供了編譯、代碼優(yōu)化、科學(xué)計算前端 API 方面的主要更新和新特性。值得一提的是,該版本新增了對 AMD ROCm 的支持。

目前創(chuàng)新互聯(lián)已為上千多家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁空間、網(wǎng)站托管、服務(wù)器租用、企業(yè)網(wǎng)站設(shè)計、同德網(wǎng)站維護等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。

此外,PyTorch 1.8 版本還為大規(guī)模訓(xùn)練 pipeline 和模型并行化、梯度壓縮提供了特性改進。該版本的主要亮點如下:

  • 支持 Python 函數(shù)轉(zhuǎn)換;
  • 添加或穩(wěn)定化 API,以支持 FFT (torch.fft)、線性代數(shù)函數(shù) (torch.linalg);
  • 添加對復(fù)雜張量 autograd 的支持;
  • 多項更新用于提升 Hessian 與 Jacobian 矩陣計算的性能;
  • 改進分布式訓(xùn)練,包括提升 NCCL 可靠性、支持 pipeline 并行化、RPC profiling,以及通過添加梯度壓縮來支持通信鉤子(hook)。

(注:從 PyTorch 1.6 版本開始,PyTorch 特性分為 Stable(穩(wěn)定版)、Beta(測試版)和 Prototype(原型版)。

此外,PyTorch 團隊還對多個 PyTorch 庫進行了主要更新,包括 TorchCSPRNG、TorchVision、TorchText 和 TorchAudio。

新增和更新 API

(1) 通過 torch.fft 支持 NumPy 兼容的 FFT 操作

PyTorch 1.7 版本提出了這一特性的 Beta 版,而在 1.8 版本中該特性更新為穩(wěn)定版。FFT 支持旨在完成 PyTorch 支持科學(xué)計算的目的。torch.fft 模塊和 NumPy 的 np.fft 模塊實現(xiàn)了同樣的功能,并且支持硬件加速和 autograd。

(2) 通過 torch.linalg 支持 NumPy 式的線性代數(shù)函數(shù)

torch.linalg 模塊類似于 NumPy 中的 np.linalg 模塊,支持 NumPy 式的線性代數(shù)操作,包括 Cholesky 分解、行列式、特征值等。

使用 torch.fx 進行 Python 代碼轉(zhuǎn)換

這一 Beta 特性支持 Python 代碼轉(zhuǎn)換,開發(fā)者可以利用它做 Conv/BN 融合、圖模式量化、實現(xiàn) vmap 等。鑒于 torch.fx 提供 PyTorch 代碼的圖表示,開發(fā)者可以用 Python 寫任意變換或分析。

分布式訓(xùn)練

(1) pipeline 并行化

這一新增的 Beta 特性提供了一個易用的 PyTorch API,可將 pipeline 并行化作為訓(xùn)練 loop 的一部分。

(2) DDP 通信鉤子

DDP 通信鉤子是一個通用接口,用于控制 workers 間的梯度通信。

此外,PyTorch 1.8 還增加了一些 prototype 特性:

  • ZeroRedundancyOptimizer:有助于減少每個線程的內(nèi)存占用;
  • Process Group NCCL Send/Recv:該特性允許用戶在 Python 層(而非 C++ 層)實現(xiàn)集合操作;
  • CUDA-support in RPC using TensorPipe:該特性為使用 PyTorch RPC 和多 GPU 機器的用戶帶來速度提升;
  • Remote Module:該特性允許用戶像操作本地模塊那樣操作遠(yuǎn)程 worker 上的模塊。

支持 PyTorch Mobile

此次版本更新發(fā)布了一組新的移動端教程,包括在 iOS 端和安卓端實現(xiàn)圖像分割 DeepLabV3 模型。PyTorch 還發(fā)布了新的 demo app,包括圖像分割、目標(biāo)檢測、神經(jīng)機器翻譯、問答和視覺 transformer。

此外,這次發(fā)布還包括 PyTorch Mobile Lite Interpreter,該解釋器可降低運行時二進制文件大小。

性能優(yōu)化

為了幫助用戶更好地監(jiān)控性能變化,PyTorch 1.8 版本支持 benchmark utils,并開放了新的自動量化 API——FX Graph Mode Quantization。

硬件支持

在硬件支持方面,PyTorch 1.8 版本新增了兩個 Beta 特性:

  • 擴展 PyTorch Dispatcher,使之適應(yīng)新型 C++ 后端;支持 AMD ROCm。
  • 需要注意的是,PyTorch 1.8 僅在 Linux 系統(tǒng)中支持 AMD ROCm。

本文名稱:PyTorch1.8發(fā)布,支持AMDGPU和Python函數(shù)轉(zhuǎn)換
文章轉(zhuǎn)載:http://m.5511xx.com/article/cdciepe.html