PyTorch 1.11 发布，带来 TorchData 和 functorch 两个新库

倾城 • 2022-03-16 00:27 • 技术文章

PyTorch 1.11 于 2022 年 3 月 10 日发布。最新的迭代包括来自 434 位贡献者的 3,300 多个新提交。PyTorch 还发布了两个新库 TorchData 和 functorch 的 beta 版本。

现在，您可以在Python API中干净地复制 Tensor 对象上的所有属性，而不仅仅是简单的 Tensor 属性。在 torch.linspace 和 torch.logspace 中，Steps 参数不再是可选的。在 PyTorch 1.10.2 中该参数默认为 100。现在，它不再是一种选择。PyTorch 还删除了错误公开的 torch.hub.import_module 函数。不推荐在具有不同维数的张量上调用 xT。现在，它只接受 0 或 2 维的张量。

C++前端标头现在减少为仅包含使用的 aten 运算符的子集。现在，如果用户包含来自 C++ 前端的标头，则可能不会传递包含 aten 运算符。但是，用户可以直接在他们的文件中添加#include <ATen/ATen.h> 以保持包含每个aten 运算符的旧行为。PyTorch 1.11 还删除了 c10::List 和 c10::Dict 移动构造函数的自定义实现。语义已从“make the moved-from List/Dict empty”变为“keep the moved-from List/Dict unchanged”。

对于CUDA，THCeilDiv 函数和相应的 THC/THCDeviceUtils.cuh 头文件、THCudaCheck 和 THCudaMalloc()、THCudaFree()、THCThrustAllocator.cuh 已被删除。

新特性

对于 Python API，PyTorch 1.11 添加了 set_deterministic_debug_mode 和 get_deterministic_debug_mode，n 维 Hermitian FFT：torch.fft.ifftn 和 torch.fft.hfftn，Wishart 分布到 torch.distributions。PyTorch 为 torch 和 torch.linalg 模块添加了对 Python Array API 标准的初步支持。它实现了 Python Array API 定义的 90% 以上的运算符，包括用于改进 DLPack 支持的 torch.from_dlpack 操作。他们还将 torch.testing 从原型转移到了测试版。

对于Autograd，PyTorch 1.11 有一个新的 torch.utils.checkpoint 实现，它不使用可重入 autograd。转发模式 AD 现在支持大多数操作，并包括 ctx.save_for_forward 函数到 autograd.Function。autograd.forward_ad.unpack_dual 现在将返回一个命名元组而不是普通元组。

线性代数运算支持包括对 torch.linalg.{eig, inverse, houseer_product, qr} 和 torch.*_solve 的正向 AD 支持。他们还为 torch.linalg.lstsq 添加了前向和后向 AD 支持，并为 linalg.pinv 添加了更广泛的输入。

对于ONNX，Pytorch 1.11 支持 opset 版本 15，将 nn.Module 调用导出为 ONNX 本地函数，导出 tanhshrink、hardshrink、softshrink、__xor__、isfinite log10 和对角线等新操作。它还支持使用 Apex O2 导出。

对于 Infra (Releng)，Pytorch 1.11 增加了对 ROCm 4.3.1、ROCm 4.5.2、CUDA 11.5、CUDA 启用 Bazel 构建、Python 3.10 的支持。

Pytorch 1.11 现在引入了 FlexiBLAS 构建支持、用于 cpp 扩展构建的 IS_LINUX 和 IS_MACOS 全局变量、用于 iOS CMake 构建的 ARC 以及对 IBM z14/15 SIMD 的支持。

新的更新还包括一个实验标志，允许用户指定首选的线性代数库。添加了 linalg.matrix_exp、linalg.cross 和 linalg.diagonal（torch.diagonal 的别名）等操作。

对于 CUDA，新的更新引入了 Jiterator，使用户能够在运行时编译很少使用的 CUDA 内核。cuSPARSE 描述符和更新的 CSR addmm、addmv_out、nvidia-smi 内存和作为本机 Python API 的利用率也已添加。

对于 Vulkan，Pytorch 1.11 增加了对几个 Torch 运算符的支持，例如 torch.cat、torch.nn “.ConvTranspose2d 、torch.permute 、张量索引（at::slice）和torch.clone。新的 Pytorch 迭代还包括基于跟踪的选择性构建功能，通过包含模型使用的运算符来减少移动模型的二进制大小。

点击这里阅读更多。

TorchData

Pytorch 还发布了TorchData，这是一个通用模块化数据加载原语库，用于轻松构建灵活且高性能的数据管道。

该产品通过称为“DataPipes”的 Iterable 样式和 Map 样式的构建块实现了可组合的数据加载，这些构建块与 PyTorch 的DataLoader开箱即用。

用户可以连接多个DataPipes，形成一个数据管道，执行所有数据转换。

TorchData 已经为文件打开、文本解析、样本转换、缓存、混洗和批处理等核心功能实现了 50 多个 DataPipes。想要连接到云提供商（例如 Google Drive 或 AWS S3）的用户可以使用 fsspec 和 iopath DataPipes 来实现。每个 IterDataPipe 和 MapDataPipe 在文档中都有详细的解释和使用示例。

在此版本中，一些 PyTorch 域库已将其数据集迁移到 DataPipes。TorchText 的流行数据集是使用 DataPipes 实现的，其 SST-2 二进制文本分类教程的一部分展示了如何使用 DataPipes 为模型预处理数据。

functorch

Functorch受到Google JAX的启发，旨在提供可组合的 vmap（矢量化）和 autodiff 转换，这些转换可以很好地与 PyTorch 模块和 PyTorch autograd 配合使用。

该库可以帮助用户计算每个样本的梯度，在单台机器上运行模型集合，在 MAML 的内循环中将任务批处理在一起，以及计算 Jacobians 和 Hessians 以及批处理。

The post PyTorch 1.11 发布，带来 TorchData 和 functorch 两个新库 first appeared on Linux迷.

版权声明：
作者：倾城
链接：https://www.techfm.club/p/24742.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

苹果终于发布 iOS 15.4，支持戴口罩面容 ID 解锁

< <上一篇

养小白脸，玩潜规则，这片内涵了众多好莱坞巨星的故事！

下一篇>>

搜索内容

PyTorch 1.11 发布，带来 TorchData 和 functorch 两个新库

新特性

TorchData

functorch

取消回复

共有 0 条评论

Ads