Pytorch实验代码的小细节
序
本文转载于Pytorch实验代码的亿些小细节 - 知乎
你是否有过这样的经历:炼了一大堆的丹,但过了一周回来看结果,忘记了每个模型对应的配置;改了模型中的一个组件,跑起来一个新的训练,这时候测试旧模型却发现结果跟原来不一样了;把所有的训练测试代码写在一个文件里,加入各种if else,最后一个文件上千行,一个周末没看,回来改一个逻辑要找半天……其实这些情况除了深度学习相关的开发,在别的软件开发中也是很常见的,为了解决这些问题,软件行业的开发者形成了很多套路,比如设计模式,提高代码复用性,或者各种最佳实践,比如谷歌、阿里都有一套Java开发最佳实践,各种框架比如客户端的Android,后端的spring,也有各种最佳实践,让开发者的代码更加简洁,更专注于核心的业务实现。在炼丹领域,从2016年至今,各大训练框架互相竞争,互相学习,学术界基于这些框架产出了很多论文,质量越高的论文,往往代码写得也越有条理,最新的论文代码也渐渐形成了一些固定的范式。这几年看了许多论文的开源代码,基于别人的代码做过不少的改进,炼丹代码也渐渐形成了一些风格,今天就
共有 0 条评论