【动手学】36 数据增广QA

问题1:理论上,是不是如果原始样本如果足够多,就用不着做增广?
答:一种理想情况是,训练样本比较多覆盖到了测试样本,这样是OK的。但现实往往不是,举个栗子,智能音响,原始样本对实际的覆盖往往是不够的。
问题2:老师, num worker的值是不是根据机器GPU性能而设定?
答:一般是开一个Epoch,多尝试直到性能提升不明显甚至下降就可以不增加num_worker。一般4就不错了
题3:老师,金融风控领域经常碰到的数据都是极度偏斜数据(欺诈样本/正样本比例只占1%),是否可以针对正样本试试类似今天讲的数据增强(之前使用重采样,效果一般般)?
答:通常需要重采样,增广
问题4:老师,测试一般做什么样的增广?测试增广在比赛中能提高精度如何理解?
答:测试一般不做增广。在比赛中,将一个样本,多resize或者randomcrop等操作去预测做平均。但在实际应用中做的不多,因为对机器要求变高。
问题5:老师,课件里提到的对比试验固定了所有随机种子吗?做完增广之后,训练精度下降,是不是意味着还可以继续训练,减少gap?
答:这里没有设

【动手学】36 数据增广QA最先出现在Python成神之路

版权声明:
作者:cc
链接:https://www.techfm.club/p/10148.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>