epoch 轮数的影响

使用roberta 训练,一个训练2轮,然后在2轮的基础上再训练6轮,也就是一共8轮
然后在8404820个数据上去预测结果,其中label 不同的有613706个,在label为1的基础上score 大于0.8的,也就是 两次score 差了至少0.3以上的,有71404,接近1%,有趣的数字。

其实根据f1_score,两次相差不过3%左右,但是就细节层面, 标签的变动差别更大,而且就预测效果而已,目测确实epoch8的更符合人的直觉