常见的评估方式有AucLoss(=1-Auc),LogLoss,Mean Squareed Error。模型变化时,这些评估指标的变化方式可能不一样,因此在对模型做评估时最好把所有的评估方式都比较。除了上述评估指标外,还需要评价预估点击率和真实点击率的差异(AucLoss只能评估相对排名,LogLoss和MSE虽然能评估与真实点击率的差异,但是不够直观),差异可以针对每个广告,评估真实点击率和预测点击率的差异,或者把广告按真是点击率分组,评估不同组真实点击率和预测点击率之间的差异。AucLoss等评估指标的绝对值意义并不大,比如平均点击率0.5和平均点击率0.1的两组数据,平均点击率0.1的AucLoss要大大大于平均点击率为0.5的数据集。因此需要比较与baseline模型的相对大小。完备的系统最好有一个面板实时跟踪模型的AucLoss、LogLoss等指标的变化,这些指标对监控有很大的作用。