文章导读:2016年是人工智能的爆发年,而人工智能基于海量数据。对于电商来说,智钻投放中产生大量投放数据,其中创意数据对于钻展效果分析来说尤为重要。基于4个月几百个商家,合计12000张创意可以为我们对日常创意效果的判断提供历史支持。因此,利用深度学习来训练出能够自分创意的想法油然而生。
正文:
对于商家来说,日常智钻投放中有大量创意需要替换更改,但是创意往往改完就算了,它的数据也随之舍弃。但是冷静一想,究竟对于我们日常投放来说,怎样效果的创意才是一张值得肯定的创意呢?怎样的创意数据才能代表广泛的商家心声呢?因此,本次项目基于7月到11月所有投放过钻展的商家创意数据,涵盖超过50个类目12000张创意,构建具有广泛代表性的创意分类模型,并从模型中找到对我们日常投放有指导意义的信息。
一、智钻创意数据的量纲和维度
所谓的量纲指的是每张创意数据所观察的时间范围,本次实验全部创意观察的量纲统一为1个月。而初始候选观察维度较多:
数据的搜集通过协助商家推广的期间不断积累下来,3个月下来数据量在1W2左右。而我们实际当中,大家都认同真正好的创意相对来时较少,因此,我们通过长时间咨询智钻顾问人员,严格地把这些数据中真正比较好的创意挑选出来,其它列为一般的创意数据。整个实验就是围绕这些数据作为我们研究的样本。
二、基于逻辑回归的分类器
当样本初步整理好,尝试使用一般的逻辑回归来分类。一开始我想综合考虑所有智钻顾问对创意的分类的考虑,因此想模型设定为逻辑回归。模型去除了对时间量纲有依赖的维度。例如,消耗,因为不同商家可能会因为体量的大小而在本质上有差别;类似的维度还有展现和点击等。本次实验把这些维度全部去掉,保留没有依赖时间为量纲的点击率、点击单价和收藏率等维度。
本次逻辑回归的最多迭代100次,拿数据当中的85%作为训练,15%作为验证集来训练模型。得到如下结果:
真正率指的是所有被顾问认定为较好创意的数据,其中被模型预测为较好创意所占的百分比;真负率指的是所有被顾问认定为较差创意的数据,其中被模型预测为较差创意所占的百分比;准确率值得是所有数据当中,模型预测与源数据相符所占总数的百分比。可以轻易看出,真负率比较高,但真正率较低。所以本实验对于那些较好创意的预测准确性不够高。
逻辑回归中各维度的参数如下:
参数说明:维度当中的参数的正负说明该维度对模型预测为较好创意的贡献方向,例如:点击单价的参数为负数,说明点击单价越高,越不能对其预测较好创意,所以方向是负的;而点击率参数为正数,说明点击率越高,越能对其预测为较好创意,所以方向是正的。
从这个表中有如下结论:
综合所有数据,顾问对于一张创意是否为一张好的创意,最重要看的维度从高到底是点击率、收藏率、加购率和回报率。这三者可以起到决定性的作用;
点击单价、收藏成本和加购成本的决定作用在第二阶级,其决定性因素不如第一点提到的因素。
三、去除依赖时间的数据维度的SVM分类器
由于逻辑回归对于真正率来说不够高,因此想用SVM分类器(Suport Vector Mechine )。虽然其训练效率低,当时它对于低维密实的向量有较好的敏感性,所以尝试使用它来做为此训练。模型训练参数中伽马等于2,阈值为1e-4,训练结果如下:
与逻辑回归相比,真正率大幅升高,而且整体的准确率也得到提高,所以该模型作为一个候选模型。
四、基于Dense网络的分类器
当使用SVM分类器时,发现虽然整个模型的准确率很高,但是真正率、真负率和准确率三者还是有一定差异,这导致整个模型预测的结果不稳定,很容易在以后的使用当中,因为数据结构不同而导致预测准确性受到质疑。再者SVM的参数调整太过于麻烦,而且其预测速度太慢,因此想找更优的方法。
最后,我确定了使用Dense网络,它与一般的全连接网络区别在于它对于隔层网络数据是有复用的,与传统全连接网络只与邻接层有关大大不同。这一特点使得它有诸多优点:
(1)有效解决梯度消失问题;
(2)强化特征传播;
(3)支持特征重用;
(4)大幅度减少参数数量。
因此,对于少维度的输入,其复用特征有利于梯度的反馈。模型的当中的反馈函数使用”relu”,它比一般的“sigmod”更灵活,为了避免过拟合,每层网络训练完一次后都会有50%的几率抑制神经元,训练次数设定为100次,学习训练优化器使用自适应动态二阶学习函数:“RMSprop”.基于以上数据搭建Dense网络,而网络输入的是每个创意数据,输出是该创意是否为优质创意。
在训练网络的过程中,发现去除时间维度的数据有可能影响整个网络的训练。就是有相当一部分创意,它的收藏率、加购率和回报率等维度都为0,因为这种数据过多,导致网络对不好的创意判断出现了偏差,对非优质创意的预测能力有下降。因此在样本的处理上,对这些数据有了删减。
神经网络与前两种相对比,发现真正率、真负率和准确率三者非常接近,而且都比之前的高,并且通过多次训练都得到相似的结果。说明对于本次实验来说,使用神经网络的效果稳定性总是优于前两者,因此选择其作为最终的预测模型。
五、初步实践运用
既然已经有了模型,那我们以后只要输入某张创意的信息,模型立刻就可以输出它是较好创意还是一般的创意,而且该创意有多大的可能性是好创意,有多大可能性是一般创意。
例如,我们有一张创意,近30天数据如下:[2,7,1.8,0.08,0.01,0.02,86,80,0.6],这代表它是奶粉/辅食/营养品/零食类目,第七层级,点击单价是1.8,点击率8%,收藏率1%,加购率2%,收藏成本86元,加购成本80元,点击回报率是0.6。
从运行结果截图可以看出,输出结果为零,即预测为较一般的创意;而且它被预测为一般创意的概率达到95%,被预测为较好创意的概率只有5%,因此它只能被当做较一般的创意。
例如,我们有一份十二月的创意数据,然后我们逐个输入来预测,预测出来的结果我们就可以主动告诉智钻操作人员有哪些创意不太好,需要更改;哪些创意表现较好,继续仿照风格文案出创意,大大降低人工筛选分析的时间,把更多的时间投入到店铺本身的工作中。
六、总结:
当我们拥有大量数据时,我们应该做的是让它指导我们的工作;当我们懂得如何让历史指导我们工作的时候,就应该让它成为一种模型化的标准来自动执行。所以,通过大量数据构造创意分类器的模型,以后我们只需要定期训练模型,它就能自动地按照以前智钻顾问的想法分类创意。
一来可以降低人工成本,解放更多的生产力,让顾问有更多的时间去做店铺的事情,而不是重复分析;二来可以让模型成为一个统一的分析标准,避免因为人为的原因对店铺分析有双重标准。让创意得到更公平更广泛的判断。
本次实验也找到一些亮点,对于本次实验的数据来说,一张好的创意其实考虑较多的是点击率、收藏率、加购率和回报率等维度,这可以帮助我们以后的操作人员需要更加关注这些维度来分析创意。
通过本次项目,可以由创意数据作为一个出发点,让更多的电商数据训练为模型,使得推广更加智能,让电商真正沐浴在人工智能的阳光下。
作者:大麦电商,电商问题交流微信damai-e
原创稿件,转载请注明来源卖家资讯http://www.maijia.com/news/