北京中科医院 https://mip.yyk.99.com.cn/fengtai/68389/雷锋网AI研习社按,本文为IJCAI-18阿里妈妈搜索广告算法大赛亚*解决方案。本文由作者发在其GitHub主页,雷锋网AI研习社获其授权转载。
一、队员介绍
队长:BRYAN
数据挖掘从业者,国内数据挖掘竞赛名将,天池数据科学家,IJCAI-17冠*获得者。曾多次在国内外著名赛事中取得名次。
队员:桑楡
数据挖掘从业者,国内数据挖掘竞赛名将,天池数据大师,IJCAI-17冠*获得者。曾多次在国内外著名赛事中取得名次。
队员:李困困
数据挖掘从业者,国内数据挖掘竞赛名将。曾取得CCF-蚂蚁金服-商场定位赛冠*等多项国内外著名赛事的名次。
二、赛题背景分析及理解
本赛题为搜索广告转化预估问题,一条样本包含广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1
query,user,ad,context,shop)。可以将问题抽象为二分类问题,重点对用户,商品,检索词,上下文,商店进行特征刻画,来训练模型。
三、核心思路
(1)数据分析
通过数据分析我们发现,训练数据的前7天转化率维持在1%左右,但是在6号转化率偏低,在预测当天7号的上午转化率超过4%,所以这是一个对特定促销日进行预测的问题。重点需要刻画用户,商品,店铺,检索词等关键信息在预测日前面7天的行为,预测日前一天的行为,预测日当天的行为。
另外7号的样本量远远超过前面每天的样本量均值,是我们重点需要