自闭症病论坛

注册

 

发新话题 回复该主题

如何从数据挖掘比赛中脱颖而出快来get阿 [复制链接]

1#
北京中科医院 https://mip.yyk.99.com.cn/fengtai/68389/

雷锋网AI研习社按,本文为IJCAI-18阿里妈妈搜索广告算法大赛亚*解决方案。本文由作者发在其GitHub主页,雷锋网AI研习社获其授权转载。

一、队员介绍

队长:BRYAN

数据挖掘从业者,国内数据挖掘竞赛名将,天池数据科学家,IJCAI-17冠*获得者。曾多次在国内外著名赛事中取得名次。

队员:桑楡

数据挖掘从业者,国内数据挖掘竞赛名将,天池数据大师,IJCAI-17冠*获得者。曾多次在国内外著名赛事中取得名次。

队员:李困困

数据挖掘从业者,国内数据挖掘竞赛名将。曾取得CCF-蚂蚁金服-商场定位赛冠*等多项国内外著名赛事的名次。

二、赛题背景分析及理解

本赛题为搜索广告转化预估问题,一条样本包含广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1

query,user,ad,context,shop)。可以将问题抽象为二分类问题,重点对用户,商品,检索词,上下文,商店进行特征刻画,来训练模型。

三、核心思路

(1)数据分析

通过数据分析我们发现,训练数据的前7天转化率维持在1%左右,但是在6号转化率偏低,在预测当天7号的上午转化率超过4%,所以这是一个对特定促销日进行预测的问题。重点需要刻画用户,商品,店铺,检索词等关键信息在预测日前面7天的行为,预测日前一天的行为,预测日当天的行为。

另外7号的样本量远远超过前面每天的样本量均值,是我们重点需要

分享 转发
TOP
发新话题 回复该主题