Wenqian Blog

从现在开始就不算晚

推荐系统中的多任务学习算法(一)

ESMM, MMoE和SNR

ESMM ESMM[1]在多任务学习中比较特殊,因为其优化的两个目标 —— CTR和CVR,是有着严格的先后顺序的(转化行为必然发生在点击之后)。也正因如此,ESMM的通用性不强,但由于其瞄准的两个目标在推荐系统中是最重要的,因此这个算法的影响还是很大的。 ESMM主要想解决的两个问题分别是样本选择偏差(SSB,sample selection bias)以及数据稀疏(DS,data sp...

延迟反馈论文解读(一)

阿里巴巴:ES-DFM

什么是延迟反馈问题 延迟反馈问题是指在转化预估场景下,由于转化行为相比点击行为存在一定滞后而造成的标签错误问题。以电商场景为例,用户在点击某个商品的商详页后往往需要一段时间来做出购买决定,可能是几分钟、几小时甚至是几天。在用户最终下单之前,没有人能知道这次点击会不会产生转化。 不过好在大部分人是不会花这么长时间考虑的。事实上,90%以上的转化都在点击后的一天内完成。如果把时间拉长到14天或...

推荐系统中的embedding应该怎么做?

看看kdd21中的新思路

为什么要有embedding? 需要embedding主要是因为目前推荐系统中的ctr或cvr预估模型开始越来越多地使用深度学习模型,考虑到神经网络并不是很善于直接处理离散数据,我们需要把它先映射到一个连续空间再喂给神经网络。另外,由于离散特征往往都很稀疏,embedding往往也起到了降维的作用,尤其是对于那些取值上百万千万的id特征。 当前的常见做法 目前对于id类特征进行embedd...

广告领域常用分析指标

常用分析指标 业务指标 1 - GMV(Gross Merchandise Volume) 网站成交金额。在广告领域,我们一般更关心广告GMV,即广告所带来的GMV。各大电商广告平台一般将广告GMV作为最主要的优化目标。 2 - ROI 投资回报率,或者叫投入产出比。计算公式为:广告带来的销售收入 / 投放广告开销 * 100%。ROI是一个对于广告主来说非常重要的指标,广告平台一般在...

TensorFlow学习之路(一)

从一些基本概念开始

写在前面 本文的目的在于梳理个人学习过程中遇到的一些问题以及收获,并不是一个完全适合新手的系统性教程。网上相关的教学课程、视频以及教程很多,有兴趣的同学可以自行搜寻。本系列中采用的tf版本为1.15,python版本为3.6,如果不做特殊说明,TensorFlow都代指tf1。不使用tf2的原因是公司目前的代码还没迁到tf2上,因此先从tf1学起。 TensorFlow中的一些基本概念 ...

耶鲁博弈论公开课学习笔记(一)

从一个游戏开始

写在开头:这个系列主要记录一下个人学习博弈论时接触到的一些知识点,和一些有意思的game与现象,整体上并不保证连贯性。 五个入门结论:从与同桌的第一次博弈开始 假设你和同桌的成绩是由下面这个游戏的结果来决定的: 假设每个人都有两种选择: $\alpha$ 和 $\beta$ ,且当你们都选择 $\alpha$ 时可以一起拿到成绩B-;当你选择 $\alpha$ 并且你的同桌...

Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting读书笔记(六)

欺诈检测

广告欺诈类型 首先给广告欺诈下个定义(这里采用谷歌的说法): 无法反应真实用户兴趣的无效流量(包括曝光、点击和转化)。 广告欺诈的类型大概可以分为三种(依据流量类型): 曝光欺诈。欺诈者会生成假的竞价请求(以发布者的角度,即假的曝光机会),并在ADX内售卖它们以获取收益。 点击欺诈。欺诈者在加载广告后伪造点击行为。 转化欺诈。欺诈者在加载广告后伪造某种转化行为。 ...

Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting读书笔记(五)

归因模型

一个用户的最终转化(conversion)通常是多个广告事件一起贡献的结果,这些事件我们称作触点(touchpoints)。正如下图所示,转化归因其实就是一个分数分配问题,看看各个通道对于最终转换的驱动是多少。 获得一个“正确的”归因模型的很重要的,因为我们需要它来帮助我们在不同的通道或活动中重新分配预算。不过这个问题从理论和实践角度都是很难解决的,因为不存在“ground-truth...

Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting读书笔记(四)

动态价格

这一章主要是聚焦与RTB系统中的发布者。对于发布者来说,如何提升他们的收入是最关键的。我们先从起拍价说起。 起拍价优化 起拍价反映了发布者对于曝光的价值评估,如果出价低于起拍价,那么就会直接被舍弃。下图就展示了发布者方的决策逻辑: 我们可以很容易地得到发布者的回报(payoff)方程: 其中假设最终的出价是 $b_{1}(t),b_{2}(t),…,b_{K}(t)$ ,并且是...

Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting读书笔记(三)

竞价策略

竞价策略就是在给定一个广告展示机会时进行定价的逻辑。其方法分为两类,一类是以博弈论的视角去看,而另一类是以统计学的角度去看。这里将聚集在后一种方式,因为在实际情况下广告主和发布者很难说一定是有策略以及理性的,而这其实是博弈论视角的前提假设。如果以统计学角度来看,则一个竞价策略可以被抽象为一个以给定竞价请求为输入并以竞价价格为输出的映射方程: 竞价的问题:RTB vs. 竞价排名(spo...