添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

年味愈浓,春节将近。阿里妈妈技术年刊如约而至~

2021 年 5 月,我们开始通过 「阿里妈妈技术」 微信公众号持续分享我们的技术实践与经验,覆盖广告算法实践、AI 平台及工程引擎、智能创意、风控、数据科学等多个方向。

值此辞旧迎新之际,我们整理了过去一年颇具代表性和创新性的工作沉淀,制作成这本 500 多页的电子书,涵盖 机制策略 召回匹配 模型优化 智能创意 算法工程/引擎/系统建设 等内容。这些工作有的已为业务创造实际收益,有的是一些常见问题的新解法,希望可以为相关领域的同学带来一些新的思路。

真诚期待明年此时,每位朋友都有新的收获,而我们也带着更多探索实践来与大家分 享交流 ~ 如果对本合集有想要探讨的问题,或有更好的建议,也欢迎通过 「阿里妈妈技术」 微信公众号与我们联系。如果觉得还不错,欢迎分享给身边的朋友~

最后,祝大家新春快乐 ~ 新的一年,愿不负追求与热爱,万事尽可期待!

▐ 如何获取?

关注 「阿里妈妈技术」 微信公众号,回复“ 2022年刊 ”,即可获取下载链接,可以免费在线阅读和下载。

温馨提示:

  • 本书共587页,文件约70M,支持在线阅读及下载;

  • 本书下载无需注册和登录账号,获取链接即可下载;

  • 电子书目录可实现标题跳转,点击感兴趣的标题即可跳转至文章页进行阅读

往期技术干货下载

「阿里妈妈技术」 微信公众号对话框回复关键词:【2021年刊】、【营销科学】,即可获取对应电子书下载链接。

▐ 关于我们

阿里妈妈是阿里巴巴集团的核心商业化部门,秉承着“让每一份经营都算数”的使命,阿里妈妈技术团队深耕 AI 在互联网广告领域的大规模应用,并通过技术创新驱动业务高速成长,让商业营销更简单高效。

也许你还想看

开放下载 | 阿里妈妈技术年货

开放下载 | 阿里妈妈营销科学系列

2022 阿里妈妈技术文章回顾

2021 阿里妈妈技术文章回顾

关注 「阿里妈妈技术」 了解更多 ~

喜欢要“分享”,好看要“点赞”哦ღ~

▐ 摘要CTR(Click-through rate)预估一直是推荐/广告领域重要技术之一。近年来,通过统一模型来服务多个场景的预估建模已被证明是一种有效的手段。当前多场景预估技术面临的挑战主要来自两方面:1)跨场景泛化能力:尤其对稀疏场景;2)计算复杂度:在线计算和存储资源有限情况下如何实现多场景模型构建。针对这两个挑战,本文提出AdaSparse,一种通过自适应学习稀疏网络的方法来实现多场景C... 1. 引言本文提出的方案已被WSDM 2023接收,论文:Boosting Advertising Space: Designing Ad Auctions for Augment Advertising,下载:https://dl.acm.org/doi/abs/10.1145/3539597.3570381信息流产品为了保障用户体验通常会严格限制信息流中的广告曝光占比。稀缺的广告展示坑位难以满... 导读: 传统拍卖机制不存在了!出价产品智能化成为行业发展趋势,自动出价(Auto-bidding)已成为互联网广告主营销的主流,经典效用最大化模型(Utility Maximizer)的假设已经不再能良好地刻画此类广告主,传统拍卖机制在Auto-bidding下的激励性质和最优性需要被重新思考。▐摘要数字广告是互联网平台的主要收入来源之一。近年来,很多广告主开始采用自动竞价(Auto-biddi... 其中,在营销层,革新了以往功能繁多操作麻烦的BP,给广告主带来一种新的对话式交互体验,广告主只需要通过简单的自然语言的描述,即可实现全部的营销流程,大大简化了广告主的操作和学习成本。,现实环境中的竞价环境是非常复杂且动态变化的,只控制预算无法满足更多样的出价计划的进一步优化。AlphaGo的惊艳表现,展现了强化学习的力量,而自动出价是一个非常典型的序列决策问题,在预算周期内,前面花的好不好会影响到后面的出价决策,而这正是强化学习的强项,因此第二阶段我们用了基于强化学习的Bidding。 导读:今天以ChatGPT为代表的生成式大模型让科技行业重新兴奋起来,也为广告营销注入了新的想象力。生成式大模型几乎一定会带来用户与互联网产品交互模式的改变,进而颠覆广告营销模式。广告技术人,你们准备好了吗?阿里妈妈技术已提前在该方向布局,并推出了新的广告营销智能技术体系,今天将揭露出其神秘面纱的一角,窥探背后的思考和实践。▐ 摘要出价产品智能化成为行业趋势,极简产品背后则是强大的自动出价的支撑,... 本文尝试将拍卖机制的几个经典问题做脉络性梳理,重点阐述概念之间的演进关系。希望可以勾勒清楚技术全貌,有助于大家系统性地认识计算广告领域的拍卖机制设计。丨目录: 1.初识广告拍卖机制和相关博弈论基础知识 2.社会福利最大化的有效机制3.平台营收最大化的最优机制4.经典广告拍卖基本框架和预告进阶篇5.参考文献搜索、推荐和广告在过去几年互联网蓬勃发展的浪潮中起到了核心助推引擎的作用,三者技... 丨本文作者:茂道、羲洋、君之、天柏1. 业务背景算法同学在日常工作中经常要面临一些耗时较多的临时工单,这类工单的问题类型五花八门,背后对应的原因也各不相同,例如广告主操作类问题、大盘流量波动问题、海选问题、粗排问题等。这类Case每次都需要耗费较长时间单独解决,没有办法沉淀相应的工具和知识体系,随之带来的是算法团队开发诊断代码工作量大、开发周期长、不宜维护等问题。为了有效地持续提升工单处理效率,算... 一、背景大规模信息检索一直是搜推广领域的核心问题之一,而基于任意复杂模型的检索方案无疑是业界重要的迭代方向之一。近年来,阿里妈妈展示广告Match团队与预测引擎团队专注于从算法与工程角度推动工业级大规模检索技术的研发,我们在基于任意复杂模型的检索方向上积累了一定经验并取得了不错的业务效果,现整理发布NANN(Neural Approximate Nearest Neighbor,以下简称NANN)... 1. 背景精排预估打分是在线广告系统里非常重要的环节,其中打分准确性会极大地影响客户效果,也会影响用户体验和平台收益。精排预估打分为前链路打分和后链路打分,以 CPC(Cost Per Click)计费模式为例,前链路打分指点击率(Click-Through Rate,CTR),后链路打分指点击后客户获得的效果,这里的效果可以有很多种,常见的有成交量、收藏量等。前链路打分主要用于广告排序:特指预估... 一、概览随着全球主要市场陆续出台个人信息保护政策,互联网生态中的数据安全和用户隐私保护问题变得越发重要且日趋严格。如何在营销场景下安全合规的使用数据,维护在线广告商业模型的核心运作,成为当下广告生态中各企业亟需解决的问题。阿里妈妈一直注重对于隐私数据的安全合规使用,最大限度地保护用户隐私和数据安全。本篇分享阿里妈妈在保护数据安全和用户隐私方向的Data Clean Room实践产品营销隐私计算平台... 丨本文作者:木行、相遇、冰瞳、堇华、青礞、子瑞、叶卿等动态算力系列文章:???? 动态算力起源-阿里妈妈展示广告引擎的“柔性”变形之路 [2020] https://www.infoq.cn/article/wEaIlWl7076Id2bQptAq????阿里妈妈展示广告引擎新探索:迈向全局最优算力分配[2021]????阿里妈妈展示广告引擎动态算力再探索:面向业务收益的机器自适应调配[2022]在绿色计算... 1. 背景为提升易用性和降低使用成本,大数据技术逐步向Serverless、一体化和智能化方向发展。为了更好的提升客户投放效率和效果,阿里妈妈自研了超融合多模智能引擎Dolphin(以下简称“Dolphin”)。其最初定位解决通用OLAP(OLAP全称Online Analytical Processing)在圈人场景计算性能问题,历经5年的技术发展与沉淀,目前已形成覆盖OLAP、AI、Strea... 问题定义召回操作通常作为搜索/推荐/广告的第一个阶段,主要目的是从巨大的候选集中选出相对合适的条目,交由后链路的排序等流程进行进一步的择优。因此,召回问题本质上就是一个大规模的最值的搜索问题:对于评分和候选集,给定输入,寻找固定大小的的子集,使得 {,} 在 {,}尽可能靠前。这个问题本身非常简单直接,而其核心在于其巨大的规模。通常,在阿里妈妈广告场景中,召回的候选集规模能达到... 1. 背景视频中物体分割是视频理解的基础算法,也是对淘宝商品视频分析和加工所依赖的重要能力。传统的视频分割任务一般分为两种类型:一种是VOS(Video Object Segmentation),该任务需要在第一帧给出物体的初始分割标注,并在此基础上对视频后续帧中的标定物体进行跟踪和分割;另一种是VIS(Video Instance Segmentation),这个任务目标是在预定的物体类别范围内... ✍???? 本文作者:持信、弈臻、悟放、积流、孟诸1. 摘要为商品图片上特定位置配上装饰性文案来突出重点在广告业务中有着十分广泛的应用前景。然而,现有的图片文案描述生成系统均生成与图片位置关系无关的文案,无法很好地应用到广告业务中。在本文中我们提出了一种新的文案生成任务——图上文案生成,并基于商品图片数据提出了一个大规模图上文案数据集CapOnImage2M。为了更好的利用上下文以及商品本身的信息来生成... 丨目录: 1.背景 2.业务问题 3.业界解决方案 4.技术方案 5.应用示例 6.业务收益 7.总结1. 背景随着业务朝向精细化经营增长,阿里妈妈商家端营销产品更加聚焦客户投放体验,旨在帮助商家提升经营效果,在变化的市场中找到确定增长。近年来,商家端算法业务使用的数据是离线T+1甚至T+7更新,为进一步捕捉用户意图,更全面实时的挖掘潜在需求,利用实时行为及投放效果帮助... 新年伊始,万象更新!转眼,阿里妈妈技术已陪伴大家走过601天~在此,感谢每位读者朋友的支持与关注回顾2022,我们分享了60篇原创技术文章、发布了1本营销科学系列白皮书、开源了1项向量召回技术方案;阿里妈妈营销隐私计算平台通过了中国信通院2项“可信隐私计算评测”,隐私计算能力获权威认证;北大-阿里妈妈人工智能创新联合实验室正式成立,并落地了首批研究成果。本期我们盘点了过去一年的技术实践,送上这份“... 丨目录:· 摘要· 动机:在离线不一致问题· 问题建模· 方法:SORL框架· 实验结果· 总结· 关于我们·参考文献▐摘要近年来,自动出价已成为广告主提升投放效果的重要方式,在真实广告系统(RAS)中,常见的自动出价策略是利用强化学习算法在复杂多变的竞价环境下进行实时调整。考虑到线上探索的成本和安全性,强化学习模型的训练通常是在一个模拟广告系统(VAS)中进行。由于RAS和VAS之间存在明显... 丨目录:· 摘要· 引言· 问题建模· 实验· 总结与展望· 关于我们·参考文献▐摘要大多数的信息流场景会向用户展现自然内容和商业化内容(广告)的混合结果。一种比较常见的做法是,将广告限定在固定位置进行展现,但由于这种静态广告展现策略忽略了用户的个性化偏好,往往比较低效。因此,在本文中我们聚焦于信息流广告的动态展现方法研究,从动态背包问题的角度将其建模,并提出了分层约束下的动态广告展现方法(H... 丨目录: · 摘要 · 背景 ·Method · 实验 · 结语▐摘要目前基于深度学习的CTR预估模型(即 Deep CTR Models)被广泛的应用于各个应用中。传统的 Deep CTR Models 的学习模式是相对静态的,即所有的样本共享相同的网络参数。然而,由于不同样本的特征分布不尽相同,这样一种静态方式很难刻画出不同样本的特性,从而限制了模型的表达能力,导致次优...