APP推广合作
联系“鸟哥笔记小乔”
产品运营必修课:个性化推荐技术
2016-07-12 11:21:00
最近看到一条新闻,说是腾讯准备花重金收购今日头条,而且势在必得的样子。今日头条很多人应该不陌生,我也是今日头条的忠实用户,为什么我觉得今日头条做的比其他新闻/资讯客户端要好,正是因为他展现给我的内容都是我想看的,随着我在上面的行为越来越多,它展现给我的内容越准确,今日头条使用的最核心的技术就是个性化推荐技术。


随着移动互联网的兴起,用户的很多行为逐渐从PC端转向移动端。人们花在手机上的时间越来越多。人们随时随地都在使用手机,在你坐车的时候,上厕所的时候,吃饭的时候,甚至在你走路的时候都在用手机,相对于PC端,移动端的特点是屏幕窄,用户使用的时间呈现碎片化。同时随着信息量越来越大,人们很难从大量的信息中快速找到自己想要的内容。这个体验是非常差的,如果你是产品经理,如果你面临同样的问题,接下来要讲的内容希望对你有所帮助。

推荐引擎是什么?

如果你在亚马逊上买过书,你可能会碰到这种情况,当你选择一本书放入购物篮时,它会自动给你推荐其它的书。比如:购买过该书的人还买过XXXX,猜你可能还喜欢XXXX,组合推荐,购买该书还有另外几本书的组合可以享受一个优惠的组合价格。这些使用的都是推荐系统,简单来说推荐系统就是研究用户在平台上的所有行为,对用户进行人物画像,以及研究平台上的内容/产品。同时把用户和产品匹配起来的过程。

推荐引擎的应用范围?

推荐系统在各个领域有广泛的应用,比如电商网站、视频网站、视频直播平台、新闻客户端、文学网站、音乐网站等等。下图是推荐系统在著名电商网站、视频网站的一些应用案例及应用效果。


为什么推荐系统能够在各个领域得到广泛的应用?

通过目录或者搜索的方式查找想要的内容,在移动终端较小的屏幕上可能需要多次翻屏,查找感兴趣的内容的成本很高,用户体验较差。
通过推荐系统展现给用户的内容,都是用户感兴趣的,而且每个用户看到的都不一样,亚马逊的CEO贝佐斯说过,要让1000个访问亚马逊的用户看到1000个不同的亚马逊。

目前用户的选择非常多,可选择的多样性及时间的碎片化,用户打开手机,如没能快速找到感兴趣的内容,很快就会离开。
个性化推荐技术通过算法进行用户感兴趣的内容的精准推荐,帮助用户快捷发现感兴趣的内容,当你看完一个内容后,会立马给你推荐相关的东西,可以增加用户粘性。

帮助用户发现更多优质的长尾内容,一般平台用户访问的只局限在热门的10%左右的内容,很多内容永远沉在数据库中没有人发现。
帮助平衡平台的生态,避免马态效应,热门的内容总是得到更多的爆光,冷门的内容从没机会被关注,使内容生产生态两极分化。
推荐系统的架构和核心的算法

下面以我之前做过的一个产品为例来讲解,在架构上,可能每家在做的时候会有些不同,但用到的一些核心算法,大家应该是差不多的。具体怎么实现,产品经理不需要关注这么细,只需要大概了解其中的原理就可以了。



推荐系统中常用到的算法包括用户偏好算法,协同过滤算法(item_base,user_base)、关联规则算法、聚类算法、内容相似性算法(content_base),以及一些其它的补充算法。最终分析出来的结果是以下几种

根据用户偏好算法算出来用户感兴趣的内容/产品。然后推荐给用户

根据关联规则算法,算出物品间的支持度和置信度。最常见的应用是组合购买,啤酒和尿不湿是非常经典的例子了。
item_base是根据集体用户行为算出物品间的相似度,然后把与用户看过的物品或者购买过的物品最相似的物品推荐给该用户。
聚类算法可以根据用户进行聚类,也可以对产品进行聚类。聚类后可以针对大类进行推荐,或者继续计算用户类和产品类之间的关系。
content_base是根据物品本身的属性进行关联性运算,计算出物品间的相似性,最常见的应用是同类推荐。
user_base是根据集体行为计算用户之间的相似度,比如A跟B计算出来非常相似,则可以把B喜欢的内容,但A还没有看过,推荐给A。

常用的应用场景

1、首页猜你喜欢推荐

由于移动端屏幕较小,一屏展现的内容较少,用户要找到自己感兴趣的内容需要一屏一屏往下翻,在这个地方展现个性化推荐系统推荐的内容,可以快速抓住用户的眼球。


2、在发现栏目给用户推荐感兴趣的内容,可以让用户获得惊喜。


3、内容详情页的关联推荐/相关推荐,在内容详情页可以给用户推荐与当前内容相似的内容。


4、阅读结束/视频播放结束/直播结束推荐,推荐与当前内容类似的内容。


5、搜索页面推荐,当搜索无结果时,可以给用户推荐其感兴趣的内容


个性化推荐系统应用中的几个关键问题

个性化推荐系统是一个非常复杂系统,其中不光涉及数据处理算法和系统架构的灵活性问题,还涉及系统鲁棒性,数据稀疏性问题、冷启动问题、系统的精准性和多样性问题。

垃圾数据处理,对于系统产生的异常数据、垃圾数据需要业务特点制定一套清洗规则。
冷启动问题,由于新用户访问时没有数据沉淀,因此很难根据用户行为进行推荐,目前比较普遍的方法是新用户首次登录时提供兴趣标签引导页面,引导用户进行设置,同时结合其它推荐算法。另外一种比较理想的方法是使用用户在其它平台的社交数据。
数据稀疏性问题,可以使用聚类算法进行升维后运算,并结合其它算法进行组合推荐。

推荐结果精准性和多样性,通过多种算法进行组合推荐。确保推荐结果集的精准性和多样性。
以上是关于个性化推荐系统的一个基本知识,花了点时间整理出来,希望对大家有所帮助。欢迎对这块感兴趣的同学一起交流。

作者:谢德福
文章来源:人人都是产品经理
运营那些事儿
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
运营那些事儿
运营那些事儿
发表文章49318
确认要消耗 羽毛购买
产品运营必修课:个性化推荐技术吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接