推荐算法公式
① 抖音热门推荐机制是怎么计算的
抖音的算法是怎么回事?——天津欧思创科技有限公司
简单地说:抖音的算法,其实是一个漏斗机制,跟今日头条的去中心化的推荐算法原理基本一致。
它分为三个步骤:
第一,冷启动流量池曝光
假设每天在抖音上有100万人上传短视频,抖音会随机给每个短视频分配一个平均曝光量的冷启动流量池。比如,每个短视频通过审核发出后,平均有1000次曝光;
第二,数据挑选
抖音会从这100万个短视频的1000次曝光,分析点赞、关注、评论、转发等各个维度的数据,从中再挑出各项指标超过10%的视频,每条再平均分配10万次曝光。然后再去看哪些是点赞、关注、转发、评论是超过10%的,再滚进下一轮更大的流量池进行推荐。
第三,精品推荐池
通过一轮又一轮验证,筛选出来点赞率、播放完成率、评论互动率等指标都极高的短视频才有机会进入精品推荐池,用户打开时,看到的那些动辄几十上百万点赞量的视频就是这么来的。
接下来分享的所有干货和技巧,都是紧紧围绕着最核心的一点:通过提升点赞量、关注量、评论量、转发率等指标,获得更大的官方精准推荐,赢得更大的曝光。
② 个性化推荐算法
随着算法的普及,大量的产品有了个性化推荐的功能,这也成为内容类产品的标配。个性化定制化逐渐成为了互联网思维的新补充,被提升到了越来越重要的地位。算法推荐经过了很长一段时间的发展,才逐渐达到能给用户惊喜的阶段。比如在电商领域,推荐算法可以挖掘用户潜在购买需求,缩短用户选取商品的时间,提升用户的购物体验;在新闻或段视频领域,推荐算法可以推送用户喜欢的内容,提高用户的阅读效率,减少用户选择内容的时间,也增加了用户在产品上的停留时长。
算法应用阶段
内容类产品发展初期,推荐算法一般为“热度算法”,就是系统把热点内容优先推荐送给用户,完成热点内容的高阅读率。在积累了一定的用户数据后,会发现用户阅读内容过于集中于热点信息,长尾信息中的优质资源往往被忽略,造成资源浪费。“千人一面”的状况已不是一个优质的解决方案,所以算法逐渐演变为“个性化推荐”,也就是协同过滤的方法论支撑下的一种算法。协同过滤能很好的根据用户的喜好,推荐匹配的内容,减少资源浪费,增加用户使用的友好体验。真正做到“千人千面”。
推荐算法的信息来源
第三方数据
一个新系统在初期没有数据积累的情况下,可与第三方合作,互授部分信息共享。比如,很多系统支持微信登陆,这时候可以获取客户的微信信息,生活地点,部分生活习惯等。同时会获取用户的社交信息,共同好友越多表明圈子越相似,可以推荐更多相似的内容。
用户行为数据
记录用户在系统内的使用习惯,可以准确的描述单个用户的行为特征,爱好特征等有效的信息,系统根据提取出的分析结果,将内容与之匹配,完成更精准的推荐。如,某用户经常浏览体育信息,系统将对应推荐更多体育相关的咨询,省去用户搜索筛选的时间。
基于生活习惯
基于生活习惯,生活常识的推荐,往往也可以作为内置的一个信息来源途径。比如,外卖的app推荐用户的餐厅,一般默认是位置优先,就近推荐,如果是快中午的时间段使用,系统默认推荐午餐,其次是晚餐。靠生活常识作出的系统算法,可以更符合人类的习惯,给用户更好的体验。
热度算法
热度算法简单的说就是把最核心的内容优先推荐,用新闻举例,每一条新闻都具有实效性,随着时间的推移,该条新闻的关注度降低,关注点被新的热点新闻取代。量化以上的过程,把各个影响因素设定为变量,会得出以下的公式:
新闻热度=初始热度分+用户交互热度分-衰减热度分
初始热度分为新闻产生时,系统对新闻主体的预判热度值。预判的分值一般为以下两种模式,一种情况,按照新闻类别的不同,娱乐新闻大于财经新闻,大于国际新闻,大于文化新闻等等系统的预设,依次给出不同的初始热度分;另一种情况,系统预置热词词库,用新闻的关键词和词库的去匹配,匹配度高的,初始热度分高。
用户的交互热度分也是一个变量,先要明确用的哪些行为会影响新闻热度,然后对这些行为量化,加权或打分等方式。例如,网易云音乐,用户的听歌,重复循环,收藏,评论,分享等行为,系统为每一种行为打分,求和后得出用户交互的热度分:
用户交互热度分=听歌X10+循环X5+收藏X10+评论X5+分享X3
此公式还可以继续细化,每一种操作的分值也可以作为变量,在产品前期时,传播产品为主要任务,所以分享的加权要大一些,随着网易云的发展,社区的概念逐渐强化,评论区互动的加权会加大,所以评论的分值会增加,系统随时调整分数加权,得出更准确的用户交互的影响值。
衰减热度分是一个随时间变化而变化的数值,往往是一个函数的表达。用新闻举例,新闻的热度会随着时间的推移而衰减,并且趋势是越来越快,人们在接受新的热点后,迅速忘记“旧闻”,直至热度趋近于零。根据理论数据,构建函数,准确的表达衰减分值。
还有很多其他的影响因素,比如传播次数,传播层数,停留时长等等,都会影响热度值,要想更精准的表达,就需要把涉及到的因素都作为变量,不断完善算法,才能更精准的完成推荐。
个性化推荐算法
随着用户量的增加,产品日活的增加,用户也不能仅限于千人一面热点阅读的模式中,个性化推荐在此时显得尤为重要。个性化推荐有两种常见的解决方案,一种是基于内容的推荐算法,推荐内容往往是根据用户的使用习惯得来,较为精准;另一种是基于用户的协同推荐算法,系统会根据以往使用内容,为用户建模,然后根据群体中个体的使用习惯,推荐更多超预期的内容,达到预测推荐的效果。
基于内容的推荐算法-预期内
基于内容的推荐算法,靠收集用户的使用习惯,进而推荐相关的内容。系统使用分词库匹配、关键词匹配等等方式,达到内容的匹配,做到内容的精确划分。比如,用户浏览了某部科幻电影,系统就会按照该电影所对应的标签,如科幻,然后系统推荐相同标签的影片给用户。
这样的推荐方案,确定性强,推荐的内容都是根据用户的历史来确定,不能挖掘用户的潜在需求。
基于用户的协同推荐-超预期
做到精准推荐后,系统会继续挖掘更潜在的推荐需求,给用户超预期的推荐体验。这就到了基于用户协同推荐的阶段。简单的说,这种算法是增加了用户建模的环节,将同标签的用户群分,对比群体中单个个体的特征,默认这种特征为这类人的潜在特征,再将此特征内容推荐给同标签的用户,达到超预期的推荐效果。
比如,某用户购买了一个苹果手机,系统会将此用户归类为果粉,系统识别出很多果粉除了买苹果的商品,还会购买小米作为备用机,这个特征会被系统识别为潜在需求,推荐给果粉,减少果粉选择备用机的时间。
这样的推荐算法,不仅能完成精准的推荐,还能给用户小惊喜,让系统“有温度”。但是这样的推荐方式,往往需要积累了大量用户资料为基础,才可以精确的完成。
③ 抖音热门推荐机制是怎么计算的
目前抖音的推荐机制是人工+算法;总共可以分成三个阶段来理解。
第一步:上传视频后,人工审核加标签,再算法推荐人群,根据账号权重,推荐人数为:20-250;
第二步:根据第一次推荐的评论,点赞,分享数量来计算,具体公式:热度=a*视频完播率+b*评论数量+c*点赞数量+d*分享数量;权重:a>b>c>d,
第三步:数据反馈达标,就会进入下一个流量池,这个流量池人数在1000人—5000人之间,进入更大的流量池,还是根据上面那个公式。
以上是回答,希望对你有所帮助
④ 鎶栭煶骞冲彴镄勭畻娉曞拰鎺ㄨ崘链哄埗鏄浠涔堬纻
鎶栭煶绠楁硶鎻绉桡纴鐜╄浆绮惧嗳娴侀噺
浼楁墍锻ㄧ煡锛屾姈阔崇煭瑙嗛戠户镓夸简澶存浔镄勭畻娉曞熀锲狅纴骞堕氲繃寮哄ぇ镄勭畻娉曟敮鎸侊纴纭淇濈敤鎴风殑榛忔у拰闀挎椂闂存椿璺冦傛姈阔充互涓绉岖嫭鐗圭殑钬滃掍笁瑙掑舰钬濈簿鍝佹祦閲忔睁绠楁硶涓哄熀纭锛岄氲繃姣忔浔瑙嗛戝湪娴侀噺姹犱腑镄勨沧e悜鍙嶉堚濋愮骇鏅嫔崌锛屽疄鐜颁粠浣庣骇娴侀噺姹犲埌楂樼骇娴侀噺姹犵殑鍗囩骇杩囩▼銆
浣滀负涓涓铡讳腑蹇冨寲骞冲彴锛屾姈阔崇粰浜堜简姣忎釜璐﹀彿镟濆厜镄勬満浼氥傚叾杩愯屾満鍒跺彲浠ュ綊缁扑负涓変釜姝ラわ细
1. 鍐峰惎锷ㄦ祦閲忔睁镟濆厜
锅囱炬疮澶╂湁100涓囦汉鍦ㄦ姈阔充笂涓娄紶鐭瑙嗛戯纴鎶栭煶浼氢负姣忎釜瑙嗛戝垎閰崭竴涓骞冲潎镟濆厜閲忕殑鍐峰惎锷ㄦ祦閲忔睁銆备緥濡傦纴涓𨱒$煭瑙嗛戦氲繃瀹℃牳钖庯纴骞冲潎銮峰缑1000娆℃洕鍏夈
2. 鍐呭规暟鎹鎸戦
鎶栭煶浼氢粠杩100涓囦釜瑙嗛戠殑1000娆℃洕鍏変腑锛屽垎鏋愮偣璧炪佸叧娉ㄣ佽瘎璁恒佽浆鍙戠瓑钖勯”鏁版嵁鎸囨爣锛屽苟阃夋嫨瓒呰繃10%镄勮嗛戣繘琛岃繘涓姝ユ写阃夈傛疮𨱒¤嗛戝啀骞冲潎銮峰缑10涓囨℃洕鍏夈
鍙链夐氲繃浜嗕笂涓绾ф祦閲忔睁镄勮冮獙锛岃嗛戞墠鑳借繘鍏ヤ笅涓涓娴侀噺姹狅纴銮峰缑镟村氱殑镟濆厜链轰细鍜屾挱鏀鹃噺銆傝嗛戞槸钖﹀叿澶団沧e悜鍙嶉堚濆彇鍐充簬浜斾釜镙稿绩鎸囨爣锛氩畬鎾鐜囥佺偣璧炵巼銆佽瘎璁虹巼銆佽浆鍙戠巼鍜屽叧娉ㄦ瘆銆
鍦ㄦゅ熀纭涓婏纴浠庝腑绛涢夊嚭锲涢”鎸囨爣瓒呰繃10%镄勮嗛戯纴骞剁撼鍏ヤ笅涓杞镟村ぇ镄勬祦閲忔睁杩涜屾帹钻愩
3. 绮惧搧鎺ㄨ崘姹
缁忚繃澶氲疆绛涢夐獙璇侊纴鍙链夌偣璧炵巼銆佹挱鏀惧畬鎴愮巼銆佽瘎璁轰簰锷ㄧ巼绛夋寚镙囨瀬楂樼殑鐭瑙嗛戞墠链夋満浼氲繘鍏ョ簿鍝佹帹钻愭睁銆傚綋鐢ㄦ埛镓揿紑鎶栭煶镞讹纴浠栦滑灏变细鐪嫔埌闾d簺𨰾ユ湁鏁扮栌涓囩偣璧为噺镄勭簿褰╄嗛戙
𨱍宠佺帺杞鎶栭煶銆佸埄鐢ㄥ叾杩涜屽搧鐗屽d紶鍜屽彉鐜帮纴绗涓姝ュ繀椤讳简瑙f姈阔崇殑绠楁硶链哄埗銆傜啛鎭夋姈阔崇畻娉曞悗锛屼綘灏呜兘澶熷湪杩欎釜涓栫晫涓涓嶆柇鎸戞垬骞舵彁鍗囱嚜宸便
鍦ㄩ暱链熺殑鎶栭煶杩愯惀杩囩▼涓锛屾垜浠涓撴敞浜庢彁鍗囱繖浜斾釜鎸囨爣锛屼负鎶栭煶娴侀噺镄勭簿鍑嗗紩瀵煎拰浼桦寲镓扑笅鍧氩疄锘虹銆