推薦演算法公式
① 抖音熱門推薦機制是怎麼計算的
抖音的演算法是怎麼回事?——天津歐思創科技有限公司
簡單地說:抖音的演算法,其實是一個漏斗機制,跟今日頭條的去中心化的推薦演算法原理基本一致。
它分為三個步驟:
第一,冷啟動流量池曝光
假設每天在抖音上有100萬人上傳短視頻,抖音會隨機給每個短視頻分配一個平均曝光量的冷啟動流量池。比如,每個短視頻通過審核發出後,平均有1000次曝光;
第二,數據挑選
抖音會從這100萬個短視頻的1000次曝光,分析點贊、關注、評論、轉發等各個維度的數據,從中再挑出各項指標超過10%的視頻,每條再平均分配10萬次曝光。然後再去看哪些是點贊、關注、轉發、評論是超過10%的,再滾進下一輪更大的流量池進行推薦。
第三,精品推薦池
通過一輪又一輪驗證,篩選出來點贊率、播放完成率、評論互動率等指標都極高的短視頻才有機會進入精品推薦池,用戶打開時,看到的那些動輒幾十上百萬點贊量的視頻就是這么來的。
接下來分享的所有干貨和技巧,都是緊緊圍繞著最核心的一點:通過提升點贊量、關注量、評論量、轉發率等指標,獲得更大的官方精準推薦,贏得更大的曝光。
② 個性化推薦演算法
隨著演算法的普及,大量的產品有了個性化推薦的功能,這也成為內容類產品的標配。個性化定製化逐漸成為了互聯網思維的新補充,被提升到了越來越重要的地位。演算法推薦經過了很長一段時間的發展,才逐漸達到能給用戶驚喜的階段。比如在電商領域,推薦演算法可以挖掘用戶潛在購買需求,縮短用戶選取商品的時間,提升用戶的購物體驗;在新聞或段視頻領域,推薦演算法可以推送用戶喜歡的內容,提高用戶的閱讀效率,減少用戶選擇內容的時間,也增加了用戶在產品上的停留時長。
演算法應用階段
內容類產品發展初期,推薦演算法一般為「熱度演算法」,就是系統把熱點內容優先推薦送給用戶,完成熱點內容的高閱讀率。在積累了一定的用戶數據後,會發現用戶閱讀內容過於集中於熱點信息,長尾信息中的優質資源往往被忽略,造成資源浪費。「千人一面」的狀況已不是一個優質的解決方案,所以演算法逐漸演變為「個性化推薦」,也就是協同過濾的方法論支撐下的一種演算法。協同過濾能很好的根據用戶的喜好,推薦匹配的內容,減少資源浪費,增加用戶使用的友好體驗。真正做到「千人千面」。
推薦演算法的信息來源
第三方數據
一個新系統在初期沒有數據積累的情況下,可與第三方合作,互授部分信息共享。比如,很多系統支持微信登陸,這時候可以獲取客戶的微信信息,生活地點,部分生活習慣等。同時會獲取用戶的社交信息,共同好友越多表明圈子越相似,可以推薦更多相似的內容。
用戶行為數據
記錄用戶在系統內的使用習慣,可以准確的描述單個用戶的行為特徵,愛好特徵等有效的信息,系統根據提取出的分析結果,將內容與之匹配,完成更精準的推薦。如,某用戶經常瀏覽體育信息,系統將對應推薦更多體育相關的咨詢,省去用戶搜索篩選的時間。
基於生活習慣
基於生活習慣,生活常識的推薦,往往也可以作為內置的一個信息來源途徑。比如,外賣的app推薦用戶的餐廳,一般默認是位置優先,就近推薦,如果是快中午的時間段使用,系統默認推薦午餐,其次是晚餐。靠生活常識作出的系統演算法,可以更符合人類的習慣,給用戶更好的體驗。
熱度演算法
熱度演算法簡單的說就是把最核心的內容優先推薦,用新聞舉例,每一條新聞都具有實效性,隨著時間的推移,該條新聞的關注度降低,關注點被新的熱點新聞取代。量化以上的過程,把各個影響因素設定為變數,會得出以下的公式:
新聞熱度=初始熱度分+用戶交互熱度分-衰減熱度分
初始熱度分為新聞產生時,系統對新聞主體的預判熱度值。預判的分值一般為以下兩種模式,一種情況,按照新聞類別的不同,娛樂新聞大於財經新聞,大於國際新聞,大於文化新聞等等系統的預設,依次給出不同的初始熱度分;另一種情況,系統預置熱詞詞庫,用新聞的關鍵詞和詞庫的去匹配,匹配度高的,初始熱度分高。
用戶的交互熱度分也是一個變數,先要明確用的哪些行為會影響新聞熱度,然後對這些行為量化,加權或打分等方式。例如,網易雲音樂,用戶的聽歌,重復循環,收藏,評論,分享等行為,系統為每一種行為打分,求和後得出用戶交互的熱度分:
用戶交互熱度分=聽歌X10+循環X5+收藏X10+評論X5+分享X3
此公式還可以繼續細化,每一種操作的分值也可以作為變數,在產品前期時,傳播產品為主要任務,所以分享的加權要大一些,隨著網易雲的發展,社區的概念逐漸強化,評論區互動的加權會加大,所以評論的分值會增加,系統隨時調整分數加權,得出更准確的用戶交互的影響值。
衰減熱度分是一個隨時間變化而變化的數值,往往是一個函數的表達。用新聞舉例,新聞的熱度會隨著時間的推移而衰減,並且趨勢是越來越快,人們在接受新的熱點後,迅速忘記「舊聞」,直至熱度趨近於零。根據理論數據,構建函數,准確的表達衰減分值。
還有很多其他的影響因素,比如傳播次數,傳播層數,停留時長等等,都會影響熱度值,要想更精準的表達,就需要把涉及到的因素都作為變數,不斷完善演算法,才能更精準的完成推薦。
個性化推薦演算法
隨著用戶量的增加,產品日活的增加,用戶也不能僅限於千人一面熱點閱讀的模式中,個性化推薦在此時顯得尤為重要。個性化推薦有兩種常見的解決方案,一種是基於內容的推薦演算法,推薦內容往往是根據用戶的使用習慣得來,較為精準;另一種是基於用戶的協同推薦演算法,系統會根據以往使用內容,為用戶建模,然後根據群體中個體的使用習慣,推薦更多超預期的內容,達到預測推薦的效果。
基於內容的推薦演算法-預期內
基於內容的推薦演算法,靠收集用戶的使用習慣,進而推薦相關的內容。系統使用分詞庫匹配、關鍵詞匹配等等方式,達到內容的匹配,做到內容的精確劃分。比如,用戶瀏覽了某部科幻電影,系統就會按照該電影所對應的標簽,如科幻,然後系統推薦相同標簽的影片給用戶。
這樣的推薦方案,確定性強,推薦的內容都是根據用戶的歷史來確定,不能挖掘用戶的潛在需求。
基於用戶的協同推薦-超預期
做到精準推薦後,系統會繼續挖掘更潛在的推薦需求,給用戶超預期的推薦體驗。這就到了基於用戶協同推薦的階段。簡單的說,這種演算法是增加了用戶建模的環節,將同標簽的用戶群分,對比群體中單個個體的特徵,默認這種特徵為這類人的潛在特徵,再將此特徵內容推薦給同標簽的用戶,達到超預期的推薦效果。
比如,某用戶購買了一個蘋果手機,系統會將此用戶歸類為果粉,系統識別出很多果粉除了買蘋果的商品,還會購買小米作為備用機,這個特徵會被系統識別為潛在需求,推薦給果粉,減少果粉選擇備用機的時間。
這樣的推薦演算法,不僅能完成精準的推薦,還能給用戶小驚喜,讓系統「有溫度」。但是這樣的推薦方式,往往需要積累了大量用戶資料為基礎,才可以精確的完成。
③ 抖音熱門推薦機制是怎麼計算的
目前抖音的推薦機制是人工+演算法;總共可以分成三個階段來理解。
第一步:上傳視頻後,人工審核加標簽,再演算法推薦人群,根據賬號權重,推薦人數為:20-250;
第二步:根據第一次推薦的評論,點贊,分享數量來計算,具體公式:熱度=a*視頻完播率+b*評論數量+c*點贊數量+d*分享數量;權重:a>b>c>d,
第三步:數據反饋達標,就會進入下一個流量池,這個流量池人數在1000人—5000人之間,進入更大的流量池,還是根據上面那個公式。
以上是回答,希望對你有所幫助
④ 鎶栭煶騫沖彴鐨勭畻娉曞拰鎺ㄨ崘鏈哄埗鏄浠涔堬紵
鎶栭煶綆楁硶鎻縐橈紝鐜╄漿綺懼噯嫻侀噺
浼楁墍鍛ㄧ煡錛屾姈闊崇煭瑙嗛戠戶鎵誇簡澶存潯鐨勭畻娉曞熀鍥狅紝騫墮氳繃寮哄ぇ鐨勭畻娉曟敮鎸侊紝紜淇濈敤鎴風殑榛忔у拰闀挎椂闂存椿璺冦傛姈闊充互涓縐嶇嫭鐗圭殑鈥滃掍笁瑙掑艦鈥濈簿鍝佹祦閲忔睜綆楁硶涓哄熀紜錛岄氳繃姣忔潯瑙嗛戝湪嫻侀噺奼犱腑鐨勨滄e悜鍙嶉堚濋愮駭鏅嬪崌錛屽疄鐜頒粠浣庣駭嫻侀噺奼犲埌楂樼駭嫻侀噺奼犵殑鍗囩駭榪囩▼銆
浣滀負涓涓鍘諱腑蹇冨寲騫沖彴錛屾姈闊崇粰浜堜簡姣忎釜璐﹀彿鏇濆厜鐨勬満浼氥傚叾榪愯屾満鍒跺彲浠ュ綊緇撲負涓変釜姝ラわ細
1. 鍐峰惎鍔ㄦ祦閲忔睜鏇濆厜
鍋囪炬瘡澶╂湁100涓囦漢鍦ㄦ姈闊充笂涓婁紶鐭瑙嗛戱紝鎶栭煶浼氫負姣忎釜瑙嗛戝垎閰嶄竴涓騫沖潎鏇濆厜閲忕殑鍐峰惎鍔ㄦ祦閲忔睜銆備緥濡傦紝涓鏉$煭瑙嗛戦氳繃瀹℃牳鍚庯紝騫沖潎鑾峰緱1000嬈℃洕鍏夈
2. 鍐呭規暟鎹鎸戦
鎶栭煶浼氫粠榪100涓囦釜瑙嗛戠殑1000嬈℃洕鍏変腑錛屽垎鏋愮偣璧炪佸叧娉ㄣ佽瘎璁恆佽漿鍙戠瓑鍚勯」鏁版嵁鎸囨爣錛屽苟閫夋嫨瓚呰繃10%鐨勮嗛戣繘琛岃繘涓姝ユ寫閫夈傛瘡鏉¤嗛戝啀騫沖潎鑾峰緱10涓囨℃洕鍏夈
鍙鏈夐氳繃浜嗕笂涓綰ф祦閲忔睜鐨勮冮獙錛岃嗛戞墠鑳借繘鍏ヤ笅涓涓嫻侀噺奼狅紝鑾峰緱鏇村氱殑鏇濆厜鏈轟細鍜屾挱鏀鵑噺銆傝嗛戞槸鍚﹀叿澶団滄e悜鍙嶉堚濆彇鍐充簬浜斾釜鏍稿績鎸囨爣錛氬畬鎾鐜囥佺偣璧炵巼銆佽瘎璁虹巼銆佽漿鍙戠巼鍜屽叧娉ㄦ瘮銆
鍦ㄦゅ熀紜涓婏紝浠庝腑絳涢夊嚭鍥涢」鎸囨爣瓚呰繃10%鐨勮嗛戱紝騫剁撼鍏ヤ笅涓杞鏇村ぇ鐨勬祦閲忔睜榪涜屾帹鑽愩
3. 綺懼搧鎺ㄨ崘奼
緇忚繃澶氳疆絳涢夐獙璇侊紝鍙鏈夌偣璧炵巼銆佹挱鏀懼畬鎴愮巼銆佽瘎璁轟簰鍔ㄧ巼絳夋寚鏍囨瀬楂樼殑鐭瑙嗛戞墠鏈夋満浼氳繘鍏ョ簿鍝佹帹鑽愭睜銆傚綋鐢ㄦ埛鎵撳紑鎶栭煶鏃訛紝浠栦滑灝變細鐪嬪埌閭d簺鎷ユ湁鏁扮櫨涓囩偣璧為噺鐨勭簿褰╄嗛戙
鎯寵佺帺杞鎶栭煶銆佸埄鐢ㄥ叾榪涜屽搧鐗屽d紶鍜屽彉鐜幫紝絎涓姝ュ繀欏諱簡瑙f姈闊崇殑綆楁硶鏈哄埗銆傜啛鎮夋姈闊崇畻娉曞悗錛屼綘灝嗚兘澶熷湪榪欎釜涓栫晫涓涓嶆柇鎸戞垬騫舵彁鍗囪嚜宸便
鍦ㄩ暱鏈熺殑鎶栭煶榪愯惀榪囩▼涓錛屾垜浠涓撴敞浜庢彁鍗囪繖浜斾釜鎸囨爣錛屼負鎶栭煶嫻侀噺鐨勭簿鍑嗗紩瀵煎拰浼樺寲鎵撲笅鍧氬疄鍩虹銆