當前位置:首頁 » 操作系統 » 兩層演算法

兩層演算法

發布時間: 2023-08-30 23:57:05

『壹』 stacking集成演算法能有幾層

不限,但是很多情況下,兩層的效果是相對比較好的,多層反而不好。在不同的數據集上多做實驗試一下。

『貳』 微博最常訪問演算法

基礎及關聯演算法

這一層演算法的主要作用是為微博推薦挖掘必要的基礎資源、解決推薦時的通用技術問題、完成必要的數據分析為推薦業務提供指導。

這一部分中常用的演算法和技術如下:

分詞技術與核心詞提取

是微博內容推薦的基礎,用於將微博內容轉化為結構化向量,包括詞語切分、詞語信息標注、內容核心詞/實體詞提取、語義依存分析等。

分類與 anti-spam

用於微博內容推薦候選的分析,包含微博內容分類和營銷廣告/色情類微博識別;

內容分類採用決策樹分類模型實現,共 3 級分類體系,148 個類別;營銷廣告/色情類微博的識別,採用貝葉斯與最大熵的混合模型。

聚類技術

主要用於熱點話題挖掘,以及為內容相關推薦提供關聯資源。屬於微博自主研發的聚類技術 WVT 演算法(word vector topic),依據微博內容特點和傳播規律設計。

傳播模型與用戶影響力分析

開展微博傳播模型研究和用戶網路影響力分析(包含深度影響力、廣度影響力和領域內影響力)。

主要推薦演算法

1. Graph-based 推薦演算法

微博具有這樣的特點:用戶貢獻內容,社會化途徑傳播,帶來信息的爆炸式傳播。之所以稱作 graph-based 推薦演算法,而不是業界通用的 memory-based 演算法,主要原因在於:

  • 我們的推薦演算法設計是建立在社交網路之上,核心點在於從社交網路出發,融入信息傳播模型,綜合利用各類數據,為用戶提供最佳的推薦結果;比如很多時候,我們只是信息傳播的關鍵環節,加入必要的推薦調控,改變信息傳播通路,後續的傳播沿著原來的網路自然的傳播。

  • Feed 流推薦(我們稱作趨勢),是我們最重要的產品,而結果必須包含用戶關系。

  • 從 graph 的宏觀角度看,我們的目標是建立一個具有更高價值的用戶關系網路,促進優質信息的快速傳播,提升 feed 流質量;其中的重要工作是關鍵節點挖掘、面向關鍵節點的內容推薦、用戶推薦。

    對這部分的演算法做相應的梳理,如下面的表格:

    這樣利用 content-based 很好的解決了冷啟動的問題,又充分發揮了 user-based CF 的作用,實現1+1>2 的效果。

    分層模型混合:

    很多情況下,一個模型無法很好的得到想要的效果,而分層組合往往會取得比較好的效果,分層模型混合即「將上一層模型的輸出作為下層模型的特徵值,來綜合訓練模型,完成推薦任務「。比如我們在做微博首頁右側的 ctr 預估排序時,採用分層邏輯回歸模型,解決了不同產品間特徵天然缺失與樣本量差異、曝光位置帶來的效果偏差等問題。

熱點內容
車載安卓怎麼安裝軟體 發布:2025-02-01 04:30:50 瀏覽:469
安卓系統su程序是什麼 發布:2025-02-01 04:25:42 瀏覽:475
android代碼行數統計 發布:2025-02-01 04:20:47 瀏覽:216
快速喊話腳本 發布:2025-02-01 04:16:48 瀏覽:885
如何分辨普拉多的配置 發布:2025-02-01 04:11:45 瀏覽:681
linuxc文件刪除 發布:2025-02-01 04:11:33 瀏覽:218
c語言稀疏矩陣轉置矩陣 發布:2025-02-01 03:47:57 瀏覽:531
坦克世界掛機腳本有哪些 發布:2025-02-01 03:07:41 瀏覽:134
串口編程at 發布:2025-02-01 03:06:05 瀏覽:909
合資汽車配置有什麼 發布:2025-02-01 02:56:07 瀏覽:79