當前位置:首頁 » 操作系統 » 信息流推薦演算法

信息流推薦演算法

發布時間: 2023-11-08 14:16:02

演算法推薦服務被戴「緊箍」,流量造假、控制熱搜等有治了

演算法推薦是把「雙刃劍」

騰訊安全戰略研究中心聯合賽博研究院發布的《人工智慧時代數字內容治理的機遇與挑戰》報告顯示,演算法精準推薦已經占據信息流分發主導地位,演算法能夠實現數字內容聚合和精準推薦,快速匹配信息與人。基於演算法的個性化內容推送在為用戶提供精準化、個性化服務的同時,也帶來了國家安全風險因素增高、不良信息泛濫風險增加以及傳統權利保護難度加大等問題,已然成為一把「雙刃劍」。

上海 財經 大學研究員崔麗麗表示,互聯網平台作為消除信息不對稱的先進技術代表,有責任維持技術手段的客觀性,反映流量的自然狀態,呈現真實的公眾意見。不應該因為商業利益的驅使在流量上作假。過去曾發生過一些涉及到商業利益的新聞、信息被操控的情況,這樣獲取的商業利益是一種市場不公平的表現,甚至是不合法的。

提出演算法「向善」新要求

根據徵求意見稿,管理規定將適用於在境內應用演算法推薦技術提供互聯網信息服務的公司。這也意味著,以內容推薦演算法為核心競爭力的短視頻平台、UGC(用戶生產內容)平台、推薦內容或是廣告的電商和社交平台等主流互聯網公司和平台的演算法推薦技術都包含在此。

崔麗麗表示,不論是UGC還是PGC(專業生產內容)平台,內容的審核以及對於受眾的推薦實際都有相應的規則,互聯網信息平台已經在形態上取代了過去的傳統媒體,因此,可能具備了一定的公共設施屬性,所以信息的產生、審核和分發應該符合公允、客觀以及符合事實等要求。

徵求意見稿指出,演算法推薦服務提供者應當堅持主流價值導向,優化演算法推薦服務機制,積極傳播正能量,促進演算法應用「向上向善」。演算法推薦服務提供者應當定期審核、評估、驗證演算法機制機理、模型、數據和應用結果等,不得設置誘導用戶沉迷或者高額消費等違背公序良俗的演算法模型。

王娟表示,徵求意見稿對演算法的主體價值導向、個人數據用途、行業自律等提出了演算法「向善」的要求,提出了演算法提供者備案責任,明確了演算法推薦服務提供者作為落實演算法安全的主體責任 ,還對演算法推薦服務日誌等信息提出了留存要求,留存期限不少於六個月,並在相關執法部門依法查詢時予以提供,對回溯求證環節進行了加強。

徵求意見稿明確,演算法推薦服務提供者應落實演算法安全主體責任,建立健全用戶注冊、信息發布審核、演算法機制機理審核、安全評估監測、安全事件應急處置、數據安全保護和個人信息保護等管理制度,制定並公開演算法推薦相關服務規則,配備與演算法推薦服務規模相適應的專業人員和技術支撐。

從用戶的角度來看,演算法對數據的交互模式也提出了很多要求。徵求意見稿提出,演算法推薦服務提供者應當以顯著方式告知用戶其提供演算法推薦服務的情況,並以適當方式公示演算法推薦服務的基本原理、目的意圖、運行機制等。同時,演算法推薦服務提供者應當向用戶提供選擇、修改或者刪除用於演算法推薦服務的用戶標簽的功能,以及不針對其個人特徵的選項,或者向用戶提供便捷的關閉演算法推薦服務的選項。

而對於大數據「殺熟」等頑疾,徵求意見稿強調,演算法推薦服務提供者向消費者銷售商品或者提供服務的,應當保護消費者合法權益,不得根據消費者的偏好、交易習慣等特徵,利用演算法在交易價格等交易條件上實行不合理的差別待遇等違法行為。

網路熱搜將被嚴管

近年來,網路熱搜已經成為實時的輿情風向標和輿論的集散地,徵求意見稿也特別對熱搜作出了規范管理,明確演算法推薦服務提供者應當加強演算法推薦服務版面頁面生態管理,建立完善人工干預和用戶自主選擇機制,在首頁首屏、熱搜、精選、榜單類、彈窗等重點環節積極呈現符合主流價值導向的信息內容。

王娟表示,徵求意見稿對熱搜、虛假流量可謂「重拳出擊」,核心仍是圍繞互聯網不是法外之地,建立清朗網路空間、樹立良好 社會 價值觀,微博熱搜榜等各類「帶節奏」式資本疊加流量的運作模式將受到重大挑戰。

面對外界的質疑,微博也在近日發布了熱搜管理規則,並對「花錢買熱搜」「花錢壓熱搜」等質疑回應稱,熱搜根據微博用戶的真實行為進行計算,並根據搜索量、發博量、互動量等數據指標,形成實時榜單。榜單演算法中包含了嚴格的排水軍和反垃圾機制,以確保公正客觀。同時上半年熱搜還將「減少 娛樂 佔比」作為主要調控目標。

⑵ 猜你喜歡是如何猜的——常見推薦演算法介紹

自從頭條系的產品今日頭條和抖音火了之後,個性化推薦就進入了大眾的視野,如果我們說搜索時人找信息的話,那麼推薦就是信息找人。搜索是通過用戶主動輸入索引信息告訴機器自己想要的東西,那麼推薦的這個索引是什麼才能讓信息找到人呢?

第一類索引是「你的歷史」,即基於你以前在平台上對某物品產生的行為(點贊,轉發,評論或者收藏),尋找與你產生過相似行為的用戶所喜歡的其他物品或者與你喜歡的物品相似的其他物品來為你推薦。這一基於用戶行為相似的演算法有:協同過濾演算法、基於內容的推薦演算法和基於標簽的推薦演算法。

基於用戶的協同過濾演算法是尋找與A用戶有相似行為的所有B用戶所喜歡的而A用戶還不知道的物品推薦給A用戶 。該演算法包括兩個步驟:

-根據用戶所喜歡的物品計算用戶間相似度,找到與目標用戶相似的用戶集合;

-找到該用戶集合所喜歡的而目標用戶所不知道的物品。

那麼,找出一批物品以後哪個先推薦哪個後推薦?用戶間相似程度大的先推薦,用戶對物品的感興趣程度大要先推薦。即假設A用戶與B用戶的相似程度為0.9,與C用戶的相似程度為0.7,用戶B喜歡物品a和物品b的程度分別為1和2,用戶C喜歡物品a和物品b的程度分別為0.1和0.5,那麼先推薦物品b。多個用戶多個物品,只要擬定了用戶間的相似度和用戶對物品的感興趣程度,即可對物品進行打分並且進行綜合排序。

基於物品的協同過濾演算法是根據用戶行為而不是物品本身的相似度來判斷物品的相似度 ,即如果物品A和物品B被很多的用戶同時喜歡,那麼我們就認為物品A和物品B是相似的。該演算法也是包括兩個步驟:

-根據用戶行為計算物品間的相似度;

-根據物品的相似度和用戶的歷史行為給用戶生成推薦列表。

與UserCF相似的是,同樣會遇到推薦的先後順序問題,那麼ItemCF所遵循的原則是:物品間相似程度大的先推薦,用戶對物品的感興趣程度大要先推薦。假設用戶對物品a和物品b感興趣的程度分別為1和0.5,物品a與物品c和物品d的相似度分別為0.5和0.1,物品b與物品c和物品d的相似度分別為0.3和0.4,那麼先推薦物品d。用戶喜歡多個物品,並且多個物品與其他物品都有相似的情況下,只要擬定了用物品間的相似度和用戶對物品的感興趣程度,即可對物品進行打分並且進行綜合排序。

協同過濾演算法的核心都是通過用戶行為來計算相似度,User-CF是通過用戶行為來計算用戶間的相似度,Item-CF是通過用戶行為來計算物品間的相似度。

推薦演算法很重要的一個原理是為用戶推薦與用戶喜歡的物品相似的用戶又不知道的物品。物品的協同過濾演算法是通過用戶行為來衡量物品間的相似(喜歡物品A的用戶中,同時喜歡物品B的用戶比例越高,物品A與物品B的相似程度越高),而基於內容的推薦演算法衡量則是通過物品本身的內容相似度來衡量物品間的相似。

假如,你看了東野圭吾的《解憂雜貨店》,那麼下次系統會給你推薦東野圭吾的《白夜行》。假設你看了小李子的《泰坦尼克號》,系統再給你推薦小李子的《荒野獵人》。

該演算法與前兩種不同的是,將用戶和物品之間使用「標簽」進行聯系,讓用戶對喜歡的物品做記號(標簽),將同樣具有這些記號(標簽)的其他物品認為很大程度是相似的並推薦給用戶。其基本步驟如下:

統計用戶最常用的標簽

對於每個標簽,統計最常被打過這個標簽次數最多的物品

將具有這些標簽最熱門的物品推薦給該用戶

目前,國內APP中,豆瓣就是使用基於標簽的推薦演算法做個性化的推薦。

第二類索引是「你的朋友」,基於你的社交好友來進行推薦,即基於社交網路的推薦。例如,微信看一看中的功能「朋友在看」就是最簡單的基於社交網路的推薦,只要用戶點擊公眾號文章的「在看」,就會出現在其好友的「朋友在看」的列表中。

復雜一點的演算法會考慮用戶之間的熟悉程度和興趣的相似度來進行推薦。目前,在信息流推薦領域,基於社交網路進行推薦的最流行的演算法是Facebook的EdgeRank演算法,即為用戶推薦其好友最近產生過重要行為(評論點贊轉發收藏)的信息。

第三類索引是「你所處的環境」,基於你所處的時間、地點等上下文信息進行推薦。例如,我們看到很APP中的「最近最熱門」,就是基於時間上下文的非個性化推薦;以及,美團和餓了么這些基於位置提供服務的APP中,「附近商家」這一功能就是基於用戶位置進行推薦。高德地圖在為用戶推薦駕駛路線時,會考慮不同路線的擁堵程度、紅綠燈數量等計算路線用和路程距離再進行綜合排序推薦。

很多時候,基於時間上下文的推薦會協同過濾這類個性化推薦演算法結合使用。例如,在使用協同過濾推薦策略的時候,會將時間作為其中一個因素考慮進入推薦策略中,最近的信息先推薦。

以上就是常見的推薦演算法。作為產品人,我們不需要知道如何實現,但是我們必須知道這些推薦演算法的原理,知道在什麼場景下如何去做推薦才能提升推薦的效率,這才是產品經理的價值所在。

參考資料:《推薦演算法實戰》項亮

熱點內容
硬碟錄像機外接存儲伺服器 發布:2024-11-30 09:27:18 瀏覽:993
雅視修改密碼為什麼失敗 發布:2024-11-30 09:25:46 瀏覽:966
安卓照片大小怎麼改100k內 發布:2024-11-30 09:20:39 瀏覽:431
ups系統如何配置網路 發布:2024-11-30 09:06:14 瀏覽:58
怎麼看pppoe密碼 發布:2024-11-30 08:35:35 瀏覽:510
sandisk16gb存儲卡 發布:2024-11-30 08:34:42 瀏覽:954
eclipsejava反編譯 發布:2024-11-30 08:34:37 瀏覽:900
yy靜態頭像源碼 發布:2024-11-30 08:30:21 瀏覽:681
javaparseint 發布:2024-11-30 08:23:12 瀏覽:910
抖音密碼箱保險在哪裡 發布:2024-11-30 08:10:43 瀏覽:999