糾正演算法推薦

發布時間: 2023-05-21 15:17:07

阿朱對於演算法的了解不多，總結如下，希望多多交流，改正瑕疵。

演算法推薦主要有5種方式：

基於內容推薦：這是基於用戶個人興趣的推薦。根據用戶個體的歷史行為，計算對內容特徵的偏好程度，進而推薦出與用戶特徵偏好匹配的內容。

協同過濾演算法：這是基於群體的推薦。基於用戶的相似度、內容的共現度，以及基於人口特徵將用戶聚集為不同群體來推薦。（解釋一下：常見的協同過濾演算法有兩種，一種是基於用戶的（user-based），也即計算用戶之間的相似性，如果A和B的興趣相近，那麼A喜歡的電影，B也很有可能喜歡。另一種是基於物品的（item-based），也即計算物品之間的相似性，如果電影C和電影D很相似，那麼喜歡電影C的人，可能也會喜歡電影D。）

擴展推薦：基於用戶興趣點、內容類別等擴展。（你喜歡歷史資訊，我推考古、尋寶的資訊給你）

新熱推薦：基於全局內容的時效性、熱度推薦。（在產品初期同時缺乏用戶數據和內容數據時，內容分發效率很低。使用基於內容推薦演算法效果不顯著，而使用一些熱點話題可在保證一定流量的同時，不斷通過用戶的個人行為（點贊、評論、瀏覽、收藏）來逐步精確用戶畫像和進行內容沉澱，為之後的個性化推薦做准備）。

環境特徵：基於地域、時間、場景等推薦。（知乎上你們市的牙科診所廣告、婚慶廣告）

每種演算法的效果不一，組合味道更佳，因此很多公司都是採用「演算法矩陣」的方式來推薦feed。（後文也會談到這一點）

優勢:

內容質量審核、社區治理（辱罵、撕逼），推薦商品，減少人工運營成本。

源源不斷推薦給你感興趣的feed，提升了用戶粘性，商業化的潛力進一步加大。

讓用戶 kill time 的需求更好地被滿足，增強用戶體驗

弊端：

1.演算法本身或者演算法背後的人產生技術錯誤——只要是人寫的演算法，就一定有出錯的概率，比如德國居民凌晨發飆的智能音箱、失控的Uber自動駕駛汽車就是程序上的Bug導致的，這一類我們克服的辦法其實相對簡單。但對於另一種人為算計消費者的演算法有時候可能我們就無能為力了，比如大數據殺熟現象，無論真實與否，這類問題往往很難識別，因此也加大了監管的難度；（抖音視頻里你見不到「錢」字，只能看到「Q」來代替）

2.演算法對於人性部分的忽略——現在的人工智慧離真正理解人類的感情和行為依然有巨大的鴻溝，Facebook提醒你給去世的親人發生日祝福背後本質的原因在於AI無法真正理解死亡對於人類意味著什麼；因此需要人機結合（平台人工參與，用戶舉報等自治措施），不能單獨依靠演算法。

3.演算法訓練數據本身的偏見——目前人工智慧的基本邏輯是先構建一個合適的機器學習模型，然後用大量的數據去訓練模型，然後用訓練好的模型再來預測新的數據，這里邊有一個非常重要前提就是輸入數據的重要性，比如變壞的微軟機器人Tay之所以產生問題就是因為輸入的數據中本身就存在偏見，如果現實世界數據本身就存在偏見，那麼預測結果也一定會有偏見；

先下結論吧：演算法不會導致「信息繭房」

「社交媒體和演算法推薦導致信息繭房」這一判斷成立的一個重要前提是：我們只會點擊那些我們熟悉的、贊同的內容，不斷讓機器加深對我們的印象：原來他們只喜歡看這些！

但在現實中，這個前提是過於簡化的，乃至是錯誤的。

在個體層面，我們有著多樣的閱讀動機，受到各種認知偏見的影響，可能傾向於點擊某些特定類型的內容，但絕不僅僅局限於自己認同的那些。

在社交層面：我們在大多數APP上都存在著社交關系，以及主動選擇關注的帳號，這些都對我們能接觸到的內容產生重要影響。一個在APP上擁有一定社交關系的人，不太可能陷入狹窄的視野當中。

在技術層面：在演算法的分類里說了，每種演算法都有其利弊，因此很多公司都是採用「演算法矩陣」的方式來推薦feed。但在普羅大眾眼裡，演算法=基於內容的推薦演算法，而忽略了「基於內容的推薦演算法」只是演算法種類里的一種，其他類型演算法也會被產品使用。

在企業層面：沒有一個商場的經理，希望顧客每一次來到商場都只關注同一類別的商品。用戶興趣窄化對於商業化目標並不是一個好的選擇。

博弈：

推薦太強了，關注力量就會弱。抖音沉浸式交互和基於內容的演算法推薦是 kill time 的利器，推薦feed刷的過癮了，你還會去刷關注feed嗎？

共生：

演算法有弊端，關注可以彌補或有所增益。推薦feed是忽略了人"社交性「這個特點，以知乎為例，關注的內容生產者傳遞給我們價值，所以我們需要一個途徑來知道那幾十個或上百的關注對象的產出內容。朋友圈滿足我們窺探的信息需求，也同理。（另外從結果反推過程，大家看一下手裡的B站、知乎、抖音、快手就清楚了）

② 離散頻譜矯正法的綜合比較

離散譽返頻譜矯正法（Discrete Spectrum Correction，DSC）是一種常用的信號分析方法，可以用於處理非平穩信號的譜估計問題。

離散頻譜矯正法的實現過程中需要進行大量的計算，因此演算法的復雜度是一個關鍵的性能指標。研究者們比較了不同演算法的計算復雜度，並探討了如何優化演算法以提高其效率。

3. 演算法的適用性比較

不同的離散頻譜矯擾虛型正法可能適用於不同類型的信號。研究者們比較了不同演算法在處理不同類型的信號時的表現，並探討了演算法的適用范圍。

③ 手機如何矯正視頻扭曲背景

手機如何矯正視頻扭曲背景：
關於背景扭曲矯正演算法的解釋，為了更加清晰，文章正文兒個關鍵點給大家捋一下:
1、輸入原圖。
2、美顏sdk人臉特徵點檢測、背景圖像網格劃分、線段檢測。
3、綜合第二點判斷線段在三角網格的分布。
4、根據第三點來對處理做出判斷:利用斜率保持約束建立優化方程或者利用三角形形狀保持約束建立優
化方程。
5、建立整體最優化目標函數。
6、對應三角形仿射變換。
如果美型前後背景中的直線陸歷斜率保持不變，那麼用戶將不再會明顯地感知到背景扭曲。為此，根據預設規
則在原羨升圖背景中選擇一些特徵點，並利用這些特徵點對背景區域進行三角網格劃分。操作後，這些特兄悉老征點
的位置會發生改變，通過檢測原圖背景中的直線，並以變化前後的直線斜率保持不變以及三角形形狀保持
不變兩個約束建立優化目標函數，最終求得矯正後特徵點的位置。
以上就是美顏sdk中，關於背景扭曲矯正演算法的一些介紹，主要是從保持背景圖像直線斜率不變這個核心
思想入手，在保證基本美型效果下，做到背景圖像不變形，如果您對美顏sdk開發感興趣，歡迎咨詢官方客服。

④ 徑向畸變達到多少需要校正

畸變矯正主要包括徑向畸變和切向畸變

(1)徑向畸變（枕形、桶形）：光線在遠離透鏡中心的地方比靠近中心的地方更加彎曲

(2)切向畸變：透鏡不完全平行於圖像平面，即sensor裝配時與鏡頭間的角度不準

2、徑向畸變矯正原理

(1)矯正前後的坐標映射

輸出圖像(nJ,nI)--（寬高縮放比）->矯正後圖像--（張氏標定法）->矯正前圖像（輸入圖像(fOrgJ,fOrgI)）

(2)映射到原圖的坐標不一定是整數，雙線性插值

舉例：輸出圖像(3,4)映射到輸入圖像(5.25,6.75)

輸出圖像(3,4) = 輸入圖像取(5,6)、(5,7)、(6,6)、(6,7)四點像素值雙線性插值

= 輸入圖像(5+0.25,6+0.75)

= (1-0.25)(1-0.75)f(5,6)+(1-0.25)*0.75*f(5,6+1)+0.25*(1-0.75)f(5+1,6)+0.25*0.75*f(5+1,6+1)

3、徑向畸變矯正演算法偽代碼

張氏標定法

其中(u, v)代表理想無畸變（即矯正後）的像素坐標，(˘u, ˘v)代表實際徑像畸變的情況下（矯正前）的像素坐標，(u0, v0)代表理想無畸變（即矯正後）的圖像主點，(u1, v1)代表實際徑像畸變（即矯正前）的圖像主點。x, y在這里分別代表矯正後圖像中(u, v)點像素分別在行向和列向與主點的距離。

(1)輸入圖像主點（圖像中心點坐標）--（張氏標定法）->矯正後圖像主點（矯正後圖像寬高）--->計算輸出圖像與矯正後圖像寬高縮放比

(2)輸出圖像坐標通過寬高縮放比映射到矯正後圖像坐標

(3)矯正後圖像坐標通過張氏標定法映射到輸入圖像坐標

(4)雙線性插值

4、優化、加速策略

(1)雙線性插值

*源圖像和目標圖像幾何中心對齊

SrcX=(dstX+0.5)* (srcWidth/dstWidth) -0.5
SrcY=(dstY+0.5) * (srcHeight/dstHeight)-0.5

*將浮點運算轉換成整數運算（除法採用移位操作）

*多線程

⑤ 推薦演算法的調優內容主要有什麼

推薦演算法的調優內容包括：
1）基於內容的推薦：這一類一般依賴於自然語言處理NLP的一些知識，通過挖掘文本的TF-IDF特徵向量，來得到用戶的偏好，進而做推薦。這類推薦演算法可以找到用戶獨特的小眾喜好，而且還有較好的解釋性。這一類由於需要NLP的基礎，本文就不多講，在後面專門講NLP的時候再討論。
2）協調過濾推薦：本文後面要專門講的內容。協調過濾是推薦演算法中目前最主流的種類，花樣繁多，在工業界已經有了很多廣泛的應用。它的優點是不需要太多特定領域的知識，可以通過基於統計的機器學習演算法來得到較好的推薦效果。最大的優點是工程上容易實現，可以方便應用到產品中。目前絕大多數實際應用的推薦演算法都是協同過濾推薦演算法。
3）混合推薦：這個類似我們機器學習中的集成學習，博才眾長，通過多個推薦演算法的結合，得到一個更好的推薦演算法，起到三個臭皮匠頂一個諸葛亮的作用。比如通過建立多個推薦演算法的模型，最後用投票法決定最終的推薦結果。混合推薦理論上不會比單一任何一種推薦演算法差，但是使用混合推薦，演算法復雜度就提高了，在實際應用中有使用，但是並沒有單一的協調過濾推薦演算法，比如邏輯回歸之類的二分類推薦演算法廣泛。
4）基於規則的推薦：這類演算法常見的比如基於最多用戶點擊，最多用戶瀏覽等，屬於大眾型的推薦方法，在目前的大數據時代並不主流。
5）基於人口統計信息的推薦：這一類是最簡單的推薦演算法了，它只是簡單的根據系統用戶的基本信息發現用戶的相關程度，然後進行推薦，目前在大型系統中已經較少使用。

⑥ 機器學習一般常用的演算法有哪些

機器學習是人工智慧的核心技術，是學習人工智慧必不可少的環節。機器學習中有很多演算法，能夠解決很多以前難以企的問題，機器學習中涉及到的演算法有不少，下面小編就給大家普及一下這些演算法。

一、線性回歸

一般來說，線性回歸是統計學和機器學習中最知名和最易理解的演算法之一。這一演算法中我們可以用來預測建模，而預測建模主要關注最小化模型誤差或者盡可能作出最准確的預測，以可解釋性為代價。我們將借用、重用包括統計學在內的很多不同領域的演算法，並將其用於這些目的。當然我們可以使用不同的技術從數據中學習線性回歸模型，例如用於普通最小二乘法和梯度下降優化的線性代數解。就目前而言，線性回歸已經存在了200多年，並得到了廣泛研究。使用這種技術的一些經驗是盡可能去除非常相似（相關）的變數，並去除噪音。這是一種快速、簡單的技術。

二、Logistic 回歸

它是解決二分類問題的首選方法。Logistic 回歸與線性回歸相似，目標都是找到每個輸入變數的權重，即系數值。與線性回歸不同的是，Logistic 回歸對輸出的預測使用被稱為 logistic 函數的非線性函數進行變換。logistic 函數看起來像一個大的S，並且可以將任何值轉換到0到1的區間內。這非常實用，因為我們可以規定logistic函數的輸出值是0和1並預測類別值。像線性回歸一樣，Logistic 回歸在刪除與輸出變數無關的屬性以及非常相似的屬性時效果更好。它是一個快速的學習模型，並且對於二分類問題非常有效。

三、線性判別分析（LDA）

在前面我們介紹的Logistic 回歸是一種分類演算法，傳統上，它僅限於只有兩類的分類問題。而LDA的表示非常簡單直接。它由數據的統計屬性構成，對每個類別進行計算。單個輸入變數的 LDA包括兩個，第一就是每個類別的平均值，第二就是所有類別的方差。而在線性判別分析，進行預測的方法是計算每個類別的判別值並對具備最大值的類別進行預測。該技術假設數據呈高斯分布，因此最好預先從數據中刪除異常值。這是處理分類預測建模問題的一種簡單而強大的方法。

四、決策樹

決策樹是預測建模機器學習的一種重要演算法。決策樹模型的表示是一個二叉樹。這是演算法和數據結構中的二叉樹，沒什麼特別的。每個節點代表一個單獨的輸入變數x和該變數上的一個分割點。而決策樹的葉節點包含一個用於預測的輸出變數y。通過遍歷該樹的分割點，直到到達一個葉節點並輸出該節點的類別值就可以作出預測。當然決策樹的有點就是決策樹學習速度和預測速度都很快。它們還可以解決大量問題，並且不需要對數據做特別准備。

五、樸素貝葉斯

其實樸素貝葉斯是一個簡單但是很強大的預測建模演算法。而這個模型由兩種概率組成，這兩種概率都可以直接從訓練數據中計算出來。第一種就是每個類別的概率，第二種就是給定每個 x 的值，每個類別的條件概率。一旦計算出來，概率模型可用於使用貝葉斯定理對新數據進行預測。當我們的數據是實值時，通常假設一個高斯分布，這樣我們可以簡單的估計這些概率。而樸素貝葉斯之所以是樸素的，是因為它假設每個輸入變數是獨立的。這是一個強大的假設，真實的數據並非如此，但是，該技術在大量復雜問題上非常有用。所以說，樸素貝葉斯是一個十分實用的功能。

六、K近鄰演算法

K近鄰演算法簡稱KNN演算法，KNN 演算法非常簡單且有效。KNN的模型表示是整個訓練數據集。KNN演算法在整個訓練集中搜索K個最相似實例（近鄰）並匯總這K個實例的輸出變數，以預測新數據點。對於回歸問題，這可能是平均輸出變數，對於分類問題，這可能是眾數類別值。而其中的訣竅在於如何確定數據實例間的相似性。如果屬性的度量單位相同，那麼最簡單的技術是使用歐幾里得距離，我們可以根據每個輸入變數之間的差值直接計算出來其數值。當然，KNN需要大量內存或空間來存儲所有數據，但是只有在需要預測時才執行計算。我們還可以隨時更新和管理訓練實例，以保持預測的准確性。

七、Boosting 和 AdaBoost

首先，Boosting 是一種集成技術，它試圖集成一些弱分類器來創建一個強分類器。這通過從訓練數據中構建一個模型，然後創建第二個模型來嘗試糾正第一個模型的錯誤來完成。一直添加模型直到能夠完美預測訓練集，或添加的模型數量已經達到最大數量。而AdaBoost 是第一個為二分類開發的真正成功的 boosting 演算法。這是理解 boosting 的最佳起點。現代 boosting 方法建立在 AdaBoost 之上，最顯著的是隨機梯度提升。當然，AdaBoost 與短決策樹一起使用。在第一個決策樹創建之後，利用每個訓練實例上樹的性能來衡量下一個決策樹應該對每個訓練實例付出多少注意力。難以預測的訓練數據被分配更多權重，而容易預測的數據分配的權重較少。依次創建模型，每一個模型在訓練實例上更新權重，影響序列中下一個決策樹的學習。在所有決策樹建立之後，對新數據進行預測，並且通過每個決策樹在訓練數據上的精確度評估其性能。所以說，由於在糾正演算法錯誤上投入了太多注意力，所以具備已刪除異常值的干凈數據十分重要。

八、學習向量量化演算法（簡稱 LVQ）

學習向量量化也是機器學習其中的一個演算法。可能大家不知道的是，K近鄰演算法的一個缺點是我們需要遍歷整個訓練數據集。學習向量量化演算法（簡稱 LVQ）是一種人工神經網路演算法，它允許你選擇訓練實例的數量，並精確地學習這些實例應該是什麼樣的。而學習向量量化的表示是碼本向量的集合。這些是在開始時隨機選擇的，並逐漸調整以在學習演算法的多次迭代中最好地總結訓練數據集。在學習之後，碼本向量可用於預測。最相似的近鄰通過計算每個碼本向量和新數據實例之間的距離找到。然後返回最佳匹配單元的類別值或作為預測。如果大家重新調整數據，使其具有相同的范圍，就可以獲得最佳結果。當然，如果大家發現KNN在大家數據集上達到很好的結果，請嘗試用LVQ減少存儲整個訓練數據集的內存要求

閱讀全文

熱點內容

知道ID密碼怎麼定位發布：2025-04-22 23:34:16 瀏覽：252

c語言采樣發布：2025-04-22 23:30:03 瀏覽：916

資料庫伺服器修改了ip地址發布：2025-04-22 23:25:36 瀏覽：7

c語言基礎案例發布：2025-04-22 23:23:28 瀏覽：693

網路顯示沒有效的ip配置怎麼辦發布：2025-04-22 23:23:23 瀏覽：805

怎麼查身份證密碼發布：2025-04-22 23:12:07 瀏覽：206

如何用伺服器跑github項目發布：2025-04-22 23:10:55 瀏覽：948

ccs編譯dsp程序的指令發布：2025-04-22 23:06:42 瀏覽：369

映射盤符腳本發布：2025-04-22 22:55:35 瀏覽：260

王者榮耀安卓系統怎麼轉換到蘋果發布：2025-04-22 22:53:29 瀏覽：986

糾正演算法推薦

與糾正演算法推薦相關的資訊