榜单排行算法
① APP 排名算法
当前常见的一些排行榜类型:
1、(累计)排行榜
如果笼统的说排行榜,一般指累计排行榜,一段时间内累计下载或安装的应用排行。这个榜单能够很好的反映出用户的历史行为数据,但你可以想象,排行榜内容几乎是不变的,微信QQ支付宝长期占据头条,因此用户查看的频率会比较低。
2、飙升榜(新锐榜)
飙升榜是基于每日新增下载app的榜单,便于用户及时发现新凸显的app。飙升帮的特点是每天每时都在变动,吸引用户高频度的查看。
3、个性榜
个性榜本质上属于内容推荐,根据用户的下载/安装过的内容进行的相关推荐。特点是榜单内容定制化,各个用户看到的内容不相同,更具针对性。
4、好友榜
基于好友下载内容的推荐,和个性版类似,但是需要用户账号体系支撑。
综上,目前常见的榜单主要分3类,基于下载量、新增下载量和个人历史推荐。其中,基于下载量、新增下载量又可以按照app类型(游戏/社交/音乐···)、用户地域和性别纬度来细分。
算法
最早我以为既然目标清晰了,那么直接用下载量、新增量排序的结果就是榜单。那么会存在问题,例如:
新app每日下载量10到1000的下载量,新增100倍,微信从40000到43000,新增比例不到10%。如果仅以增量作为飙升榜单的依据,可能出现的情况是榜单被知名度很高的app占领,那这样榜单就没有意义。所以对飙升榜来说,一定要通过某种算法,削弱高下载量app比重。
同时,榜单中一般会插入广告,如果不是在固定位置插入广告的话,需要通过算法尽可能将广告app的位置排前,毕竟广告收入是应用分发渠道商的主要收入来源。
算法模型
假设有X、Y、Z3个纬度,跟别代表app搜索量、app打开率和是否广告,那么算法公式f=aX+bY+cZ,其中abc表示各个纬度的系数,且a+b+c=1。通过不断的优化abc的值,就有可能得到收益最明显的热搜排行榜数据
② 鐭ヨ瘑锲捐氨钬滀笘鐣屾澂钬濇滃崟鎻鏅掳纴搴﹀皬婊TranS绠楁硶鍒锋柊涓栫晫绾褰
https://ogb.stanford.e/docs/leader_linkprop/#ogbl-wikikg2
OGB鏄鏂鍧︾忓ぇ瀛﹀彂甯幂殑锲介檯鐭ヨ瘑锲捐氨锘哄嗳鏁版嵁闆嗭纴涔熸槸锲剧炵粡缃戠粶棰嗗烟链𨱒冨▉銆佹渶鍏锋写鎴樻х殑钬灭珵鎶鍦衡濓纴姣忓勾Meta锛埚师Facebook锛夈佽挋鐗瑰埄灏斿ぇ瀛︺佽殏铓侀噾链嶃佺戝ぇ璁椋炵瓑浼楀氶《绾х爷绌舵満鏋勫拰浼佷笟閮戒细鍓嶆潵鍙傝禌銆
鍦ㄨ繖鍦衡滈珮镓嬩簯闆嗏濈殑锲介檯绔炶禌涓锛屽害灏忔弧鏁版嵁鏅鸿兘閮ˋI-Lab锲㈤槦鎻愬嚭鍒涙柊镐х煡璇嗗浘宓屽叆(KGE)妯″瀷TranS锛屽埛鏂颁简OGBL-Wikikg2锘哄嗳鏁版嵁闆嗘渶楂樿板綍銆傝ュ洟阒熻〃绀簑ikikg2锲炬暟鎹瑙勬ā宸ㄥぇ锛岃缁冭凯浠f椂闂撮暱锛屽湪鍒嗘暟浼桦寲绌洪棿宸叉帴杩戞瀬闄愮殑𨱍呭喌涓嬶纴浠栦滑浠呬娇鐢╒100-16G鏄惧瓨镄凣PU灏辨墦璐ヤ简鍏朵粬浣跨敤A100-40G镄勫洟阒熴
搴﹀皬婊$殑AI鍐呭姛
锲剧炵粡缃戠粶灏辨槸锲炬暟鎹涓庣炵粡缃戠粶镄勭粨钖堛傚叾涓锛屽浘鏁版嵁鍙浠ョ亩鍗旷悊瑙d负涓绉岖嫭鐗逛俊鎭琛ㄧ幇褰㈠纺钬斺斿浘镄勬疮涓鑺傜偣鐪嫔仛鏄涓绉嶅疄浣掳纴姣斿备竴涓鐢ㄦ埛銆佷竴涓鍟嗗搧锛屾垨钥呬竴涓浜嬩欢锛屽浘镄勮竟鍒栾〃绀轰笉钖屽疄浣揿拰浜嬩欢涔嬮棿镄勫叧绯汇
锲炬暟鎹鍦ㄧ幇瀹炰笘鐣屾棤澶勪笉鍦锛岄珮搴︾粨鏋勫寲镄勫浘鏁版嵁褰㈡垚浜嗗签澶х殑鐭ヨ瘑锲捐氨锛岃繖绉岖煡璇呜〃绀哄舰寮忥纴涓篈I绯荤粺鎻愪緵浜嗗彲瀛︿範镄勫厛楠岀煡璇嗭纴鑳藉熻幏寰楀勭悊澶嶆潅浠诲姟镄勮兘锷涖傚洜姝わ纴锲剧炵粡缃戠粶绠楁硶鍦ㄩ噾铻嶉庢带棰嗗烟链夌潃骞挎硾镄勫簲鐢ㄥ墠鏅銆
姣斿傞噾铻嶉庢带棰嗗烟寰寰渚濊禆浜庡ぇ閲忕殑鏂囨湰淇℃伅锛岃屽疄闄呬笂杩桦瓨鍦ㄧ潃澶ч噺镄勭粨鏋勫寲镄勭煡璇嗗浘璋变俊鎭寰呴庢带妯″瀷浣跨敤銆傚逛簬锘轰簬绁炵粡缃戠粶镄勯庢带妯″瀷𨱒ヨ达纴濡备綍灏嗙绘暎镄勫浘淇℃伅杞鎹㈡垚杩炵画镄勫悜閲忚〃绀哄崄鍒嗛吨瑕併傝岄氲繃TranS妯″瀷鍙浠ユ湁鏁堟彁鍗囧浘缁撴瀯涓瀹炰綋鍜屽叧绯荤殑琛ㄧず鏁堟灉锛岃繘钥屾寲鎺樻綔钘忕殑澶嶆潅鍏崇郴锛屾彁鍗囬庢带妯″瀷镄勫嗳纭搴︿笌鍖哄垎搴︺
搴炲ぇ鏁版嵁閲忥纴鏄閲戣瀺琛屼笟AI鍖栫殑澶╃劧浼桦娍锛屼絾鏁版嵁镄勫嶆潅镐э纴澶氱淮镐э纴浠ュ强闅愮佺瓑闂棰树篃涓洪噾铻崭紒涓氩甫𨱒ヤ简涓嶅皬镄勬写鎴樸傚害灏忔弧AI-Lab锲㈤槦钖屽﹁〃绀猴纴锲剧炵粡缃戠粶鎶链锛岃兘澶熷府锷╄屼笟闄嶆湰澧炴晥銆佽В鍐虫暟鎹瀛ゅ矝鍜屽畨鍏ㄩ梾棰桡纴鍦ㄦ櫤鑳借幏瀹銆佹櫤鑳介庢带銆佹櫤鑳界粡钀ャ佹櫤鑳芥満鍣ㄤ汉绛夊簲鐢ㄦ柟闱㈠彂鎸ョ潃閲嶈佷綔鐢ㄣ
鍦ㄥ浘绁炵粡缃戠粶涔嫔栵纴搴﹀皬婊AI-Lab鍦ㄦ繁搴﹀︿範銆佽$畻链鸿呜夈佽嚜铹惰瑷澶勭悊锛屽寘𨰾鏂囨湰钖戦噺鍖栥佹枃链鍒嗙被銆佷俊鎭鎶藉彇绛夋柟钖戜笂涔熸棭链夊竷灞銆傚幓骞3链堬纴璇ュ洟阒熷嚟鍊烡ML绠楁硶銮峰缑MSMARCO锲介檯姣旇禌涓鏂囨。鎺掑簭浠诲姟镄勫啝鍐涖傚幓骞12链堬纴璇ュ洟阒熷张镰斿彂浜呜僵杈(XuanYuan)棰勮缁冩ā鍨嬶纴鍦ㄥ浗闄呮潈濞佹祴璇勫熀鍑咰LUE1.1姒滃崟涓銆屽姏铡嬬兢闆勚嶆柀銮风涓锛岃窛绂讳汉绫昏〃鐜颁粎宸3.38鍒嗐
钬沧湭𨱒ュ害灏忔弧AI-Lab锲㈤槦灏嗙户缁锲寸粫鐭ヨ瘑锲捐氨琛ュ叏銆佸疄浣揿归绨绛夊叿浣挞梾棰桦𪾢寮娣卞叆镰旂┒锛屽悓镞跺吋椤炬洿骞夸箟镄勫浘缃戠粶鍦ㄩ噾铻嶉庢带鏂瑰悜镄勫簲鐢锛屽笇链涢氲繃璇稿傜ぞ浜ゅ叧绯汇佷氦鏄揿叧绯汇佸湴鐞嗗叧绯荤瓑淇℃伅鏋勫缓镄勫ぇ瑙勬ā锲剧绣缁滐纴杩愮敤锲剧炵粡缃戠粶绛夌畻娉曟彁鍗囨ā鍨嫔湪淇$敤椋庨橹璇勪及鍜屽弽娆鸿痪绛夋柟闱㈢殑浣跨敤鏁堟灉銆傗濆害灏忔弧鏁版嵁鏅鸿兘閮ㄨ礋璐d汉𨱒ㄩ潚璇淬