直播鑒黃演算法
『壹』 實時音視頻是否支持實時鑒黃
答案是肯定支持的,像騰訊旗下的產品都可以。一般的網路直播都可以,就看平台的態度。阿里、網路的ai都可以實時鑒黃。
『貳』 阿里雲推出「直播實時鑒黃」功能,老司機們怎麼看
2016年各大直播平台如雨後春筍般湧入中國人的日常生活,迅速成為社交APP的新寵兒,目前市場上的直播軟體數量已高達200多家,可以說,今年是直播行業最為火熱的一年。
毫無疑問的是,移動直播大幅解放了視頻內容的生產力,五花八門的內容瞬間佔領了我們的視線。直播迅猛發展的同時,也帶來了相應的弊端。對於主播行業來說,門檻低的特性也非常明顯,主播素質良莠不齊,甚至頻頻出現涉黃事件。
由於涉黃問題,甚至有一部分直播平台因此被責令停業整頓。可以說涉黃視頻對直播行業來說是一大毒瘤。
對於解決涉黃問題,有三個加大的難點。第一是鑒定違法難:比如,女主播直播吃香蕉到底算不算涉黃?如果算,那麼,男主播直播吃冰棍就不涉黃了?有時候,什麼是涉黃本身也還沒有規定清楚。
第二是違法成本低:之前很火的斗魚直播「造人事件」,兩度共計被罰款6萬元,沒收違法所得15.74萬元,這對於伺服器成本一個月就上千萬的故意涉黃直播平台來說,幾乎等於沒有懲罰。
3)經濟利益大:與此同時,由於「造人事件」而帶來的傳播度和下載量,令直播平台願意自己主動去做一些事情。的確,色情內容是快速拉動人氣和產品各項數據最好的方式。有的平台甚至會把涉黃事件當作一種手段,為融資、上市製造噱頭。
而此次阿里推出的「直播實時鑒黃」功能,可以實時截圖監黃,對於整個直播行業都有著巨大的規范作用,讓打擊涉黃犯罪的技術門檻得到極大的降低。
『叄』 如何快速搭建一個完整的移動直播系統
移動直播行業的火熱會在很長一段時間內持續,通過和各行業的整合,從而成為具有無限可能性的行業。主要因為以下三個原因:
第一,移動直播的UGC生產模式比PC端的直播更明顯,人人都有設備,隨時隨地開播,完全順應了互聯網時代的開放性原則,能刺激更多人去創造和傳播優質內容。
第二,網路帶寬和速度在逐漸提高,網路成本在逐漸下降,為移動直播提供一個極佳的發展環境。文字、聲音、視頻、游戲等都會在移動直播中呈現,創造出更加豐富的用戶體驗。直播可以以SDK的形式接入到自己的應用中,比如,教育領域中的課後輔導完全可以以直播的形式開展業務、電商也可藉助直播讓用戶挑選商品,促進銷售。
第三,一個與VR/AR技術相結合的移動直播為整個行業的未來提供了新的發展空間。VR/AR直播能夠讓用戶身臨其境,帶動主播與觀眾更貼切真實的互動,大大提高平台的用戶參與度。
當下,有技術實力和流量優勢的互聯網從業者都不願錯過直播這個風口,如何快速搭建一個直播系統成了大家關心的問題,我想和大家分享下我的經驗。我從事於一家直播產品開發商,我們的產品為了快速趕上市場,並沒有自己完全去自己做,而是使用了趣拍雲服務提供的直播SDK。
從業者都知道,一個完整直播產品應該包含以下環節:推流端(採集、前處理、編碼、推流),服務端處理(轉碼、錄制、截圖、鑒黃),播放器(拉流、解碼、渲染)、互動系統(聊天室、禮物系統、贊)。 下面我就一一講述下直播SDK在各個環節所做的工作。
一、移動直播推流端需要做哪些工作?
直播推流端即主播端,主要通過手機攝像頭採集視頻數據和麥克風採集音頻數據,經過一系列前處理、編碼、封裝,然後推流到CDN進行分發。
1、採集
移動直播SDK通過手機攝像頭和麥克風直接採集音視頻數據。其中,視頻采樣數據一般採用RGB或YUV格式、音頻采樣數據一般採用PCM格式。採集到的原始音視頻的體積是非常大的,需要經過壓縮技術處理來提高傳輸效率。
2、前處理
在這個環節主要處理美顏、水印、模糊等效果。美顏功能幾乎是直播的標配功能。我們調研中發現太多case是因為沒有美顏功能被拋棄使用的。另外國家明確提出了,所有直播都必須打有水印並回放留存15天以上。
美顏實際上是通過演算法去識別圖像中的皮膚部分,對皮膚區域進行色值調整。通過顏色對比找到皮膚區域,可以進行色值調整、添加白色圖層或調整透明度等來等來達到美白效果。在美顏處理方面,最著名的GPUImage提供了豐富的效果,同時可以支持iOS和Android,支持自己寫演算法實現自己最理性的效果。GPUImage內置了120多種常見濾鏡效果,添加濾鏡只需要簡單調用幾行代碼就可以了。
3、編碼
為了便於手機視頻的推流、拉流以及存儲,通常採用視頻編碼壓縮技術來減少視頻的體積,現在比較常用的視頻編碼是H.264。在音頻方面,比較常用的是用AAC編碼格式,其它如MP3、WMA也是可選方案。視頻經過編碼壓縮大大提高了視頻的存儲和傳輸效率,當然,經過壓縮後的視頻在播放時必須進行解碼。
相較於之前的H.264,2012年誕生的H.265編解碼標准有了相當大的改善,做到了僅需要原來一半帶寬即可播放相同質量的視頻,低於1.5Mbps的網路也能傳輸1080p的高清視頻。像阿里雲、金山雲都在推自己的H.265編解碼技術,隨著直播的快速發展和對帶寬的依賴,H.265編解碼技術已有全面取代H.264的趨勢。
H264和H265個模塊技術差異:
另外,硬體編碼已經成為移動直播的首選方案,軟編碼處理在720p以上的視頻頹勢非常明顯。在iOS平台上硬體編碼的兼容性比較好,可以直接採用,但在 Android 平台上,MediaCodec 編碼器針對不同的晶元平台表現差異還是非常大的,要完全實現全平台兼容的成本還是非常高的。
4、推流
要想用於推流還必須把音視頻數據使用傳輸協議進行封裝,變成流數據。常用的流傳輸協議有RTSP、RTMP、HLS等,使用RTMP傳輸的延時通常在1–3秒,對於移動直播這種實時性要求非常高的場景,RTMP也成為移動直播中最常用的流傳輸協議。最後通過一定的Qos演算法將音視頻流數據推送到網路斷,通過CDN進行分發。在直播場景中,網路不穩定是非常常見的,這時就需要Qos來保證網路不穩情況下的用戶觀看直播的體驗,通常是通過主播端和播放端設置緩存,讓碼率均勻。另外,針對實時變化的網路狀況,動態碼率和幀率也是最常用的策略。
當然,在網路傳輸方面全部自己來做基本不現實,找提供推流服務的CDN服務商提供解決方案是最好的選擇,可參考文章開頭介紹的雲視頻服務商。據了解,阿里雲是國內唯一能自研CDN緩存伺服器的廠商,性能非常有保障。當然,大多數直播平台都會同時接入多個視頻雲服務提供商,這樣可以做拉流線路互備,對推流後視頻集群再進行優化也可提高直播的流暢性和穩定性。
二、服務端處理需要做哪些工作?
要想適配各終端和平台,服務端還需要對流進行轉碼,如支持RTMP、HLS、FLV等格式拉流,支持一路轉多路適配不同網路和解析度的終端設備。
1、截圖、錄制、水印
像阿里雲等雲服務商都提供了實時轉碼技術,將用戶推流碼率較高(比如720P)實時轉化成較低清晰度(比如360P)的流以適應播放端的需求。如果要自己搭建實時轉碼系統,這個成本是極高的,一台8核設備只能實時轉10路流,如果一個正常的直播平台有1000路流,就需要100台設備,加上後期的運維成本,一般公司就吃不消了。
2、鑒黃
2016年4月14日,文化部查出了斗魚、虎牙、YY、熊貓TV、六間房、9158等涉嫌提供含宣揚淫穢、暴力、教唆犯罪的網路直播平台,被列入查處名單。政府介入管制有利於直播行業打造健康的生態,進入良性發展。這也意味著為了安全直播產品鑒黃成了必需環節,使用技術手段去鑒黃是移動直播平台必然採用的方案。
市面上提供鑒黃服務的方案主要有兩種,第一種是對視頻進行截圖,然後對圖片進行鑒黃,返回鑒黃結果和分值。典型的企業有阿里(綠網)、圖譜科技,他們目前都支持直接傳入視頻,經過服務端分析返回結果。通常由業務系統接入鑒黃服務,根據鑒黃結果對直播流進行控制,如切斷直播流、封禁賬號等。第二種是和CDN結合,直接對直播流進行分析,識別結果分為色情、疑似色情、性感和正常,業務系統根據識別結果直接控制直播流。典型的企業是Viscovery,這套方案的優點是實時性保證比較好,缺點是必須部署到CDN或自己的機房,使用成本相對高一些。
還有像趣拍雲服務這種一站式直播解決方案提供商,他們的做法是,用戶只需在控制台對鑒黃服務進行配置就可以針對每個應用、每一路直播流進行實時審核。在控制台中,趣拍視頻雲服務實時將鑒黃結果返回,用戶可以直接查看色情直播和違規界面的截圖,同時可以對直播流進行控制,切斷問題直播流。該服務商還提供了簡訊、郵件和站內信功能,避免漏掉任何一個非法視頻,給平台造成損失,我們就使用了這種方式。
三、播放器端需要做哪些工作?
在播放器端如何做到秒開,直播過程中保證畫面和聲音清晰度的同時,穩定、流程、無卡頓的直播流量,這些工作都需要播放器端配合服務端來做優化,做到精確調度。
1、拉流
拉流實際是推流的逆過程。首先通過播放端獲取碼流,標準的拉流格式有RTMP、HLS、FLV等。RTMP是Adobe的專利協議,開源軟體和開源庫都支持的比較好,如開源的librtmp庫,播放端只要支持flashPlayer的就能非常簡單的播放RTMP直播,直播延遲一般在1–3秒。HLS是蘋果提出的基於HTTP的流媒體傳輸協議,HTML5可以直接打開播放,通過微信、QQ等軟體分享出去,用戶也可以直接觀看直播,可以說移動直播app,HLS拉流協議是必須支持的,缺點是延遲通常大於10秒。FLV(HTTP-FLV)協議是使用HTTP協議傳輸流媒體內容的一個協議,也不用擔心被Adobe的專利綁架,直播延遲同樣可以做到1–3秒。
各拉流協議的差異:
我們使用的趣拍視頻雲服務的直播拉流技術提供了以上三種格式,滿足不同業務場景的需求,如對即時性要求較高或有互動需求的可以採用RTMP或FLV格式進行直播拉流播放;對於有回放或跨平台需求的,推薦使用HLS。當然,三種協議是可以同時使用的,分別用到自己的場景就可以了。
2、解碼和渲染
拉流獲取封裝的視頻數據後,必須通過解碼器解碼、渲染後才能在播放器上播放。它是編碼的逆過程,是指從音視頻的數據中提取原始數據。前面介紹的H.264和H.265編碼格式都是有損壓縮,所以在提取後的原始數據,並非原始采樣數據,存在一定的信息丟失。因此,在視頻體積最小的情況下通過各種編碼參數保留最好的原始畫面,成為了各視頻公司的核心機密。
考慮對高清的支持,解碼肯定還是要選擇硬解碼的。前面介紹過,iOS系統由於硬體比較單一、比較封閉,支持的比較好,Android系統由於平台差異非常大,編解碼要完全兼容各平台還需要很多工作要做。
四、移動直播中的交互系統
移動直播中最常見的交互有聊天室(彈幕)、點贊、打賞和禮物等,交互系統涉及消息的實時性和互動性,在技術實現上大多是使用IM的功能來實現的。對於在線人數比較多的房間,彈幕消息量是非常大,主播與用戶其實都看不過來,為了緩解伺服器壓力,在產品策略需要做一些必要的優化。
1、聊天室
移動直播中的彈幕交互是用戶和主播互動的主要方式,實際上就是IM中的聊天室功能。聊天室和群聊功能類似,但聊天室的消息是不需要分發給不在線的用戶的,歷史消息也不需要查看,用戶只有進入聊天室後才能查看聊天消息和群成員信息。面對復雜多變的網路狀況,還需要根據用戶位置就近選擇近對應運營商的單線機房接入彈幕消息服務,讓彈幕更及時。
2、禮物系統
禮物系統更是絕大多數移動直播平台的標配了,它是這些平台主要的收入來源。送禮物的形式也增強了用戶和主播之間的互動交流,也是主播依賴平台的最主要原因。
禮物的收發在技術實現上也是用聊天室介面做的,通常採用IM中的自定義消息實現,當用戶收到或發送禮物時將自定義消息對應的禮物圖形渲染出來。
以上就是我們在使用了第三方SDK服務後總結出來的直播產品經驗,希望能幫助到創業者和從業者們。
蔣先生(微信號love-drunk-hard),直播行業老兵。
『肆』 在抖藍直播上什麼情況下會被封號
涉黃,反動,淫穢,邪教。不文明語言。發布其他平台廣告這些都會被封
『伍』 一對一直播系統開發是如何實現的
您好,很高興回答您的問題:
據我的經驗,一對一直播系統開發有兩種實現方式,分別是定製開發和源碼二開,前者可供想像的空間更大,後者性價比更高。
一對一直播系統開發
一對一直播系統開發需要四大原材料:
1、 程序員作為人力成本
2、 伺服器作為硬體承載
3、 三方賬號負責分擔工作量
4、 CDN負責加速分發
一對一直播系統開發需要注意什麼:
最需要注意的就是鑒黃系統要做好,平台風氣也要拉正,一對一直播系統開發很簡單,但是運營起來可不是那麼容易的事情。
『陸』 抖音直播的三大考核依據
抖音直播的三大考核依據是:停留(直播間點擊率、平均停留時長)、互動(點贊、評論、轉發、關注、打賞)、轉化(小黃車點擊率、下單成交率、千次觀看成交金額)。
因為你的視頻/直播間,剛開始都是青銅級別,要在低的流量池接受考察,如果上述三要素表現不錯,打敗了一堆青銅中的青銅,就會晉升到下一個流量池,成為一名白銀戰士。
如果在眾多白銀選手中勝出,你又可以繼續晉升黃金、鉑金、直至王者;如果不幸失敗,那麼很可能你就只能停留在白銀這個級別了;如果屢敗屢戰,就可能降級到青銅。
並且需要說明的是,演算法是抖音吃飯的看家本領,原則上來說是個「黑盒」,根本不可能公開的,同時也是在不斷調整的。
抖音直播廣告佳時間是幾點:
1、起床後上班前時間段:早上7點到9點,是人們起床後進入上班狀態的時間段,用戶會利用吃早餐的時間或者搭車上班的時候刷抖音消遣提神。
2、午休時間段:中午12-13點是人們的午休時間段,忙活了一個上午的工作或者學習後,很多用戶會利用午飯時間刷抖音緩解疲勞。
3、下班時間段:下午17-18點是學生放學和上班族結束一天工作的時間,在放學和下班路上,最愉快的方式就是刷抖音了。
4、入睡前時間段:晚上21-23點是人們准備入睡的時間,躺在床上最不費腦又可以獲得短暫消遣獲得入睡前的娛樂方式非抖音莫屬。
5、周末休息時間:周末不用上學或者上班,有大段空閑的時間可以自由支配,除了逛街、吃飯,當代最多年輕人選擇的娛樂方式無疑是刷抖音。
『柒』 一對一直播系統源碼都有哪些功能開發
、多終端同步功能
直播初的誕生是在PC端,但是隨著現代智能手機的普及和移動網路的進步,手機端成為了直播觀看的大平台,直播系統如今也可以實現PC端、Android端與iOS端三端互通,均可開播觀看,這也是直播系統發展客戶的基本功能;
2、多渠道注冊/登錄
登錄
隨著微信、微博的火熱,直播系統的登陸已經不僅僅限於手機驗證碼、QQ注冊登錄,微博微信也成為新的主流的登錄方式,甚至通過Twitter、Facebook也可注冊登錄;
3、多渠道充值/提現
目前支付寶、微信支付基本占據了現在中國移動支付的整個市場,一套優秀的直播系統源碼必定離不開這兩種支付方式的介面,其次,能否接入四方支付介面也是考驗直播系統源碼的一個重要因素;
4、聊天互動及彈幕功能
一對一直播系統之所以如此火爆,正是因為粉絲可以發送彈幕或私信給主播,拉近了主播與粉絲之間的距離。實時彈幕是主播與粉絲交流的主要方式,實際上就是IM聊天中的聊天室功能,不需要查看歷史消息只有在線用戶可以實時看到聊天信息。由於網路狀況復雜且不穩定,還要根據用戶位置選擇較近的對應運營商的單線機房,來保證彈幕的實時性;
5、多渠道分享
多渠道分享類似於多渠道注冊/登陸,通過主流的社交平台將直播間分享出去,與好友分享,增加樂趣。同時,分享也是直播間增長人氣,引爆流量的主要方式;
6、直播畫面高清流暢
直播畫面是影響觀眾觀感的條件,直播畫面追求高清流暢。目前主流的直播系統開發商的直播源碼一般支持720P的視頻流,客戶也可以根據自身要求提高相應的碼率,提高平台粉絲的觀看體驗,吸引粉絲;
7、送禮打賞功能
送禮打賞基本上是每個直播平台一定存在的功能,是主播與平台主要的經濟來源。送禮打賞也是增加主播與粉絲互動的一個重要方式,增加主播與粉絲的親密度;
開播/送禮打賞
8、美顏功能
美顏是直播系統中很重要的一個功能,也是主播吸引粉絲的一個很重要手段。美顏實際上是通過演算法識別圖像中的皮膚部分,對皮膚部分進行色值調整;
9、錄播回看
支持直播視頻的存儲、回放,讓粉絲不會錯過喜愛的主播;
10、自動鑒黃、快速停播
為了健康的直播環境,使用技術手段直播鑒黃是直播系統的必須環節。市場上目前提供的鑒黃方案有兩種:一種是截圖鑒黃,通常由業務系統接入鑒黃服務,如切斷視頻流、禁播等;另一種是與CDN結合,一對一直接對視頻流進行分析,實時性比較好,但成本較高一些。當然以上這些功能是直播平台應具備的基礎功能,基於強大的一對一直播系統源碼,只有實現了這些基礎功能,才會給用戶帶來直播互動體驗。
『捌』 騰訊的「萬象鑒黃智能識別」工作原理是什麼
高識別精度,但是仍然對計算量有很高的要求。而近年來,得益於計算機速度的提升、大規模集群技術的興起、GPU的應用以及眾多優化演算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,深度學習才逐漸可以用於工業化。
(以上資料參考Deep Learning(深度學習)學習筆記整理系列之(一))
下面為了便於非專業人士理解,我會盡量用通俗易懂的語言來回答:
以智能鑒黃為例,把用來鑒黃的機器想像成一個剛出生的寶寶。
首先人們會給機器寶寶一些標記過的圖片,告訴寶寶這些是色情的,這些是性感的,還有這些是正常的。機器寶寶很聰明,會根據提供的數據學習到不同類型圖片的基本特徵,自己總結出一套規律,這樣當你再給寶寶新的圖片時,寶寶就會根據這些特徵來判定圖片的類型。
當然機器寶寶也會有出錯的時候,因為人類對於色情的定義實在太廣泛了。露點的、性暗示的、藝術的......在不同的場景下,面對不同的人群,對於色情的鑒定標准也會不同。想讓機器寶寶像人一樣准確,甚至比人還准,就需要利用海量的數據去不斷地訓練它,讓機器不斷糾正錯誤,學習到更多的特徵。
『玖』 圖普科技的鑒黃這項能不能審核視頻
可以。圖普會給客戶會提供抽幀演算法,根據視頻長度不同在視頻中截N張圖,封入壓縮包後繼續調用雲平台API審核就可以了。
『拾』 人工智慧鑒黃的原理是什麼
人工智慧鑒黃是通過深度學習目標檢測、圖像分類、特徵檢索等技術對圖像中的局部和全局信息進行分析,捕獲不同類型的色情內容,此外系統還會通過OCR、標志識別、水印檢測等技術手段協助判斷隱藏在圖像視頻中的敏感內容,包括色情微信推廣、色情APP、個人聯系方式等。
在演算法類型上,圖像識別中最常見的就是圖像分類演算法,從AlexNet到VGG,從ResNet到DenseNet,目前的圖像分類演算法可以較為准確地區分ImageNet的1000類數據,鑒黃本身也是對輸入圖像做分類,因此採用圖像分類演算法就是順其自然的事。
其次,目標檢測演算法可以用來檢測色情圖像中的露點部位,也是比較可靠的手段。此外,還有基於業務層面構造的特徵和邏輯,比如是否有人、皮膚的面積等,用來輔助判斷,在一些情況下確實是有效的。
鑒黃的歷史:
在計算機的「遠古時代」,其實也就是十幾年前吧,我們識別黃圖的做法簡單粗暴:人工審核。別小看了這個方法,其實針對當時的網路環境(帶寬小,產品少,圖片數據也少),效果還是很不錯的。一天幾萬的圖片量,安排幾個人肉眼盯著看,發現有不良的圖片人工刪掉就好了。
後來,互聯網產品普及率高了,網路數據量暴增,一個產品一天出現幾百萬的圖片量也是很正常的情況,這個時候想要靠堆人力去完成審核幾乎不可能了。幸好相應的計算機視覺技術也有進步了,我們用膚色識別演算法過濾掉一些沒那麼多「黃色」內容的圖片,剩下的再進入到人工審核,可以大大節約審核量。據統計,經過機器膚色識別過濾後大約只有20%的圖片還需要人工審核。
等到移動互聯網普及,各種類型的網路數據量暴增,人工審核連20%的數據量也無法承受了,加上視頻、直播等業務和數據的爆發式增長,迫切需要一個更加有效的方案來解決審核的問題。很自然的,我們也緊跟人工智慧的技術熱潮開始研發機器學習的鑒黃系統,並且取得了顯著成果。