直播鉴黄算法
‘壹’ 实时音视频是否支持实时鉴黄
答案是肯定支持的,像腾讯旗下的产品都可以。一般的网络直播都可以,就看平台的态度。阿里、网络的ai都可以实时鉴黄。
‘贰’ 阿里云推出“直播实时鉴黄”功能,老司机们怎么看
2016年各大直播平台如雨后春笋般涌入中国人的日常生活,迅速成为社交APP的新宠儿,目前市场上的直播软件数量已高达200多家,可以说,今年是直播行业最为火热的一年。
毫无疑问的是,移动直播大幅解放了视频内容的生产力,五花八门的内容瞬间占领了我们的视线。直播迅猛发展的同时,也带来了相应的弊端。对于主播行业来说,门槛低的特性也非常明显,主播素质良莠不齐,甚至频频出现涉黄事件。
由于涉黄问题,甚至有一部分直播平台因此被责令停业整顿。可以说涉黄视频对直播行业来说是一大毒瘤。
对于解决涉黄问题,有三个加大的难点。第一是鉴定违法难:比如,女主播直播吃香蕉到底算不算涉黄?如果算,那么,男主播直播吃冰棍就不涉黄了?有时候,什么是涉黄本身也还没有规定清楚。
第二是违法成本低:之前很火的斗鱼直播“造人事件”,两度共计被罚款6万元,没收违法所得15.74万元,这对于服务器成本一个月就上千万的故意涉黄直播平台来说,几乎等于没有惩罚。
3)经济利益大:与此同时,由于“造人事件”而带来的传播度和下载量,令直播平台愿意自己主动去做一些事情。的确,色情内容是快速拉动人气和产品各项数据最好的方式。有的平台甚至会把涉黄事件当作一种手段,为融资、上市制造噱头。
而此次阿里推出的“直播实时鉴黄”功能,可以实时截图监黄,对于整个直播行业都有着巨大的规范作用,让打击涉黄犯罪的技术门槛得到极大的降低。
‘叁’ 如何快速搭建一个完整的移动直播系统
移动直播行业的火热会在很长一段时间内持续,通过和各行业的整合,从而成为具有无限可能性的行业。主要因为以下三个原因:
第一,移动直播的UGC生产模式比PC端的直播更明显,人人都有设备,随时随地开播,完全顺应了互联网时代的开放性原则,能刺激更多人去创造和传播优质内容。
第二,网络带宽和速度在逐渐提高,网络成本在逐渐下降,为移动直播提供一个极佳的发展环境。文字、声音、视频、游戏等都会在移动直播中呈现,创造出更加丰富的用户体验。直播可以以SDK的形式接入到自己的应用中,比如,教育领域中的课后辅导完全可以以直播的形式开展业务、电商也可借助直播让用户挑选商品,促进销售。
第三,一个与VR/AR技术相结合的移动直播为整个行业的未来提供了新的发展空间。VR/AR直播能够让用户身临其境,带动主播与观众更贴切真实的互动,大大提高平台的用户参与度。
当下,有技术实力和流量优势的互联网从业者都不愿错过直播这个风口,如何快速搭建一个直播系统成了大家关心的问题,我想和大家分享下我的经验。我从事于一家直播产品开发商,我们的产品为了快速赶上市场,并没有自己完全去自己做,而是使用了趣拍云服务提供的直播SDK。
从业者都知道,一个完整直播产品应该包含以下环节:推流端(采集、前处理、编码、推流),服务端处理(转码、录制、截图、鉴黄),播放器(拉流、解码、渲染)、互动系统(聊天室、礼物系统、赞)。 下面我就一一讲述下直播SDK在各个环节所做的工作。
一、移动直播推流端需要做哪些工作?
直播推流端即主播端,主要通过手机摄像头采集视频数据和麦克风采集音频数据,经过一系列前处理、编码、封装,然后推流到CDN进行分发。
1、采集
移动直播SDK通过手机摄像头和麦克风直接采集音视频数据。其中,视频采样数据一般采用RGB或YUV格式、音频采样数据一般采用PCM格式。采集到的原始音视频的体积是非常大的,需要经过压缩技术处理来提高传输效率。
2、前处理
在这个环节主要处理美颜、水印、模糊等效果。美颜功能几乎是直播的标配功能。我们调研中发现太多case是因为没有美颜功能被抛弃使用的。另外国家明确提出了,所有直播都必须打有水印并回放留存15天以上。
美颜实际上是通过算法去识别图像中的皮肤部分,对皮肤区域进行色值调整。通过颜色对比找到皮肤区域,可以进行色值调整、添加白色图层或调整透明度等来等来达到美白效果。在美颜处理方面,最着名的GPUImage提供了丰富的效果,同时可以支持iOS和Android,支持自己写算法实现自己最理性的效果。GPUImage内置了120多种常见滤镜效果,添加滤镜只需要简单调用几行代码就可以了。
3、编码
为了便于手机视频的推流、拉流以及存储,通常采用视频编码压缩技术来减少视频的体积,现在比较常用的视频编码是H.264。在音频方面,比较常用的是用AAC编码格式,其它如MP3、WMA也是可选方案。视频经过编码压缩大大提高了视频的存储和传输效率,当然,经过压缩后的视频在播放时必须进行解码。
相较于之前的H.264,2012年诞生的H.265编解码标准有了相当大的改善,做到了仅需要原来一半带宽即可播放相同质量的视频,低于1.5Mbps的网络也能传输1080p的高清视频。像阿里云、金山云都在推自己的H.265编解码技术,随着直播的快速发展和对带宽的依赖,H.265编解码技术已有全面取代H.264的趋势。
H264和H265个模块技术差异:
另外,硬件编码已经成为移动直播的首选方案,软编码处理在720p以上的视频颓势非常明显。在iOS平台上硬件编码的兼容性比较好,可以直接采用,但在 Android 平台上,MediaCodec 编码器针对不同的芯片平台表现差异还是非常大的,要完全实现全平台兼容的成本还是非常高的。
4、推流
要想用于推流还必须把音视频数据使用传输协议进行封装,变成流数据。常用的流传输协议有RTSP、RTMP、HLS等,使用RTMP传输的延时通常在1–3秒,对于移动直播这种实时性要求非常高的场景,RTMP也成为移动直播中最常用的流传输协议。最后通过一定的Qos算法将音视频流数据推送到网络断,通过CDN进行分发。在直播场景中,网络不稳定是非常常见的,这时就需要Qos来保证网络不稳情况下的用户观看直播的体验,通常是通过主播端和播放端设置缓存,让码率均匀。另外,针对实时变化的网络状况,动态码率和帧率也是最常用的策略。
当然,在网络传输方面全部自己来做基本不现实,找提供推流服务的CDN服务商提供解决方案是最好的选择,可参考文章开头介绍的云视频服务商。据了解,阿里云是国内唯一能自研CDN缓存服务器的厂商,性能非常有保障。当然,大多数直播平台都会同时接入多个视频云服务提供商,这样可以做拉流线路互备,对推流后视频集群再进行优化也可提高直播的流畅性和稳定性。
二、服务端处理需要做哪些工作?
要想适配各终端和平台,服务端还需要对流进行转码,如支持RTMP、HLS、FLV等格式拉流,支持一路转多路适配不同网络和分辨率的终端设备。
1、截图、录制、水印
像阿里云等云服务商都提供了实时转码技术,将用户推流码率较高(比如720P)实时转化成较低清晰度(比如360P)的流以适应播放端的需求。如果要自己搭建实时转码系统,这个成本是极高的,一台8核设备只能实时转10路流,如果一个正常的直播平台有1000路流,就需要100台设备,加上后期的运维成本,一般公司就吃不消了。
2、鉴黄
2016年4月14日,文化部查出了斗鱼、虎牙、YY、熊猫TV、六间房、9158等涉嫌提供含宣扬淫秽、暴力、教唆犯罪的网络直播平台,被列入查处名单。政府介入管制有利于直播行业打造健康的生态,进入良性发展。这也意味着为了安全直播产品鉴黄成了必需环节,使用技术手段去鉴黄是移动直播平台必然采用的方案。
市面上提供鉴黄服务的方案主要有两种,第一种是对视频进行截图,然后对图片进行鉴黄,返回鉴黄结果和分值。典型的企业有阿里(绿网)、图谱科技,他们目前都支持直接传入视频,经过服务端分析返回结果。通常由业务系统接入鉴黄服务,根据鉴黄结果对直播流进行控制,如切断直播流、封禁账号等。第二种是和CDN结合,直接对直播流进行分析,识别结果分为色情、疑似色情、性感和正常,业务系统根据识别结果直接控制直播流。典型的企业是Viscovery,这套方案的优点是实时性保证比较好,缺点是必须部署到CDN或自己的机房,使用成本相对高一些。
还有像趣拍云服务这种一站式直播解决方案提供商,他们的做法是,用户只需在控制台对鉴黄服务进行配置就可以针对每个应用、每一路直播流进行实时审核。在控制台中,趣拍视频云服务实时将鉴黄结果返回,用户可以直接查看色情直播和违规界面的截图,同时可以对直播流进行控制,切断问题直播流。该服务商还提供了短信、邮件和站内信功能,避免漏掉任何一个非法视频,给平台造成损失,我们就使用了这种方式。
三、播放器端需要做哪些工作?
在播放器端如何做到秒开,直播过程中保证画面和声音清晰度的同时,稳定、流程、无卡顿的直播流量,这些工作都需要播放器端配合服务端来做优化,做到精确调度。
1、拉流
拉流实际是推流的逆过程。首先通过播放端获取码流,标准的拉流格式有RTMP、HLS、FLV等。RTMP是Adobe的专利协议,开源软件和开源库都支持的比较好,如开源的librtmp库,播放端只要支持flashPlayer的就能非常简单的播放RTMP直播,直播延迟一般在1–3秒。HLS是苹果提出的基于HTTP的流媒体传输协议,HTML5可以直接打开播放,通过微信、QQ等软件分享出去,用户也可以直接观看直播,可以说移动直播app,HLS拉流协议是必须支持的,缺点是延迟通常大于10秒。FLV(HTTP-FLV)协议是使用HTTP协议传输流媒体内容的一个协议,也不用担心被Adobe的专利绑架,直播延迟同样可以做到1–3秒。
各拉流协议的差异:
我们使用的趣拍视频云服务的直播拉流技术提供了以上三种格式,满足不同业务场景的需求,如对即时性要求较高或有互动需求的可以采用RTMP或FLV格式进行直播拉流播放;对于有回放或跨平台需求的,推荐使用HLS。当然,三种协议是可以同时使用的,分别用到自己的场景就可以了。
2、解码和渲染
拉流获取封装的视频数据后,必须通过解码器解码、渲染后才能在播放器上播放。它是编码的逆过程,是指从音视频的数据中提取原始数据。前面介绍的H.264和H.265编码格式都是有损压缩,所以在提取后的原始数据,并非原始采样数据,存在一定的信息丢失。因此,在视频体积最小的情况下通过各种编码参数保留最好的原始画面,成为了各视频公司的核心机密。
考虑对高清的支持,解码肯定还是要选择硬解码的。前面介绍过,iOS系统由于硬件比较单一、比较封闭,支持的比较好,Android系统由于平台差异非常大,编解码要完全兼容各平台还需要很多工作要做。
四、移动直播中的交互系统
移动直播中最常见的交互有聊天室(弹幕)、点赞、打赏和礼物等,交互系统涉及消息的实时性和互动性,在技术实现上大多是使用IM的功能来实现的。对于在线人数比较多的房间,弹幕消息量是非常大,主播与用户其实都看不过来,为了缓解服务器压力,在产品策略需要做一些必要的优化。
1、聊天室
移动直播中的弹幕交互是用户和主播互动的主要方式,实际上就是IM中的聊天室功能。聊天室和群聊功能类似,但聊天室的消息是不需要分发给不在线的用户的,历史消息也不需要查看,用户只有进入聊天室后才能查看聊天消息和群成员信息。面对复杂多变的网络状况,还需要根据用户位置就近选择近对应运营商的单线机房接入弹幕消息服务,让弹幕更及时。
2、礼物系统
礼物系统更是绝大多数移动直播平台的标配了,它是这些平台主要的收入来源。送礼物的形式也增强了用户和主播之间的互动交流,也是主播依赖平台的最主要原因。
礼物的收发在技术实现上也是用聊天室接口做的,通常采用IM中的自定义消息实现,当用户收到或发送礼物时将自定义消息对应的礼物图形渲染出来。
以上就是我们在使用了第三方SDK服务后总结出来的直播产品经验,希望能帮助到创业者和从业者们。
蒋先生(微信号love-drunk-hard),直播行业老兵。
‘肆’ 在抖蓝直播上什么情况下会被封号
涉黄,反动,淫秽,邪教。不文明语言。发布其他平台广告这些都会被封
‘伍’ 一对一直播系统开发是如何实现的
您好,很高兴回答您的问题:
据我的经验,一对一直播系统开发有两种实现方式,分别是定制开发和源码二开,前者可供想象的空间更大,后者性价比更高。
一对一直播系统开发
一对一直播系统开发需要四大原材料:
1、 程序员作为人力成本
2、 服务器作为硬件承载
3、 三方账号负责分担工作量
4、 CDN负责加速分发
一对一直播系统开发需要注意什么:
最需要注意的就是鉴黄系统要做好,平台风气也要拉正,一对一直播系统开发很简单,但是运营起来可不是那么容易的事情。
‘陆’ 抖音直播的三大考核依据
抖音直播的三大考核依据是:停留(直播间点击率、平均停留时长)、互动(点赞、评论、转发、关注、打赏)、转化(小黄车点击率、下单成交率、千次观看成交金额)。
因为你的视频/直播间,刚开始都是青铜级别,要在低的流量池接受考察,如果上述三要素表现不错,打败了一堆青铜中的青铜,就会晋升到下一个流量池,成为一名白银战士。
如果在众多白银选手中胜出,你又可以继续晋升黄金、铂金、直至王者;如果不幸失败,那么很可能你就只能停留在白银这个级别了;如果屡败屡战,就可能降级到青铜。
并且需要说明的是,算法是抖音吃饭的看家本领,原则上来说是个“黑盒”,根本不可能公开的,同时也是在不断调整的。
抖音直播广告佳时间是几点:
1、起床后上班前时间段:早上7点到9点,是人们起床后进入上班状态的时间段,用户会利用吃早餐的时间或者搭车上班的时候刷抖音消遣提神。
2、午休时间段:中午12-13点是人们的午休时间段,忙活了一个上午的工作或者学习后,很多用户会利用午饭时间刷抖音缓解疲劳。
3、下班时间段:下午17-18点是学生放学和上班族结束一天工作的时间,在放学和下班路上,最愉快的方式就是刷抖音了。
4、入睡前时间段:晚上21-23点是人们准备入睡的时间,躺在床上最不费脑又可以获得短暂消遣获得入睡前的娱乐方式非抖音莫属。
5、周末休息时间:周末不用上学或者上班,有大段空闲的时间可以自由支配,除了逛街、吃饭,当代最多年轻人选择的娱乐方式无疑是刷抖音。
‘柒’ 一对一直播系统源码都有哪些功能开发
、多终端同步功能
直播初的诞生是在PC端,但是随着现代智能手机的普及和移动网络的进步,手机端成为了直播观看的大平台,直播系统如今也可以实现PC端、Android端与iOS端三端互通,均可开播观看,这也是直播系统发展客户的基本功能;
2、多渠道注册/登录
登录
随着微信、微博的火热,直播系统的登陆已经不仅仅限于手机验证码、QQ注册登录,微博微信也成为新的主流的登录方式,甚至通过Twitter、Facebook也可注册登录;
3、多渠道充值/提现
目前支付宝、微信支付基本占据了现在中国移动支付的整个市场,一套优秀的直播系统源码必定离不开这两种支付方式的接口,其次,能否接入四方支付接口也是考验直播系统源码的一个重要因素;
4、聊天互动及弹幕功能
一对一直播系统之所以如此火爆,正是因为粉丝可以发送弹幕或私信给主播,拉近了主播与粉丝之间的距离。实时弹幕是主播与粉丝交流的主要方式,实际上就是IM聊天中的聊天室功能,不需要查看历史消息只有在线用户可以实时看到聊天信息。由于网络状况复杂且不稳定,还要根据用户位置选择较近的对应运营商的单线机房,来保证弹幕的实时性;
5、多渠道分享
多渠道分享类似于多渠道注册/登陆,通过主流的社交平台将直播间分享出去,与好友分享,增加乐趣。同时,分享也是直播间增长人气,引爆流量的主要方式;
6、直播画面高清流畅
直播画面是影响观众观感的条件,直播画面追求高清流畅。目前主流的直播系统开发商的直播源码一般支持720P的视频流,客户也可以根据自身要求提高相应的码率,提高平台粉丝的观看体验,吸引粉丝;
7、送礼打赏功能
送礼打赏基本上是每个直播平台一定存在的功能,是主播与平台主要的经济来源。送礼打赏也是增加主播与粉丝互动的一个重要方式,增加主播与粉丝的亲密度;
开播/送礼打赏
8、美颜功能
美颜是直播系统中很重要的一个功能,也是主播吸引粉丝的一个很重要手段。美颜实际上是通过算法识别图像中的皮肤部分,对皮肤部分进行色值调整;
9、录播回看
支持直播视频的存储、回放,让粉丝不会错过喜爱的主播;
10、自动鉴黄、快速停播
为了健康的直播环境,使用技术手段直播鉴黄是直播系统的必须环节。市场上目前提供的鉴黄方案有两种:一种是截图鉴黄,通常由业务系统接入鉴黄服务,如切断视频流、禁播等;另一种是与CDN结合,一对一直接对视频流进行分析,实时性比较好,但成本较高一些。当然以上这些功能是直播平台应具备的基础功能,基于强大的一对一直播系统源码,只有实现了这些基础功能,才会给用户带来直播互动体验。
‘捌’ 腾讯的“万象鉴黄智能识别”工作原理是什么
高识别精度,但是仍然对计算量有很高的要求。而近年来,得益于计算机速度的提升、大规模集群技术的兴起、GPU的应用以及众多优化算法的出现,耗时数月的训练过程可缩短为数天甚至数小时,深度学习才逐渐可以用于工业化。
(以上资料参考Deep Learning(深度学习)学习笔记整理系列之(一))
下面为了便于非专业人士理解,我会尽量用通俗易懂的语言来回答:
以智能鉴黄为例,把用来鉴黄的机器想象成一个刚出生的宝宝。
首先人们会给机器宝宝一些标记过的图片,告诉宝宝这些是色情的,这些是性感的,还有这些是正常的。机器宝宝很聪明,会根据提供的数据学习到不同类型图片的基本特征,自己总结出一套规律,这样当你再给宝宝新的图片时,宝宝就会根据这些特征来判定图片的类型。
当然机器宝宝也会有出错的时候,因为人类对于色情的定义实在太广泛了。露点的、性暗示的、艺术的......在不同的场景下,面对不同的人群,对于色情的鉴定标准也会不同。想让机器宝宝像人一样准确,甚至比人还准,就需要利用海量的数据去不断地训练它,让机器不断纠正错误,学习到更多的特征。
‘玖’ 图普科技的鉴黄这项能不能审核视频
可以。图普会给客户会提供抽帧算法,根据视频长度不同在视频中截N张图,封入压缩包后继续调用云平台API审核就可以了。
‘拾’ 人工智能鉴黄的原理是什么
人工智能鉴黄是通过深度学习目标检测、图像分类、特征检索等技术对图像中的局部和全局信息进行分析,捕获不同类型的色情内容,此外系统还会通过OCR、标志识别、水印检测等技术手段协助判断隐藏在图像视频中的敏感内容,包括色情微信推广、色情APP、个人联系方式等。
在算法类型上,图像识别中最常见的就是图像分类算法,从AlexNet到VGG,从ResNet到DenseNet,目前的图像分类算法可以较为准确地区分ImageNet的1000类数据,鉴黄本身也是对输入图像做分类,因此采用图像分类算法就是顺其自然的事。
其次,目标检测算法可以用来检测色情图像中的露点部位,也是比较可靠的手段。此外,还有基于业务层面构造的特征和逻辑,比如是否有人、皮肤的面积等,用来辅助判断,在一些情况下确实是有效的。
鉴黄的历史:
在计算机的“远古时代”,其实也就是十几年前吧,我们识别黄图的做法简单粗暴:人工审核。别小看了这个方法,其实针对当时的网络环境(带宽小,产品少,图片数据也少),效果还是很不错的。一天几万的图片量,安排几个人肉眼盯着看,发现有不良的图片人工删掉就好了。
后来,互联网产品普及率高了,网络数据量暴增,一个产品一天出现几百万的图片量也是很正常的情况,这个时候想要靠堆人力去完成审核几乎不可能了。幸好相应的计算机视觉技术也有进步了,我们用肤色识别算法过滤掉一些没那么多“黄色”内容的图片,剩下的再进入到人工审核,可以大大节约审核量。据统计,经过机器肤色识别过滤后大约只有20%的图片还需要人工审核。
等到移动互联网普及,各种类型的网络数据量暴增,人工审核连20%的数据量也无法承受了,加上视频、直播等业务和数据的爆发式增长,迫切需要一个更加有效的方案来解决审核的问题。很自然的,我们也紧跟人工智能的技术热潮开始研发机器学习的鉴黄系统,并且取得了显着成果。