首页 > 分享 > AI技术+短视频于苏宁易购电商平台的应用实践

AI技术+短视频于苏宁易购电商平台的应用实践

AI应用起源

2016年开始,出现大量涉黄视频和版权问题视频,主要来源是企业上传视频。期间编辑审核速度不快,运营投诉,法务部门的反馈都让技术团队不得不抽出时间应对。我们需要花出额外的时间来人工校验,封禁账号。

经过一段时间的经验积累和应对措施调整,AI在视频审核的应用需求被提上日程。

机器审核需求演化

需求初期专门针对视频机器审核做了可行性分析,对目标的可操作性进行了论证,最终确认使用人工智能来做这件事情,并且调研和测试了卷积神经网络在这方面的应用,实际测试中也应用了深度学习框架来验证效果。

业务系统整合阶段让机器审核作为分布式服务部署,同时和人工审核服务并行存在,避免审核错误,并且纠正后的结果可以作为训练数据。

评估预测结果是个不断迭代,可持续的过程,在实际应用中,演化出了不同业务特性使用不同的模型。

机器审核工作流

该工作流分为两层:上层为业务流程,下层为机器审核服务流程。

业务流程的输入项为视频文件,转换为视频全图作为机器审核服务的输入项。

机器审核服务对视频全图做特征处理,如重复检测等等,再输入到训练模型中给出结果预测,结果预测会输出到业务流程中,由人工审核监督。

训练模型会进行定期评估和调整,已适应不断变化的业务需求。

机器审核服务实践

在测试阶段参与测试的视频总量达数千万,所占存储约3PB。

测试视频的分类丰富,主要有电商类、体育类、文化类、企业多元化视频。电商类视频包括苏宁易购商品介绍视频,商品评价视频,社区视频等不同场景类型内容;体育类视频有直播录制视频,赛事讲解视频等等;文化类包含多种娱乐性视频,资讯类视频,PGC专业性内容视频等;企业上传视频是分类最多,场景最丰富的区域。

上面示例是苏宁易购的视频全景图,采用固定间隔截图,默认是6秒钟间隔一张,如果是高度敏感内容,可以调整为1秒钟间隔一张;缩略图采用10x10排列,一共100张一个全景,超过的部分用新的全景排列。

有了可测试数据源后,我们对主流AI框架做了调研和测试。选型的测试框架有Caffe、Keras、TensorFlow,结合我们的实际需求,确定了使用Caffe作为机器审核的基础AI框架,第一个测试阶段的数据集抽取了ImageNet的部分分类做验证,再使用准备好的视频数据做进一步准确性测试。

上图是一个普通神经网络的示例图,有输入层、隐藏层、输出层,实际应用中层数和链接都会做调整。

这是一个AlexNet模型,是两个GPU的使用场景,能清晰的看到输入层是一个 224x224x3的图像输入,划分为小图是11x11,移动步长为4;长方体是卷积核,比如3x3,5x5,还有深度;最后是三个全链接层,还有卷基层中间的池化层,起降维作用,减少参数输入,最终输出是100个类别;在我们实际使用的时候调整了类别个数。

这是一个VGG16模型,我们的目标检测使用了Faster RCNN,VGG16一共16层,有13个卷积层和3个全链接层,实际测试中比AlexNet准确率更高,但是速度要慢一点,所以会应用中存量视频或及时性要求不高的视频审核上。

从图上可以很形象的看出池化层(max pooling)的参数降维作用,并且激活函数和AlexNet相同,都使用了ReLU,输出层类别也是1000个。

在我们使用卷积神经网络过程中也需要针对结果准确性做调试,这时候就需要反卷积算法帮助,来反查我们判断错误的内容是从那一层开始出错的,如下图是一个VGG16模型的卷积过程和反卷积过程。

下图是我们业务系统集成示例,一共有两个模式:业务增量视频上传接入、扫描处理历史数据;业务系统讲视频上传至存储管理系统中,由存储管理系统来分发审核任务,并且获取审核结果,机器审核分布式服务订阅任务队列,处理完任务后反馈结果到存储管理系统,整个过程实时性较高。

除了机器审核对视频的动态监测,我们还使用了其他运维工具来保障服务访问的稳定性。如苏宁云迹作为自研系统,可以满足故障分析和基础报警需求;ELK和TICK作为辅助工具可以定制更多的业务类型监测和报警。

短视频加速智能调度

随着业务越来越多,资源越来越丰富,我们需要针对不同服务做不同级别的保障,所以提出了智能调度的需求。和机器审核类似,也经历了三大过程,采用TensorFlow框架,不同类型的数据类型和输出策略。

作为预测数据来源,我们一共分为三大类型:全网监测数据、基调网络数据和业务预置策略。全网监测数据来自自建CDN节点详细数据记录,商业融合CDN可以使用节点日志数据,基调网络数据可以更详细,基于LastMile,可以获取nslookup结果,ping结果,traceroute结果,终端下载耗时,下载速度,视频buffer等等,加上业务预置边界策略,可以推荐调度策略供业务使用。

责任编辑:

相关知识

智能电商新未来:AI技术在电商平台的深度应用与发展趋势
2024中国电商网站排名:盘点中国电商平台的TOP15
电商资讯:拼多多百亿补贴首轮“超级加倍补”订单量超1640万单...
AI对电商的改变,不会止步于直播
零售电商周报
2023年中国鲜花电商行业市场规模、存在的问题及消费者画像「图」 花卉电商是花卉零售借助电商模式发展的一大创新,逐步成为花卉零售行业关键渠道。按照模式划分,我国花卉电商可分为B2B模式、...
鲜花电商发展趋势预测分析 2024
新华指数|花木传统电商平台销售量占比高 新电商平台涨势显著
2023年中国鲜花电商行业市场规模、存在的问题及消费者画像「图」
2023年中国鲜花电商行业深度分析及投资战略咨询

网址: AI技术+短视频于苏宁易购电商平台的应用实践 https://m.huajiangbk.com/newsview849233.html

所属分类:花卉
上一篇: 用韦尔奇的T2模型指导电商系统选
下一篇: B2C电子商务网站分析与设计