不久前,一个主要的即时音频社交软件着火了。
音频社交春天将至?
作为一款以语音为媒介的社交软件,它的玩法非常简单。每个房间都有主持人、嘉宾和观众三个角色。主持人建立房间后,可以和聊天,观众可以旁听,三种身份经主持人同意可以转换,播音员也可以邀请观众进行麦子交流。他们以语音的形式交流,听了就焚烧。这便是典型的实时语音语聊房场景。
那么它的创新点在哪?
1、内容和玩法创新:KOL红人VS.意见领导人
2、KOL红人:草根文化的发展,KOL红人与普通人同样的生活方式,被更多用户消费
3、意见领导人:通过自己多年的积累和影响力,在某个行业完成行业的商品,是行业的明星,有自己的光环,很受欢迎
基于内容、玩法、亚文化圈层创新的音频社交课程,随着5G时代对音频质量的改善和行业的爆炸但是,迅速爆炸的实时音频视频需求仍面临挑战,成熟的音频视频技术体系成为帮助产品快速发展的必要保证,同时音频社交场景产生了新的合规需求,如何保证平台音频内容合规性成为产品稳定发展的必要性。
成熟的技术体系如何?
音频社交的构筑并不复杂,原本看起来非常深刻的音频视频和实时交流技术已经容易访问。
这种复杂的音频社交逻辑,在此进行技术分解。
如同我们针对复杂问题的处理,都会先进行分块处理一样,音频社交的技术架构在业务角度也可拆解为:意见领袖的语音交互、意见领袖的语音处理和粉丝的音频获取三个部分来看:
1、意见领袖的语音交互
在七牛云 QRTC 的实时连麦产品加持下,通过易用的房间创建逻辑建立意见领袖的话题房间,在其他意见领袖的房间加入后,意见领袖们通过线上的连麦房间进行实时的语音互动,并且针对预设话题进行沟通交流。
七牛云的QRTC在开源的WebRTC上,经过自己的研究开发能力和众多客户的验证,保障意见领导们在很多地方,分别在不同的国家,保障通信的实时性,交流延迟只有150ms左右,意见领导人不能见面,但面对面交流
2、意见领导的语音处理
意见领导的语音交流内容经过云优化处理和信息审核后,将流畅的对话语音通过成熟的直播发布网络对外发布。
在这样的云处理过程中,可以保障意见领导们交流信息的完整性,也可以完成信息内容的筛选和优化。
3、粉丝语音获取
在七牛云直播功能的承载下,意见领导们的交流信息,通过语音的形式呈现在粉丝们的耳边。让意见领袖的粉丝们像在房间里听自己偶像们的声音一样。
同时,客户积累了多年的技术,使听众处于不同的网络环境中,可以以最好的用户体验获得意见领袖们的对话声音。
那么,从访问的角度来看,聊天室的访问是怎样的呢?
1、意见领导方的研究开发访问:
发表声音track:监听和收集意见领导人的声音信息,与其他意见领导人的通话
结帐:实现意见领导人退房后的多方感知
结束后的资源回收
2、服务方业务逻辑处理:
意见领导完成房间创建和入住等操作后,服务方通过以下3个步骤的处理,实现多个意见领导通话内容的直播推进逻辑:
访问服务方的SDK,完成鉴定权逻辑的支持
完成回调逻辑的支持,处理不同房间事件的通知
3、粉丝方面的收听访问:
粉丝方面的七牛云也提供了Android、iOS等不同版本的播放器SDK的支持,引进了不同系统的粉丝收听支持监督下的内容审查
随着国内政策对网络平台发言管理的规范化,社交平台面临的内容审查也越来越严格。与传统的音频内容审查相比,语音聊天场景中的多人实时语音在线审查非常复杂,特别是日常生活高的社交产品,语音内容审查成本和难易度高。语音审查除了基本的文本分类技术外,还有
语音识别:网络语音场景伴随着强背景音、语速快、咬字不清、口音严重等3个基本技术问题,与普通场景相比,语音识别难易度倍增
NLP:政治、色情、谩骂等违反声音表现变化多端,内容模糊,对语义理解的要求极高
语音识别:呻吟、哮喘等色情况内容容易混杂在对话、歌声、背景中七牛云为实时音频流程的内容审查场景提供色情/广告/相关政治/违反等内容的识别和喘息优艾设计网_Photoshop论坛类声音的识别能力。此外,提供两种访问方式,帮助客户提高审查效率,净化网络环境:
广播审查API-适用于广播场景。实时监测,3 秒内返回结果;
文件审核 API - 适用于语音消息、文件、短视频。可以做到先审后发。
音频社交的快速发展得益于语音与文字等传统社交介质的不同优势,对于情绪恰到好处的传达,七牛云作为国内领先一站式云平台即服务(PaaS)提供商,为此类产品提供一整套成熟的音频技术体系与合规技术解决方案,有效助力客户专注业务创新获得快速增长。
精彩评论