搜狗陈伟:AI与人协同是目前内容生产最佳方式

【环球网智能综合报道】移动互联网下半场,AI会为内容行业带来什么?未来的内容行业是什么样子?12月21日,腾讯芒种特训营公开大课在北京举行,搜狗语音交互技术中心首席科学家陈伟出席活动,并带来以“搜狗智能语音技术,助力内容生产更高效”为主题的演讲,分享AI技术如何助力内容生产全流程,为观众带来启示和思考。

“从素材准备、内容生产到结果检查,AI通过配合人或代替人的方式,参与到内容生产的各个流程中。”陈伟指出,AI早已通过文字、图像、语音、视频等载体,出现在我们的生活中。不管是《小冰诗集》,或各式各样的图片编辑器、AI谱曲小程序,还是搜狗首推的合成主播,AI+内容生产的应用早已不足为奇。

“然而,AI水平仍处于弱人工智能的阶段,内容生产过程中,AI与人协同工作是目前最佳的方式,AI能够有效提升内容生产的效率。”搜狗以人工智能技术赋能内容生产全流程,助力内容生产更高效。在分享中,陈伟深入浅出地解释人工智能领域的专业词汇,“字错率越高,语音识别准确性越低,其准确率还受说话者自身的口音、讲话方式等多个方面的影响。”并带来多项搜狗黑科技演示,以形象化的方式带领观众认识搜狗AI技术对内容生产全流程的助力。

“俗话说父母在,不远游……”,屏幕上随着主播无声的播报打出了实时字幕,原来这就是搜狗唇语识别技术,“唇语识别能直接从视频中识别出人讲话的内容。”陈伟介绍,搜狗语音识别、唇语识别,以及结合二者而成的多模态识别技术,大大提高了识别的准确率,以技术化的方式提高信息采集的效率,助力内容生产的准备阶段。

在生产阶段,搜狗语音翻译技术和以语音合成技术为核心的搜狗分身,则能够辅助作者进行高效丰富的表达。“腾讯新闻一年一度的合作伙伴大会——腾讯芒种特训营公开大课在北京举行”,屏幕上播报现场新闻的声音可萌可御,不断变化,让现场观众大为惊讶,这便是搜狗语音合成技术,能将任意文字转化为清晰自然、富有表现力的语音朗读,还能实现个性化合成和情感迁移。此外,现场最吸引眼球的无疑是一条以当日会议为内容的新闻视频,活动还没结束,这么快就出新闻了?这便是搜狗分身的表现形式之一——“AI合成主播”,仅需输入文字,片刻即可生成主持人播报新闻的音视频内容,与真人播报无异。

此外,结果检查阶段,搜狗文本顺滑技术则能将口语化的语言变为书面化的表达方式,解决了内容生产中表达过于口语化或语义不清的问题,提升了生成内容的质量。

陈伟表示,一直以来,搜狗坚持以语言为核心的自然交互和知识计算,让表达和获取信息更简单,而内容是信息的一种载体。通过领先的人工智能技术,搜狗以技术赋能,助力内容生产更高效。他认为,好的AI产品应该同时具备满足用户刚需,操作稳定,同时简洁、有趣又方便的特点,“未来,搜狗希望把技术应用到更多的产品和场景中,更好地服务内容产业。”

相关新闻

    接下来

      推荐阅读