当前位置:科技 > 业界 > 正文

机器人会写稿了 何时学会编视频

2017-08-24 14:59:29       来源:科技日报

几位来自人工智能行业的专家分享完毕后,主持人把问题抛给苏州市广播电视总台总工程师郭昌雄:“他们把人工智能描述得这么好,您对‘人工智能+媒体’有什么期待?”

“现在已经有机器人写稿了,但是还没有机器人可以真正的编视频。”在近日开幕的2017媒体融合发展论坛上,作为广播电视界的媒体代表,郭昌雄说出了对人工智能的“另一种”需求。

的确,人工智能可以写体育赛事、写股市消息,甚至播报九寨沟的地震,但是在新闻领域,它需要做的可不止这些。

已经有媒体开始探索将人工智能应用于视频处理。“现在媒体素材面临的问题是,如何对视频画面进行自动描述,为以后的检索使用提供便利。比如在海量视频数据中自动把关于花草树木的视频找出来。”郭昌雄说,这必须考虑人工智能。

苏州市广播电视总台能够实现的是,将长达17万小时的视频资源,用人工智能进行自动编目。也就是按照国家视频编目标准,对视频中的关键帧进行识别和定义。除此之外,这家媒体还实现了利用人工智能对视频资源进行高速检索,甚至可以将新闻类视频按照内容自动剪切成一段段的短视频。

“我们最近研发了一个视频索引技术,把人工智能对图像、语音、自然语言的处理,全部融合到对视频的处理过程当中。”微软(中国)有限公司资深架构师罗彤介绍了人工智能界的努力。其效果是,可以自动识别视频中的特定人物,并将其作为索引加以标注。同时还可以将视频中的对话识别成文字,再通过关键字识别对视频内容进行定义。

对于郭昌雄的期待,商汤科技高级研究总监张伟回应,他们公司正在探索视频摘要技术,也就是把长视频中的精彩镜头剪辑出来,供观众快速浏览视频。“这样的技术进展很快,半年之内就可以落地。”张伟说。

罗彤告诉科技日报记者,人工智能对视频进行处理,本质上都是对图像进行处理,因为视频本身是由若干帧图像组成的。目前能够做到的识别视频中的人物,一般依靠人脸识别技术,以及对人物体态的追踪来实现。一些媒体尝试的对视频关键帧的定义,靠的则是人工智能对视频场景转换规律或画面主要内容的判断。对视频进行摘要的原理与此也有类似之处。

“这些视频处理是非常局部的。”罗彤介绍,理论上可以通过训练深度学习网络模型,用特定方法来对特定类型的素材进行整体上的剪辑。但是这种剪辑方式并不具备“普适性”,换一种素材或剪辑方式,就需要重新训练网络模型,这正是目前人工智能技术存在的不足。

另外,正如人工智能处理语言文字时会遭遇语义理解的难题,人工智能在处理视频时遇到的困难是:如何理解视频画面所传达的内涵,甚至根据画面的上下文把握视频的“画外之音”。

“这个确实非常难。”罗彤承认,通过视频素材来讲故事并表达一定的思想和主题,与艺术创作类似,是人类高智力的表现。“让人工智能做到像导演和视频剪辑师一样,恐怕还很遥远。”(记者 刘园园)

科学 猎奇 娱乐 游戏 汽车 手游 金融 家居

新闻频道
国内国际社会评论文史专题经济新闻图库老照片
军事频道
军事要闻中国军情国际军情军事历史网友原创军事专题军事图库武器装备军事文化
汽车频道
车闻Update漫话车型漫记车映像实拍解析行业动态新车资讯独家评测汽车生活人文之旅
教育频道
留学移民高考中小学拒讲堂师说商道商论
游戏频道
游点意思网络游戏网页游戏单机游戏手机游戏军事游戏游戏产业发号中心游戏美女图说游戏囧游囧事
科技频道
业界互联网行业通信数码手机平板IT硬件相机笔记本家电产品库
旅游频道
X旅行视界目的地 美图发现社区
文化频道
专题非遗沙龙历史艺文博览读书图库书画禅文化
书画频道
资讯收藏展览在线展厅艺术家视觉专题
体育频道
国际足球中国足球NBACBA 综合体育图片汇总专题策划
视频频道
新闻军事中华出品原创娱乐纪录片微电影决胜海陆空
娱乐频道
明星电影电视音乐专题图库论坛
公益频道
老兵出镜老兵动态老兵资料库关爱老兵在行动公益组织公益人物
城市频道
城市聚焦城市设计城市生活城市策划城 市图赏城市加盟城市论坛
社区频道
中华论坛网上谈兵中华拍客社会时政国际风云生活消费休闲旅游美丽女人娱乐八卦经济风云情感世界文学天地
好医生频道
保健养生疾病防治行业资讯名医谈健康 医生专栏食疗跑步
经济频道
国内宏观海外经济产经商贸时尚消费电商眼球儿企业故事专栏评说识局经济