首页 > 生活服务 > 正文

微软又在开发新技术:教会AI看图讲故事

  • 科客网
  • 2022-06-16 15:14
  • 34
摘要:  科客点评:相比国内动不动的“黑科技”,这样的科技才是改变生活的根本。  微软的研究人员又有新的脑洞,他们想让计算机以人工智能的方式,把几张图片里发生的事情给

  科客点评:相比国内动不动的“黑科技”,这样的科技才是改变生活的根本。

  微软的研究人员又有新的脑洞,他们想让计算机以人工智能的方式,把几张图片里发生的事情给讲述出来。今天,他们已将发表了关于这项技术的学术论文,旨在为了视觉损伤人士提供具体的图片信息。

  这项技术非常有意义,这不仅仅是远超之前的图片描述(Image Caption)技术。根据微软研究员Margaret Mitchell的说法,这项技术不仅可以描述出照片的背景,而且还可以告诉你,在照片里,什么样的人正在做了什么事。这是基于深度学习(deep learning)理论而开发的,之前微软也把这种理论应用到语音识别和机器翻译。目前,谷歌、Facebook和其他公司也在积极参与这项研究。

  为了改善这个领域的现状,微软依赖人工把单张图片的标题内容和特定的图片顺序写出来。工程师再利用已有的信息教会机器,把图片序列发生的事情复述出来。如上图所示,单个图片显示出来的信息是一群年轻人围着桌子坐一起,而经过序列处理后,描述出一群人在享受互相聊天的美好时光。

  如果这项技术能顺利推出,这无疑将为盲人辨识视频和图片信息的道路上迈出了一大步。关注科客网官方微信kekebat,获取更多精彩资讯。(文/Poplar)