首个图像识别软件诞生用图片定位文件提升搜索效率

分析测试百科网 > 行业资讯 > 项目成果

首个图像识别软件诞生用图片定位文件提升搜索效率

2014.11.20

　　达特茅斯大学的研究人员开发了一个人工智能软件，在互联网上使用图片来搜索定位文件，这比以往的文件搜索具有更大的准确性。

　　这个新系统，最初是用图片来搜索定位的，现在也可以应用视频文件，首次显示出机器学习图片识别和检索算法的技术已经成熟，足以提高大量文档的在线搜索效率。该系统采用图像和视频数据而不是文本进行文件的搜索定位。这个系统通过学习基于文本的图像搜索结果，从而在搜索阶段学会识别像素。从这些结果中学到的知识，再应用到其它的那些没有标签或标题的图片文件上，使文件的搜索结果更加准确。

　　该研究结果发表在《PAMI》杂志上（IEEE交易模式分析与机器智能）。

　　“图片在互联网上随处可见，我们这个方法意味着在文件搜索时他们将不再被忽略。”这项研究的作者之一，副教授Lorenzo Torresani说，“在过去30年里，互联网已经从一个以文本文件为主的小集合，发展为现代化、大规模、快速增加的多媒体数据集，几乎每一个页面都包括多个图片或视频。当一个人浏览网页的时候，他得到的第一眼信息是图片带给他的。但令人惊讶的是，所有现在流行的搜索引擎，包括谷歌和Bing，都去掉图片中包含的信息，并使用专门的文本网页执行文件检索。我们的研究首次表明现代机器视觉系统是准确和高效的，能够有效利用图片像素中的信息提高文件搜索效率。”

　　研究人员设计和测试了机器视觉系统（人工智能的一个种类），让计算机在没有明确程序的情况下，从网页图片的像素中提取语义信息。当用搜索引擎搜索文件时，这些信息能够丰富HTML页面的描述。研究人员在拥有5000万网页的数据库中执行了600多次搜索查询来测试他们的方法。他们选择了效率最高的文本搜索引擎，并将它修改用来搜索网页图片中提取的额外的语义信息。他们发现这个方法比之前完全的文本搜索精度提高了30%。

搜索文件文本网页

喜欢作者我要约稿

首个图像识别软件诞生用图片定位文件提升搜索效率

中国科学家研发“新眼睛”搜索自杀式袭击者

CNNIC发布《2012年中国网民搜索行为研究报告》

雅虎推出搜索浏览服务Axis

类似Google的蛋白功能搜索引擎研究进展

周锦帆

喜欢作者

打赏方式

首个图像识别软件诞生 用图片定位文件提升搜索效率

中国科学家研发“新眼睛”搜索自杀式袭击者

CNNIC发布《2012年中国网民搜索行为研究报告》

雅虎推出搜索浏览服务Axis

类似Google的蛋白功能搜索引擎研究进展

周锦帆

首个图像识别软件诞生用图片定位文件提升搜索效率