新一代搜索软件技术 实现互联网信息有效利用

来源:电子信息产业网 发布时间:2013-06-05 点击次数:2895

     “核高基”重大专项设立了“新一代搜索引擎与浏览器”项目,对“百项共性关键技术”中的新一代搜索软件技术进行支持。旨在通过项目的实施,针对海量互联网信息多模态、非结构化、不确定性、动态时空演化等特点,研究出新一代搜索引擎与浏览器的产品形态,设计能够支持对图像、视频等媒体内容和Web社会网络信息实时搜索的新一代搜索引擎与浏览器体系结构,研制新一代搜索引擎和浏览器原型系统,并进行应用验证,提出新一代搜索引擎与浏览器的应用模式与产业化策略。该项目共安排国拨资金2747.27万元,组织百度和腾讯2个团队进行技术攻关和产品研发。

      研发团队基于网络异构数据的实时获取、表示与整合理论实现了精确、个性化的方位搜索;建立社会网络多维度复杂人际关系的关联分析模型、突破分布式索引技术、图像显著性区域检测与分割的形状提取、组织与索引、多特征融合的相似匹配等关键技术,研发了识别准确率高、“个性化”、“社区化”、“智能化”和“移动化”的新一代搜索引擎与浏览器,实现了互联网信息的个性化搜索和智能服务,申请专利934项,获得专利授权71项,累计实现销售收入约16亿元。

      该技术根据融合多种颜色、纹理等低层次特征(包括颜色直方图、Haar小波系数、Gabor纹理、边缘直方图、LBP特征、LLP特征等)的多特征融合方法,以及一种融合特征的快速匹配方法,实现相似图像搜索系统,相似图像检索系统的准确率可达到60%。

      “新一代搜索引擎与浏览器”项目的实施,提高了实时数据处理能力,增强了互联网用户体验,优化了应用模式与产业化策略,是互联网信息有效利用的重要途径;支持超大规模Web数据整合与搜索的体系结构与平台基础设施建设是互联网经济的下一个制高点,对国民经济和产业发展具有重要意义。