您的位置: 首页>>IT频道>>网上课堂

Google以外的17个搜索引擎创新
www.LN.XINHUANET.com   2007年05月23日 10:36:32  来源:网易学院

    原文作者:Nitin Karandikar

原文链接: Top 17 Search Innovations Outside Of Google

译者: convertible 有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新。下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新, 请参见这里 )。这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理。 [其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限。

查询预处理

这类改进的主要目的是应用逻辑来尽量预测用户的意图,并由此改进查询的输入。

1. 自然语言处理 这一功能最初是由Ask.com开创的。同期最著名的例子是 Hakia 和 Powerset ,二者以不同的方式试图理解用户查询背后的语义或意思。这些搜索引擎与Google的很大的不同,是他们认为“忽略词”( stopwords )非常重要,如次要的连词,像by, for, about, of, in等,Google通常会忽略它们。

2. 个人相关性(亦称“个性化”) 长久以来,大家认为按某特定用户的兴趣和要求处理查询,能获得更高相关性的搜索结果。 Google已在其搜索引擎中支持这一功能,但需要登陆才能使用。很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内 容的条件。 [即使John Battelle 也认为这个想法有点可怕 ,尽管Google的Matt Cutts 并不同意这个看法 。] 所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity 就是拥有这一功能的搜索引擎。

3. 定制的、专门的搜索 这是一个简单但强大的功能。这一应用的典型代表是SimplyHired,一个求职招聘的垂直搜索引擎,能提供强大的、预设的搜索,比如“适合年纪大的员工的雇主”、“允许上班带狗的雇主”等。

信息来源

这些改进着重于潜在的数据来源:额外的内容类型和对数据来源的限制,提高了搜索结果的可靠性(减少垃圾信息)。

4. 新的内容类型

今天的年轻人正像交流文字信息一样,在手机上舒服地交流照片和视频,成为这个时代的标记。在网上,富媒体内容-图片、音频、视频、电视等,及与其内容有关的语义信息一起正在爆炸性地增长。搜索引擎也愈加需要相应地支持这些内容类型。一些支持丰富内容的搜索引擎的示例如下:

-富媒体搜索:音频 ( odeo , podzinger ),视频( Youtube , truveo ),电视 ( Blinkx ),图片 ( Picsearch , Netvue )

-专业化内容搜索:博客 ( Technorati ),新闻( Topix ),分类广告 ( oodle )

当然,Google在这一领域也非常活跃,如 Google Blogsearch (博客), Searchmash (图片), Google视频, Google新闻等,因此,也许将这一项放在这个清单里不大公平。尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样( Retrevo 是另外一个好例子)。

5. 限定的数据来源

最使搜索用户烦心的问题之一是垃圾信息。由于营销商们更加聪明,正日益使用更多侵略性的SEO(搜索引擎优化)技巧,搜索结果的质量就又下降了。 (Google,作为最流行的搜索引擎,更是众矢之的。) 对一系列受信任站点的限制性搜索排除了这一问题,尽管它也缩小了搜索内容的领域—它为某些类型的搜索很好地提供了真实的、优质的结果,比如,当为一个小学项目研究火山时,搜索维基百科(Wikipedia)、国家地理(National Geographic)和科学/教育站点。

这一应用最好的例子来自 A9.com ,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择。 Google Co-op 和 Yahoo! Search Builder 能使第三方可以创建这种解决方案; Rollyo 早已经是这一领域的先行者!

6. 特定领域的搜索(垂直搜索)

通过聚焦一个单一的垂直方向,搜索引擎能提供更好的用户体验,它对某一特定领域更加全面、简明。针对不同的领域有令人难以置信的大量的垂直搜索引擎,更多资料请查看 Alex Iskold在读写网(Read/WriteWeb) 上的文章或在Software Abstractions博客上的 概述 。 [要更全面地了解这方面的信息,Sramana Mitra的 在线旅游服务概述 介绍了垂直搜索与通用搜索的关系。]

算法改进

这些改进着重于提高潜在的搜索算法以提高搜索结果的相关性并提供新的搜索能力。

7. 参数搜索

这类搜索更接近于数据库查询,而不象文本搜索。它回答的问题从本质上不同。参数搜索有助于发现问题解决方案,而不是文本文档。比如, Shopping.com 允许你用材料、品牌、风格或价格不同来限定衣服搜索;像 indeed 这样的招聘搜索网站让你限定搜索匹配的邮政编码 ;GlobalSpec 让你搜索工程部件时指定多种参数(如搜 索工业管道时输入各种参数 )。参数搜索是垂直搜索引擎的天然特性。

Google已在通用层面上组合了这一特性,比如在高级搜索页面上的参数,但是冲淡了它的有用性。当你深入进标准的搜索结果,或当你限定搜索某一特定垂直领域时,附加参数的强大功能最能充分体现出来。


  精彩图片:新闻图片  缤纷车市  沈阳老照片 大连风情  更多.. 

新华网版权与免责声明:

 
凡本网注明“来源:新华网”的所有作品,版权均属于新华社,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:新华网”。违反上述声明者,本网将追究其相关法律责任。
凡本网注明“来源:XXX(非新华网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。
图片新闻
精彩导读
沈猪肉价创十年新高 牛羊肉价随涨
5分钟谈场恋爱 “80后”闪婚闪离
股市调查之二:谁赚谁赔
家长回避老师不语 性教育空白咋填补
股市调查之一:谁在炒股?!
7月1日起沈阳医保缴费调整
小姨证实:“黛玉”病逝
153户豪宅业主梦断“曼哈顿”
特大卖淫案后续 被拐少女18夜噩梦
特大强奸强迫组织少女卖淫案告破
沈阳12姐妹控诉“白大夫”
“辽宁第一牛股”变“熊”了