当前位置:北京SEO首页 < SEO技术 < 垂直搜索引擎是什么?

垂直搜索引擎是什么?

2010年2月4日  |  分类:SEO技术  |   views  |  作者:北京SEO

随着因特网的迅猛发展,网络信息资源成几何级数增长。像百度、google、雅虎等传统的综合搜索引擎一次搜索的结果有成千上万条,而在这些庞大的信息中,有用的信息只是其中的一小部分。想要快速、准确的查找所需的信息越来越难,因此催生了垂直搜索引擎的出现。
 

垂直搜索引擎即专业或专用搜索引擎,是针对某一个行业或某一主题的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
    垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。
 整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。
    比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。
    垂直搜索引擎大体上需要以下技术
1.Spider
2.网页结构化信息抽取技术或元数据采集技术
3.分词、索引
4.其他信息处理技术
    垂直搜索引擎的技术评估应从以下几点来判断
1.全面性
2.更新性
3.准确性
4.功能性
   垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎营销、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。目前国内的垂直搜索引擎有职友集、沱沱网等,他们已经拥有了大量的忠实用户。由于垂直搜索引擎的知名度远没有综合搜索引擎高,加之用户长期以来的使用习惯等原因,垂直搜索引擎的用户群比综合搜索引擎要小得多;另一方面垂直搜索引擎能够更好的满足用户在各专业内的搜索需求,是搜索引擎营销今后的发展方向,两种搜索引擎能够长期共同发展。
 1)抓取系统,也就是蜘蛛程序,负责从信息源抓取数据,蜘蛛程序通常是基于预先构造的模板工作的,无模板的蜘蛛程序只能处理结构相对简单的信息,抓取系统涉及的关键技术点有爬行路径分析、增量抓取与全抓取、信息构造完整性、信息唯一性识别、多网页信息整合、自动标引(此功能也可以单独提出)等;
 如何才能做好一个垂直搜索引擎

 

1. 确解用户之意

任何应用最难的就是了解用户的需求,甚至是用户自己都不知道的需求。

建立完善的、快速的用户意见反馈机制和用户需求调查机制,所有人都应倾听用户的牢骚、建议。不断的分析、修改。

2. 切返用户之需

满足用户的需求,一切纷至沓来。不需要炒作,请把您的资源多多花费在为用户提供良好的体验上来。

3. 不要干扰用户的意图,培养用户的使用习惯和技巧

有一个故事是这样的:还在yahoo使用google的搜索的时候,华尔街的几个分析师来评估这两个搜索哪个好用,去掉logo。结果一致评价yahoo的检索效果好。因为yahoo是使用的google检索结果,并且对热点关键词进行了人工调整。但是一转身这些分析师回到自己的电脑边查询东西,不约而同的打开了google。

4. 细节决定成败

信息不是越多越好,在海量的信息时代,如果不能妥善的整理信息,那就等于没有信息。每个页面的每个字,每个像素、图片的放置都值得花费时间去琢磨。把用户最需要的放在最显眼的位置,次需要的放置到更多页面,不需要的扔掉。

5. 将一件事情做到极致

不仅仅要关注80%的用户的80%的需求,20%的用户的20%的需求是您成败关键所在。

6. 专注

这么多需要你解决的问题,你还能干其它事情?对于一个排在第四的业务你是没有机会的。所以垂直搜索引擎的成功肯定不是具备良好资源的行业门户、也不会是大搜索的公司,必然是专注于某一行业的搜索引擎公司。因为只有专注,才能将一件事情做到极致。

7. 创新

失败不要紧,但是如果搜索引擎公司没有创新,那这个搜索引擎公司必然面向的就是死亡。

8. 需要完全掌握主要技术。

 

 

  2)索引系统,把抓来的信息建立类似书目的数据文件,以便于实现高速检索。索引系统涉及的关键技术点有分词技术、预评分和后评分、增量索引与全索引、排序技术、热点词高速缓存、标准检索语句解析等;
 

 

  3)搜索系统,就是提供搜索功能的网站,网站的具体表现形式大不相同,但是都提供全文搜索功能,除了搜索功能外,还提供与业务相关的其他功能,譬如按地域导航检索、会员注册、订阅等。很多人把GOOGLE、百度称之为站外搜索,而把其他基于数据库的搜索称之为站内搜索,其实所有的搜索引擎提供的都是站内搜索,数据都是预先存储在本地的。

垂直搜索引擎的三个特点:
 

 

  (1)、垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:
 

 

  比如:找工作的搜索引擎 www.deepdo.com 的数据来源于:www.51job.com , www.zhaoping.com , www.chinahr.com 等等;
 

 

  股票搜索引擎 www.macd.cn 的数据来源于: www.jrj.com.cn , www.gutx.com 等股票站点;
 

 

  (2)、垂直搜索引擎抓取的数据倾向于结构化数据和元数据:
 

 

  比如:我们找工作关注的:
 

 

  职位信息: 软件工程师;
 

 

  公司名称,行业名称:软件公司,外包行业等;
 

 

  地点:北京,海淀;
 

 

  (3)、垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:
 

 

  比如: 找:海淀 软件工程师 的工作等。
 

  Tags:垂直搜索引擎  搜索引擎  

关于 “垂直搜索引擎是什么?”的评论


发表您的评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。