北京SEO

对于SEO(网站优化)感到很迷茫,寻找突破口中!!本站立志做一个有用的博客,如果你有好的zblog模板可以共享送我一份哈。。。QQ754042
    • 主页
    • 北京SEO服务
    • 搜索
    • 标签
    • 了解星默

  • 北京SEO首页
  • 星默SEO观点
  • SEO精华文章
  • SEO技术
  • SEM
  • SEO研究
  • SEO工具
  • google排名研究
  • 百度排名研究
  • 名人观点
  • 英文SEO

最新文章

  • 谷歌排名飞跃-首页-几百-首页
  • 框计算中的需求分析概述
  • 浅谈互联网页面价值
  • 关注seowhy被K事件
  • 2011年谷歌seo变革
  • 好大夫网站SEO分析
  • 百度竞价6.30算法升级-“高级短
  • Google网站管理员【抓取错误】
  • 电商要拥有自己的网店平台
  • 到底电商圈是个啥
  • 电商圈你也觉得一个人好么?
  • 电商圈4.3排名
  • 电商圈能圈的住爱情不?
  • 电商圈比赛报名送10QB,更有后续

随机推荐

  • 寝室停电,汗个!
  • 网站是否被挂马在线监测
  • SEO导航_SEO名站_SEO名人博客-
  • 百度,Google,雅虎等搜索引擎蜘
  • 如何判断一个关键词的优化难度
  • seo什么意思戛纳电影节片单解析
  • seo网络推广招聘月薪10000招聘
  • seo优化文章seo网站优化10大基
  • 整形美容答疑—九大问题全面解析

热门标签

  • seo (47)
  • seo收录 (31)
  • 百度 (29)
  • 博百优 (22)
  • seo关键字 (21)
  • 北京seo (20)
  • seo关键词技术 (20)
  • seo网络推广 (20)
  • seo是什么东西 (19)
  • 上海seo服务 (19)
  • 反向链接 (18)
  • seo什么意思 (18)
  • 搜索引擎 (17)
  • seo优化文章 (17)
  • 火焰SEO (16)

网站收藏

  • 北京搬家公司
  • 搬家公司
  • 北京搬家公司
  • 北京搬家公司
  • 四通搬家公司
网站优化、北京SEO服务

详细请加QQ754042

搜索引擎的中文分词技术详细分析?seo是什么意思

发布:星默 | 时间: 2010年8月18日 | 分类:SEO转载 | 评论:0 | 引用:0 | 浏览: | 原创文章,转载请注明出处,谢谢。

  (中国电子商务研究中心讯)有人在seo(搜索引擎优化)qq群里面问我什么是中文分词,鉴于时间的原因只是讲了中文分词的简单的步骤,下面我们举个例子来详细的认识下。

  seo是什么意思首先我们看下下面这个句子“上海奇商是上海地区最优秀的企业seo咨询公司吗?”

  搜索引擎的中文分词技术详细分析?seo是什么意思,当搜索引擎(以后一律建成se)读到上面这句话的时候会进行第一次切词,结果如下:上、海、奇、商、是、地、区、最、优、秀、的、企、业、s、e、o、咨、询、公、司、吗

  注意上面是20个中文汉字和3个英文字母,而第一次分词的结果是将“上”、“海”两个重复的关键词去掉了。这种切词就是简单的单字法。当然搜索引擎不是傻瓜,不会只利用这么一种简单的分词方法。

  接着,搜索引擎进行二分法分词,结果如下:上海、海奇、奇商、商是、是上、海地、地区、区最、最优、优秀、秀的、的企、企业、业s、se、eo、o咨、咨询、询公、公司、司吗

  注意上面的伤害出现了两次,也只算做一个词,因为他们的确是一个词,第一个“上海”和中间的“上海”没有什么差别。这只是第二次分词,接着会有三分法分词和四分法分词。

  或许有seo要问,这样分出来的词搜索引擎有什么用?不着急,我们还没讲到下面。

  其次,se针对这些词进行筛选,怎样筛选呢?我们都知道中文的很多词,像“的”“了”“啊”“吗”“在”等几乎每篇文章都会用到,这些词要是se全部收录的话,那估计数据库早就放不下了,因为百度目前收录的16亿网页几乎每个网页都有这些词,这么浩大的工程,se肯定忙不过来,即使忙过来,也很少有人去搜索“啊”这样无意义的关键词。所以se将这些词定义为停止关键词,也就是英文里面提到的“stopword”。只要是停止关键词都会被删除的。

  或许又有seo开始提问了,那么“是上”这样的关键词难道也被分成一个词?不要着急,下面还有更精彩的。忽略掉停止关键词后,剩下的关键词开始跟se的词库进行匹配,原始的词库可能只有辞海那些基础的关键词,但是随着互联网的发展新词的产生,se的词库远远大于辞海。后面会详细解释。

  这样像“上海”、“地区”、“优秀”、“企业”、“咨询”、“公司”等我们自己都知道肯定属于辞海的关键词,肯定也属于se的词库。

  这里有些seo开始问,那么像“seo”这样的词se是怎样判断的呢?如果大家去看下在微软必应搜索”seo”时候推荐的关键词就能看到,他们和百度、谷歌一样,原来都是解决不掉这个问题的,推荐的关键词一律为“色哦”。那么后来他们是怎么分析出来这个关键词的呢?这个就要靠se强大的统计功能了,当se发现有大量用户搜索“seo”这个关键词的时候,他们就会将这个关键词添加到词库。这个时候一个新词就产生了。

  当然还有这种情况是百度贴吧之父俞军和百度ceo李彦宏都向往的一种分词方法,即理解,理解的意思就是我们在搜索“上海最好的seo公司”的时候,se能够理解用户要找的是什么信息,他会发现用户最在乎的是“最好的”这个关键词,于是就会将带有“最好的”网站提升到第一位。本站就成功的靠中文分词的这一特性完成了双排名第一的目标。

  总结一下,se其实有三种分词方法,一种就是基于字符串匹配的方法,像单子法、二分法等等(依靠词库);第二种就是靠统计数据,来获得大量的新词,这种方法叫做统计分词;还有一种方法是在统计的基础上,实现匹配的方法,也就是理解的方法,这种方法首先统计大家都搜索这个关键词没有找到后第二个搜索的且搜索量最多的词是什么,比如说很多人搜索“最好”然后发现没有得到他们想要的serp,结果又搜索了一下“最好的”这个时候大量的统计数据表明“的”是有用的,然后将他添加到“最好的”组成一个新词。前两种分词已经普遍被se认可,第三种目前对于搜索量低的词还是统计不出来,统计不出来也就没法“理解”。(文/姜东栋;编选:中国电子商务研究中心)

本文来源于:北京SEO http://www.fireseo.com.cn/ , 原文地址:http://www.fireseo.com.cn/seozhuanzai/526/
  • 上一篇:把胡柚、贡面都搬上了网浙大毕业生自建网站“秀”家乡
  • 下一篇:海商网陈则立:为b2b打通网脉的天花板_宁波seo
  • 相关标签:seo是什么意思
  • 引用通告:点击这里获取该日志的TrackBack引用地址
  • 相关文章:
  • 站长故事汇:泡泡营宋栓祥梦想驱动未来 (2010-8-17 21:17:30)
  • 什么是epc,对于epc的意思的正确理解以及对seo的指导意义 (2010-8-17 21:15:58)
  • 小欧言论之:seo的无用之用 (2010-8-17 21:15:58)

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

  • 关于我们
  • 网站地图
  • 与我们联系
  • Archiver
  • rss
Copyright © 2009-2010 www.fireseo.com.cn. Some Rights Reserved.北京SEO SEO 版权所有