好大夫网站SEO分析
一直在反复看国平老师的博客还有论坛里其他分析文章,对优化自认为有了新的认识,完全认可科学SEO所提到的方方面面,也通过分析日志,分析GA数据等改进了很多不足。今天强迫自己班门弄斧分析下医疗门户大站:好大夫。
首先来看下好大夫这个站给人第一印象如何:
1,用网站测速软件测试了下,无论电信还是网通,速度都相当的不错,截图看下,最长1.59秒,最短0.28秒左右平均0.74秒,记得国平老师在网速是如何影响SEO效果的文章里详细说明了这个速度对搜索引擎对用户是何等的重要,此为第一关。应该说做的很不错。
再来用Pagespeed分析下,得分82分,,在部分排版图片方面和图片压缩方面可以继续提高下。用pagespeed所提醒的处理方法就可以解决这里所显示的问题,对提高页面打开速度很有好处。
从haodf.com返回的头部代码里我们实际上可以看到一些不曾注意的信息
这个头文件里有一条是:X-Cache: HIT from cache22.haodf.com,还有两条信息是X-Proxy: 22
从地址cache22.haodf.com我们可以发现,这是缓存地址,也就是说,打开首页如此之快是缓存在起作用,应该是负载平衡
系统在起作用,负载相对小的提供了本次访问所需要的数据。
实际上通过ping chache22.haodf.com和www.haodf.com所得到的IP地址不同就可以说明一些问题:
这个IP地址段通过查询是北京电信通所提供的。
这里的X-Cache: HIT from cache22.haodf.com是缓存技术无疑,具体如何的细节了解可以去搜索下,相关技术文章解释的挺清楚。
2,再来看下域名haodf.com的相关信息:
Created: 2004-08-07 00:00:00
Expires: 2018-08-07 12:08:16
Last Modified: 2008-09-02 19:45:11
04年注册,08年续费时一次性续费十年,老域名。
3,再来看看自从域名注册了之后,此站是否一直是做医疗类的内容呢?看历史记录数据来回答你心中的疑问:
各位可以去infomall.cn里查询下看此站的历史界面,可以发现,虽然04年注册,但是直到06年左右才开始做医疗类的信息的,之前做的都是网址大全
点开05-5-14的样子看下
,
名字和内容是地地道道的网址大全,在后来的06-11-12日的样子已经是医疗方面的信息了,
具体哪个时间开始做的也许只有当事人了解了。
看完了其历史和整体信息,下面来分析下网站
首先是首页。
首页里一些明显优化的因素都不存在,首页没有任何H1 H2 H3标签,首页没有nofollow,全部链接都是有效链接没有用JS隐藏,连最下面链到备案地址的链接也是如此。
网站title description keywords(可有可无)的数据分别是:
最重要的标题部分是:好大夫在线_中国最大的医疗网站
结构是 品牌_行业解释
这里的title没有堆砌任何关键字,比如疾病名称、比如药物名称、比如医院名称等,就是说明自己的品牌:好大夫在线,及好大夫在线是中国最大的医疗网站
关键字部分可有可无,加了可以增加品牌关键字密度
描述部分是详细说明网站所提供的服务。这里对品牌的强调有点可以学习的是:前面出现的是“好大夫在线,中国最大的医疗网站。”紧接着出现的是“好大夫提供...”,将好大夫在线和好大夫分别强调一下,以增强品牌。
- 这里的首页部分安排实际上对大站来说是最合理的,因为首页只需要解决用户慕名而来也就是直接搜索好大夫或者好大夫在线即可,那么多的疾病名称医院名称什么的可以直接交给数量庞大的内页来完成,从而很好的把权重内移,共同取得排名和流量。
接着来分析下整个首页的HTML代码传达了怎么样的优化手法:
一些可能影响网站打开速度的都用其他的方法来规避了:1,就是外部CSS文件、JS文件和排版图片(这里不包括正式数据里的图片如新闻里的图片等),整个页面里排版用到的CSS、JS、排版用的图片全部放到另一个域名hdfimg.com下了,这个处理是很不错的一种处理方法,相对于主站WWW的域名来说图片、CSS、JS都是调用外部的内容了,可以充分保证主站打开时HTML代码可以出来,外部CSS也同时被用户自己的浏览器调用来加速页面打开速度。
同时,我们PING 下看hdfimg.com域名
可以发现,其IP地址和主站及缓存类的是在一个IP地址段,也就是都在219.238.150这个段IP地址里,应该是同一个机房另一台机器专门在处理CSS、JS和排版图片。
分工明确的几台服务器同时处理用户的需求加速了网站打开的时间,不错!
(也考虑过是一台大服务器捆绑了多个IP地址,不过想来这么大的站应该会分工非常明确,将大问题化为很多小的问题来逐个优化达到总体效果最佳,也便于故障时进行排查)
除了CSS、JS、排版图片是单独用hdfimg.com域名来提供数据,另一个图片出现的情况就是新闻文章或者产品或者介绍等等正文里出现,那么这种图片haodf是如何处理的呢?
通过查看源代码,直接发现了另一个域名:n1.haodf.com,是存放的医生的头像。
- 从以上这两个域名hdfimg.com和n1.haodf.com的分析可以看出,好大夫在影响网站打开速度方面的处理真是细致入微,将可能的外在因素全部解决,值得学习!
除了这些影响打开速度的因素之外首页还透露出来了什么信息了呢?
有,通常我们不希望搜索收录的页面好大夫也用了一些方法,最典型的就是注册会员,这里好大夫用的也是另一个域名passport.haodf.com,处理注册的问题。
实际上我们用命令在百度和GOOGLE里分别查询下site:passport.haodf.com的收录情况,百度是:354个,GOOGLE是170个,虽然数量相比于总体收录量算不了什么甚至可以忽略不计,但这类对排名没有多少帮助的因素存在就会干主域名关键字,所以用另一个二级域名来放这些信息,帮助搜索理解主站所要表达的意思。
- 相比于用nofollow来屏蔽和robots.txt来屏蔽这些无用的信息算不上最好的处理方法,但对于考虑但站大修改搜索的反应来说还是相当不错的一个处理方法。
再仔细检查每个链接,可以发现,很多内容性的东西,全部采用二级域名来跑。
比如某个医生的访问地址是drsunkun.haodf.com,其中drsunkun是医生注册的用户名。
某个地区的访问地址比如江苏:jiangsu.haodf.com,其他省区的类似,均才用二级域名的形式来跑。
而疾病名称、医院名称、咨询信息、专家文章、看病经历、感谢信都没有使用二级域名,而是直接以www.haodf.com/二级目录名/页面名.htm
这里二级目录名总共有这几个:hospital表示医院,faculty表示医院科室,jibing表示全部疾病,zhuanjiaguandian是专家文章观点,wenda是咨询问答,doctor是看病经验和感谢信,info是联系信息及自我介绍。
页面名中医院的名称是随机生成的名字,疾病那里是疾病的拼音,问答那里是医生拼音_随机数字,这里的页面名除了疾病名称可能有人搜索拼音之外医生名医院名和问答没有规律可言对整体没有影响。
- 疾病名称用拼音搜索时百度也会提醒你是搜索的可能是什么中文内容,比如搜索buyunbuyu,百度就知道你搜索的是不孕不育,所以目录里的拼音对优化的作用可以不必太过考虑,但对用户的友好度还是不错的,看拼音总比看一堆乱七八糟的随机字母数据要舒服的多。
三级目录有:汇总了各种疾病所对应不同医院的医生,省区医院列表更多
使用二级域名的总共有:省区所包含医院、网上咨询、预约、医生注册帐号、权威专家观点专题、400咨询、帮助等等
没有完全全部罗列出来,仅以目前以上的数据来分析下,为什么这么安排。
为什么一些数据使用二级域名一些数据还是在主域名下用二级目录来存放,原因应该就是跟流量有关。
为此,我们通过实际数据来说明下放目录下的流量和放二级目录下的流量对比。
拿出火车头采集爱站里前50页总计1250条记录,可以发现
- 二级域名无论在排名还是流量搜索量方面都比根目录下的要少的多的多
附件是采集的爱站显示出来的好大夫网址:
为何好大夫站要如此安排链接?说到底肯定是为了权重为了排名为了流量
我们来看下二级域名的页面里都发生了些什么:
先拿罗列了全部江苏的医院的二级域名jiangsu.haodf.com来看他的页面里都发生了些什么事情。
这个页面里除了Head部分跟网站首页一样,之外,里面都有哪些链接类型和内容呢?
1,全江苏省各个市县的医院,里面链接的目的地由医院、问答、医院科室、医生链接(二级域名)、医生评价、咨询(二级域名)、全国地区导航(二级域名),而医院、问答类所占篇幅是最大的。
2,再看数量巨大的医生的二级域名页面都含有什么样的数据:专家观点的文章二级目录类的、问答咨询也是二级目录类的、医生主治的疾病名称链接还是二级目录类的
3,再看下400.haodf.com咨询类的页面,链接主要是去此医生二级域名页下的咨询页,那么进入此二级域名页下的咨询页查看,可以看到,这里的链接主要类型是:其他医生二级域名页、医生自己的二级域名页、问答咨询页二级目录类、相关专题文章二级域名类以及此疾病相关的推荐医院二级目录类的。
- 依此类推挨个进入全部的二级域名,可以发现,全部的二级域名类的页面里最终都会给二级目录页面导入链接,也就是有意识的将二级域名页的内链权重导入二级目录里去,这也就是为什么整体流量里二级目录类的量远远大于二级域名的量。
- 数量庞大的医生的二级域名页面所产生的巨大的内链导向二级目录,从而将整体的权重很好的导向价值较高的页面,使得二级目录页面排名和整体效果相当的不错。
当然,除了医生类的二级域名,还有其他几个二级域名也同时在传递权重到医院、疾病、问答、专家观点、医院科室名称等二级目录页里,将整体二级目录权重推的非常高。
看完网站链接结构,我们来看下内容以及外链部分。
搜索一个竞争压力山大的词“整形”,在百度里排第一,链接地址是www.haodf.com/jibing/zhengxing.htm,我们来看下这个词的页面内容。首先看下H1 H2,这里好大夫竟然使用了3个H1,大站里第一次见过同时使用3个H1的,截图如下
三个H1的标签写法是:
<h1>整形专家观点</h1>
<h1>相关疾病-<span title="整形">整形</span></h1>
<h1>最近在线大夫-<span title="整形">整形</span></h1>
H2部分写法是:
<h2> <a href="http://www.haodf.com/jibing/zhengxing.htm" title="整形首页">整形</a> <span class="font16" style="color:#000;"></span></h2>
复制代码
- <H1>部分强调整形,同时使用小技巧<span>的title标签来加强关键字,提升关键字密度和频率。
- 整个页面里“整形”这个词出现的非常频率非常之高,同时分布也很平均,从左到右从上到下,不断的进行重复和强调。
标题里出现两次,正文部分出现88次,描述里出现1次。那么再分析下此页的外链情况:122929,12万多的链,除去站内的再算下看:1218
- 12万多的链接全部是来自内部!而剩余的1218纯外部链接中,有80%以上都是别的站的文章页,也就是通过转载好大夫的文章而自然产生外链,转载的站大部分都是跟医疗整形有关的,多么高质量的相关站链接,指向的目标页面又是惊心优化的,想没有好的排名也难啊!
分析好大夫站发现,通常建议的1个H1 多个H2 H3 H4的规律在这里并不适用,好大夫的一些排名靠前的页面里,使用H1跟使用H2 H3一样,同时使用就是几个,如图医院介绍主页
四个H1当作H2来使用。
- 这其实也是间接的说明不要单纯的迷恋标签,标签仅仅是符号,使用H1还是使用H2来表示结构关系都可以。
分析了网站的结构、链接,下面看下网站的内容。
- 实际上 作为医疗行业的门户,好大夫里产生的信息都是高质量的,比如疾病咨询类,很多用户咨询时写的是相当的详细,把可能的病因和治疗流程等信息全部公布出来了,医生的回答也算及时准确,使得整个网站互动不错内容质量也高;同时一些有真才实学的医生常写一些原创性医疗文章,客观上更加帮助整个网站在专业和深度方面都很不错,高质量的内容是好大夫站排名不错的另一个关键因素。
接下来看高质量的文章是如何自动产生外链的:
搜索个词“不孕不育”,可以找到这个词所对应的目录是www.haodf.com/jibing/buyunbuyu.htm,查这个地址的反链可以发现,其中有几篇如转载了“异位妊娠治疗”的站、环球时报的站等站里文章中的关键字都存在链接,这种相关性的链接对主站的权重贡献作用真的是很不错。
综上所述:好大夫站告诉了我们这么几点:
1,尽一切可能将网站所有影响打开速度的因素都通过各种方法来解决掉,网站无法快速打开,再好的创意再好的前景也将被耽误,此为建站第一步;
2,控制好使用目录还是使用二级域名问题,考虑好自己站的优质内容是什么,吸引流量的内容又是什么,一些可能干扰主站关键词的因素通过使用二级域名或者直接NOFOLLOW掉或者用robots.txt屏蔽掉,以达到将所有干扰因素降到最低的效果,同时制定好策略,将链接引向目标关键字所在页面。
3,产生高质量的内容,引起同行或相关网站产生转载欲望,文章内的链接如果被保留所产生的外链会呈几何积数增加。这种高相关性的单链实在是难得的资源。
4,对于门户站来说,控制好整站的结构又是一个重中之重的问题。网站结构需要统筹全局,将主页做什么、目录页做什么、内容页做什么全部安排好,有针对性的去充实相关版块的内容从而达到数量众多的长尾词可以通过内页获得排名取得流量。
- 上一篇:百度竞价6.30算法升级-“高级短语”
- 下一篇:2011年谷歌seo变革
- 相关标签:
- 引用通告:点击这里获取该日志的TrackBack引用地址
- 相关文章:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。