2007年4月21日星期六

[转载]Google排名优化研究

1:网页快照 存在于Google数据库中的所列网页的文字内容,也就是上一次Google蜘蛛所抓取的网页内容。
2:真正Google PR的计算和更新是动态的不间断的过程 我们在工具栏看到的PR值只是”可见的PR值”,大致三个月更新一次。
3:为了使URL网址更规范化,应该将从下面这几个网址
http://domainname.com/http://www.domainname.com/index.htmlhttp://domainname.com/index.html
都要做301重定向到这个网址:http://www.domainname.com/
4:沙盒效应 表现为一个新网站在Google里面很难得到好的排名,无论你怎么优化这个网站,就是很难在Google里面得到好的排名。Google的Sandbox有点像给予新网站的一个试用期。在这段试用期内,新网站几乎无法在竞争比较激烈的关键词下得到好的排名。通常沙盒效应会维持六个月,有一些针对竞争性不高的关键词的网站,可能在沙盒里会短一些。行业竞争越高,沙盒效应会越长。
5:.edu 和 .gov域名具有天生的被信任的特征 原因是.edu 和 .gov域名在任何情况下都不可以被转移,包括买卖,出租等任何形式的转移。.edu域名只可以被教育机构注册,.gov域名只可以由政府机构注册。作者认为,这些特点使.edu 和 .gov域名最有可能被认为是可被信任的顶级域名。
6:Google比较讨厌的作弊方式(恶意作弊,Google能很快查出)关键词堆砌故意放上大量拼写错误的关键词无逻辑的,一般是有软件生成的文字桥页试图用垃圾软件在其他网站产生大量垃圾垃圾可疑的页面转向
7:Google蜘蛛爬行时有无限循环危险 比如说跟踪某个网页上日历的链接,可能在这个日历上总是有“下一个月”这个按钮,产生无限循环。因为网页程序可以无限制的生成下一个月的月历,Google蜘蛛就出不来了。
8:在留言本里留下垃圾链接 这种技术对Google来说早就不起作用了。再比如有的作弊的人建立大量的网站,在这些网站之间互相链接,这对Google也不起作用。
9:补充材料是Google辅助索引的一部分
10:补充材料产生原因
第一:有网址规范化问题。也就是带有www和没有www的两个网址版本都在数据库中,那么其中一个就有可能被标为补充材料。
第二:有时候已经被删除的网页,也就是实际上应该返回404错误的URL,会被列为补充材料。或者域名已经过期了,也有时会被标成补充材料。
第三:有时候站长在改动网页之后,新旧内容的两个版本的网页都会出现在Google索引中。而糟糕的是,其中一个会被标为补充材料。
第四:复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。
第五:网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。
11:补充材料在大部分情况下和网页内容重复或类似有关。
12:补充材料会被更新,但是被重新抓取的频率较低。
13:补充材料会继续存在长达一年或更长的时间。
14:如果你想让你的网站更多页被收录的话,你得多考虑你的链接的质量。
15:只要把你自己的网页加入Google Notebook就可以轻易的从Google域名得到反向链接。
16:老网站一般不会进入沙盘,但太快增加新网页和链接也可能会产生沙盒现象。
17:不仅高质量的链接重要,来自高度相关文件的链接可能也很重要。有时候可能要联系竞争对手。
18. 工具条上的那个绿条不是当前PR值。
19:Google会把买卖来的链接效果归零。
20:Google排名突然下降,并且稳定在某个位置,说明Google发觉你的一些猫腻了。

1. 只要你提供对用户有帮助的内容,而这些内容又可以被蜘蛛顺利抓取,正常情况下,就已经解决了大部分问题。
2.我们给bold的权重比strong稍高一点,但差别很小,不用在这方面想太多。(但后来更正为权重一样)。对两种斜体em和i两种标签的权重比也完全一样。
3.不用担忧很多网站共享同一个IP地址,放在同一架服务器上,对排名完全没有影响。
4. 上百万个网页同时上线,不一定有问题,但绝大部分情况下这都是够可疑的。所以他建议,你要真有这么多网页,最好尝试软性逐渐发布,几千页几千页的上线,可能会好一点。
5.如果不做搜索引擎优化,用户找不着你。
6. Google内部有很多垃圾检测工具。(Kyw的理解:别傻乎乎的用所谓的SEO软件,有规律的作弊总能被检查出来。)
7. 建议大家可以用Yahoo Site Explorer查一下网站的反向链接,
8.不会担心是否符合符合W3C标准,因为40%的网页都有编码错误,搜索引擎不会因为网页上有错误而抛弃40%的网站内容。
9.静态和动态URL处理的方式是类似的,但不要在动态URL中使用太多参数,最多用两三个。同时不要用太长的数字,因为那可能会与Session ID混淆。最好能够用mod_rewrite进行URL改写,把动态URL改为静态URL。
10.根据用户IP返回不同内容,不会被认为是隐藏网页(cloaking)。但如果给予Google蜘蛛特殊的对待,就会被当作隐藏网页。
11.栏目中出现关键词不是重要,重要的是网站的确应该根据不同的话题来分成不同的目录,形成一个树型结构。至于目录名用什么就无关紧要了,重要的是在不同的目录下话题是紧密相关的。这样在各个目录下自然会包含关键词。
12. 内部有专门的补充材料小组在研究和观察,主Google蜘蛛和补充材料蜘蛛是分开的。当下一次补充材料蜘蛛来访你的网页的时候,如果看到了301转向或者质量的提高,自然网页会回到主索引库。
13. 就Matt Cutts所知GOOGLE没有用Google Analytics(GG提供的流量统计工具)收集数据。
14. 有各种不同的复制内容,比如说完全一样的网页,也有的是近乎复制的网页,我们有很多非常复杂的逻辑来进行检测。如果你觉得你可能有复制内容网页的问题,那就要确保你的网页之间全都不同。
15. 不建议下拉菜单中放入链接,这也不是标准的制作手法。他建议还是把链接放在网页底部或网站地图上。
16. 在Google进行算法更新的时候,或者测试新的功能的时候,都在一个数据中心先进行,确认质量达到我们的期望。完全不必要去观察不同数据中心返回的搜索结果。
17. 如果你的网页有差不多相同的内容,那么尽量使它们看起来不同。
18. 一般来说如果内容差不多,Google就会自行判断,然后选出一个他们认为最好的。如果你想避免复制网页的产生,可以试着确保网站的模板非常非常不一样。
19.以前曾经有人问gov和edu域名的链接是不是比普通域名的权重要高?实际上我们并不会看这个链接来自开放目录,或者来自gov或edu域名,就给它特殊的对待。只是这些网站一般都有比较高的PR值,有更多的网站链接向他们。
20.博客和普通网站在排名算法方面没有什么区别,除非你做的是博客搜索(blog search)。
21. 在你看到toolbar中的新PR的时候,这些数值已经被考虑在排名算法当中了。所以你可能看着新的PR值很高兴,但是它并不是导致排名结果变化的原因。所以你不会看到因为PR更新导致排名结果的变化,这些排名结果的变化,已经从上一次PR更新就开始计算了。
22.在回答一个帖子的时候曾经说过:Matt Cutts“有补充材料现在不一定是件坏事。你的这个情况在我看来,只是缺少PR和链接的一个反映。你的首页已经在我们的主数据库中,但是你并没有多少链接。所以我认为你的网站并没有什么问题,只不过我们的索引数据库只能选择一部分文件,如果有更多的人链接到你的网站,我预期你的网页会回到主数据库。”

1、至少准备100页真正的高质量内容,不包括链接页、关于、联系等等。
2、选择一个有品牌潜力的域名,域名内无所谓包不包括关键字。
3、网站设计简洁,文字内容的比重应该大于HTML格式的比重。
4、最好别用flash, dom, java script等。如果你必须要使用这些脚本的话,把 他们作为外部文件来使用。 5、把能去掉的附加内容(如计数器)都去掉。保证最快的浏览速度。
6、单网页大小5K~10K间最理想,但比较难做到。
7、每天更新200字~500字的原创文章。
8、在网页标题,说明标签,正文标题,网址URL,黑体,斜体,网页的最开始等 地方使用关键词。关键词密度介于5%到20%之间(不必刻意追求)。保证没有 错别字。
9、在每个网页连向1~2个排名高的网站,在链接文字当中加上关键词。(这一点 对未来来说很重要)。
10、在你的网站之内,高质量的内容之间互相链接起来。
11、做好每个页面的导航。
12、向搜索引擎提交,向开发目录提交,但不要报什么希望。
13、每天交换一个链接,即使对方不同意也别在意。
14、提高你的写作技巧,学习适合网上人群的写作方式,多分段,短句子,读起 来快的内容。大部分的网站访客不是读,而是浏览。
15、别指望任何作弊行为或所谓的捷径,甚至接近、类似作弊的行为。
16、友情链接:不要链接到有问题的网站和质量不高的网站。确保对方网站和你的类似,是同一个行业的。
17、别把网站作出“产品说明”,要提供对用户有用的信息。
18、查看统计信息,研究用户来路,怎么来的?回到关键词研究,找出更多好题 目,写新的网页。
19、提前做好将来会有搜索量的页面;
20、注意收集突然来的灵感,例如你突然想到要写个主题,回家却想不起来了。
21、六个月后,查看一下向分类目录提交的结果,如果没有加入,再次提交, 然后继续别报希望。
22、继续更新高质量内容,Google喜欢原创。

没有评论: