最近发现几个网站在Google中的收录量下降几倍,在网站管理员工具里的也没有发现什么异常的信息。
具体查看办法
在Google中搜索 “site:clin003.com”
虽说soso的网页搜索结果中早已去掉“Google技术支持”的标识,发觉还是在使用Google的索引内容(注意不是搜索结果)。
可以在google和soso中搜索“site:luoyanglife.com”,在google的“网页快照”日期和soso中的“网页快照”日期是同一天2009年11月2日(但是具体的时间是相差一个小时左右的),收录量的波动情况是否也值得参考还需要观察。
ps:从具体的时间上看soso的缓存时间更早?这能否说明soso与google的索引内容谁为谁提供?
当然这也可以从服务器的日志记录上来验证(空间日志现在没办法看到!)。
或许这并不能说明什么,只是soso的蜘蛛和google的蜘蛛一样勤快。。
ps:soso会采集其他搜索引擎的结果吗?这是他快照里说的!(您查询的关键词是:site:clin003.com采集时间:40 分钟前)
附:
您查询的关键词是:site:luoyanglife.com采集时间:10-03-14 09:45
(搜搜和网页http://luoyanglife.com/的作者无关,不对其内容负责。搜搜快照仅为网络故障时之索引,不代表被搜索网站的即时页面。)
这是 Google 对 http://luoyanglife.com/ 的缓存。 这是该网页在 2010年3月14日 22:14:51 GMT 的快照。 当前页在此期间可能已经更改。 了解详情
搜索引擎
网站收录, 谷歌收录
在 Google webmaster tools 中查看网站的 Crawl stats,可以使用截图工具截图,然后使用画图工具在高点和低点做垂直竖线,做大概的分析。
参考Googlebot对洛阳生活网(luoyanglife.com)最近90天的抓取状态截图:

从图中看来:
Pages crawled per day(Googlebot每日抓取的页面数)与 Kilobytes downloaded per day(Goolglebot每日下载的流量Kb) 的走势基本一致;Time spent downloading a page (in milliseconds)(下载一个页面所使用的时间“毫秒”,也可以理解为网站服务器响应速度)在高的时候,抓取的页面数少,低的时候,抓取的页面数多。
这是不是能说明,网站所在服务器的响应速度间接的影响Google收录网站的网页数量呢?
下面从搜索引擎的的四大系统来对应下:
网站服务器响应速度 ——> Googlebot从网站下载数据 < ——> Googlebot抓取网页数量 ——> 对网页数据进行分析 ——> 对分析后的的数据进行索引 ——> 用户使用Google前台页面进行查询。
PS:当然Googlebot的抓取数量可能还和别的因素有关,比如网站更新频率和更新量。
搜索引擎
googlebot, Webmaster Tools, 网站优化, 网站收录
白菜林花卉网(baicailin.cn)前几天在百度和谷歌的表现情况:
百度收录site:baicailin.cn 100+页
谷歌收录site:baicailin.cn 4,000+页(似乎一直在增多)
百度搜索“白菜林花卉网” baicailin.cn位于第一位
谷歌搜索“白菜林花卉网” baicailin.cn前十页找不到。
今天情况:
百度收录site:baicailin.cn 1+页(不是好兆头啊)
谷歌收录site:baicailin.cn 4,000+页
百度搜索“白菜林花卉网” baicailin.cn位于第一位
谷歌搜索“白菜林花卉网” baicailin.cn位于第一位(这是不是表示已经走出谷歌沙盒?待观察)。
白菜林花卉网(baicailin.cn)是在2009年11月8日程序安装完毕,并发布第一篇测试文档,之后几天在更新网站内容,在几个花卉论坛回复帖子(签名带网址),添加部分页面到google书签、qq书签和百度搜藏,交换几个PR并不高的友情链接。今天看了经过1个多月“白菜林花卉网”似乎已经走出谷歌沙盒(Google sandbox)。
看今天(可能是昨天)百度更新,收录只剩首页!貌似被惩罚?最近调整网站结构仅仅是对部分栏目和模板里的错误BUG修复,继续观察ing。
附注:
在关于google计算PR值的时候,有提到,google比较看中导入链接,作为网站的受欢迎度的一种体现。
Google认为,受到投票越多的网站,即被其他网站链接越多的网站就越有可能是好的网站。这个原理被很多不法的站长横加利用,他们利用纷纷造出的许多无用的链接,试图混淆google的判断。特别是有许多网站设计者在很短时间内制作出粗劣的网站,利用链接来欺骗google的PR值和排名来迅速赚钱!而当google抓住这些网站的时候,这些网站设计者有造出一批新的网站来达到同样的目的。这样,google的搜索可靠性受到极大的影响,成为被操控的机器。早期google对此没有心理准备,使得大量的垃圾网站被排名到前列。这就是导致了曾经轰动一时的google“佛罗里达风暴”和“奥斯汀风暴”来清楚垃圾。
为了对付这些投机行为,google决定采取反制措施。2004年3月开始出现了google沙盒,也就是举世瞩目的google佛罗里风暴和奥斯汀风暴之后的半年。有了沙盒,google仍然像过去一样迅速收录网站,从互联网上从新的网站里努力获取新的信息,但是不再像以前那样信任这些新的网站。所有新收录的网站都有经过“适用期”或者说“观察期”。经过时间的考验,如果这些网站能顺利通过google多次反“泛滥”过滤器(spam filter)的考验,最终这些网站就被送放回搜索的“大海”之中,参与正常的排名竞赛。
如何走出google的沙盒呢?
沙盒最终是可以走出来的,因为我们知道走进沙盒并不是等于所谓的被k,但是在走出之前,你可以采取一些积极的措施,争取早日走出沙盒。在这个沙盒期间里,最应该做的也是非常重要的,是慎重的但是强有力的链接战役!
Google的注册专利在某些点上指出了为什么许多网站会被放到沙盒里面好久。注意下面的几点建立链接策略,可以缩短你的网站在沙盒里的停留时间。
一. 要和外部网站进行有益的链接。
二. 建立链接不要着急,要缓慢而持续。所谓心急吃不了热豆腐
三. 仔细考虑链接的源头文字(anchor text)怎么写,将它们写在链接里面(就是写在a标签里面的title)
四. 使用多样的标签文字
五. 将链接连在你经常更新的那些页面中。
链接策略是力图和外部的联系中,得到外界对你的网站合法性的一种确认,以便“证明”给google看。但是,最重要的莫过于继续增强网站自身的实力,添加新的网页是最好的办法之一。养成每天或者每周添加一个网页的习惯。很多人都做不到,但却是重要的一招。添加新的网页,你能吸引搜索引擎常常来访,这样能让你走出沙盒后在google取得理想的排名有很大的帮助。
另外,这段时间,你可以考虑开展竞价排名。在google上面做广告,和你的排名以及走出沙盒无关,但是这段时间启动竞价排名可以让你立刻得到访问者,同事给你一个衡量广告收益的机会,通过竞价排名,你可以更加熟悉什么关键词能带来点击,这对你的网站优化能期参考作用。
参考:Google的Sandbox沙盒效应
今日一点, 搜索引擎
谷歌沙盒
依据Google Analytics 对于“洛阳生活:luoyanglife.com”的统计数据,百度导入流量从11月28日开始小幅下滑,然后29日回升,然后29日到30到12月1日,然后到2日,百度导入的IP到达历史最低谷。
然后2日开始回升,到4日基本恢复,从3日到5日(今天)看,百度导入的IP基本稳定。
有待继续观察。
留图纪念:

Search Engine: baidu
对于本博客的百度导入IP倒是没有多大的下滑,反而是有少许上升!
终于明白一个道理:不要迷信百度,百度只是一个传说!
努力使自己的访客来源多样化。。
搜索引擎
百度
“Google蜘蛛”竟然连 Adwords内容广告也抓取
今天无意间用Google搜索一个新站的域名,发现竟然在别的网站被“提到”过,以为别人来采集我的站来了,仔细一看,哪网址附件的描述竟然是Adwords里的描述!
点进去看下,除了Adsense的广告之外,没有别的地方可能会引用“baicailin.cn”。
截图保留纪念一下。
Adsense 内容广告 出现在搜索结果展示中

Adsense 内容广告 出现在搜索结果展示中
PS:有个疑问就是这样算不算外链!
搜索引擎
adsense, AdWords, Google蜘蛛
今天才发现百度这个博客搜索的ping服务,在百度博客搜索首页有提示:
使用ping服务,更快提交您的博客
百度提供了手动ping服务和自动ping服务:
手动ping:访问http://ping.baidu.com/ping.html页面,在输入框中输入博客地址或者feed地址,点击“提交博客”按钮即可。
自动ping:如果您的博客程序支持自动ping功能,您只需把百度的Ping服务地址配置到你的Blog发布后台或者客户端程序中,就可以实现自动通知的功能。百度ping服务的地址为:http://ping.baidu.com/ping/RPC2。
关于更多的搜索引擎ping服务,请看这里:搜索引擎的ping服务地址
附:
关于什么是Ping服务?
ping是基于XML_RPC标准协议的更新通告服务,是用于blog在内容更新时通知百度 blogsearch及时进行抓取、更新的方式。百度blogsearch在成功接受到ping以后,会立刻进行抓取并更新。使用ping服务,可以让百度blogsearch在第一时间抓取到您博客上的新内容。
搜索引擎
ping服务, 博客搜索, 搜索引擎
新鲜评论