Archive

Posts Tagged ‘SEO’

英文博客开博5天,Google、Yahoo成功收录

August 1st, 2009

在博客安装完当天并没有生成sitemap,也没有向任何搜索引擎提交博客信息。

第二天在添加完几篇文章后,也就是27日,开始生成sitemap,并同时向Google,Bing,Yahoo提交sitemap。

31日晚google搜索结果中已经可以看到索引内容,今日博客日志30篇,收录14个结果。Yahoo仅仅收录啦首页,而且没有快照。Bing没有任何收录。

需要补充的是中间向Yahoo新提交过Feed地址。

仅仅是做个记录,睡觉ing

今日一点, 搜索引擎 , , ,

把带WWW域名301重定向到不带WWW的域名

July 29th, 2009

杂碎1:百度对301重定向不那么友好

发现百度对301很不友好,域名既然已经301到新的域名啦就应该逐渐取消老域名的抓取,可百度做法是:继续保持老域名的抓取更新,搞得有两个或多个同样的首页不同的域名被抓取!抓取更新也就算了,不要把权重转移就好啦,这个还没有数据能证明新的域名和老的域名同存对新域名下网站造成的影响深度。

于是昨天我把重定向好几个月的老域名转向到新域名的一个目录里边去了(是个淘客页面)。

杂碎2:百度对www和不带www的域名同样抓取,两份?

这样的结果好像是造成内容重复吧!

与其在做友情链接的时候叮嘱不带www还不如在网站内把www的请求全部重定向到不带www的域名

测试办法就是直接在百度搜索域名(带www的和不带www的),然后看第一个结果是否一样!

这点上Google网站管理员工具里可以设置主域名,不过不管的话Google显然比百度做的更好。至少不希望看到的带www的域名在Google里没有权重!

提供一下301重定向办法:

Options +FollowSymlinks
RewriteEngine on
rewritecond %{http_host} ^www.luoyanglife.com [nc]
rewriterule ^(.*)$ http://luoyanglife.com/$1 [r=301,nc]
#针对host为old.clin003.com的主机做处理,^为开始字符,$为结尾字符

参考:
301重定向实现方式 http://clin003.com/search-engine/301-redirect-implementation-784/

今日一点, 搜索引擎 ,

WordPress2.8对页面头部的更新

June 23rd, 2009

上午的时候,看页面关键字是多少,发现多啦些东东(这个只是看的本博客的源码,其实是在另一个博客看得)这个:

<link rel=‘index’ title=‘Lin&#039;s空间|Only’ href=‘http://clin003.com’ />
<link rel=’start’ title=‘Hello world!’ href=‘http://clin003.com/about/hello-world-1/’ />
<link rel=‘prev’ title=‘对HDWiki网站进行FLASH恶意代码加载与修复办法[HDWiki跨站漏洞]‘ href=‘http://clin003.com/wiki/hdwiki-flash-xss-1736/’ />

开始还以为是”all in one seo”这个插件升级后弄的,为了验证下想法,把这个插件停用,再看,还有!因为博客里没有别的搜索引擎优化插件啦,于是对比下本地的wordpress2.7的博客,看post页面源码,没有这三个标签。看另外两个wp2.8的博客也都有这三个标签。

这个更新并没有在wp2.8的更新说明里看到(我还没去看官方的更新记录,只是在升级博客前看别人写的更新说明!)

大致去查啦下这个标签说明:

link 标签 — 当在文档中声明使用外接资源(比如CSS)时使用此标签
+ link标签是单独出现的
+ 属性
# href — 指定需要加载的资源(CSS文件)的地址URI
# media — 媒体类型,参见CSS教程
# rel — 指定链接类型
# rev — 指定链接类型
# type — 包含内容的类型,一般使用type=”text/css”

Start — 通知搜索引擎,文档的开始
next — 记录文档的下一页.(浏览器可以提前加载此页)
Prev — 记录文档的上一页.(定义浏览器的后退键)

start next prev 属性值 — start next prev,全部属于LinkTypes,此值通常可以提示浏览器文章的开始,下一篇,上一篇的url

此属性值通常在,rel,rev属性中出现
Contents
Index — 当前文档的索引
Glossary — 词汇
Copyright — 当前文档的版权
Chapter — 当前文档的章节
Section — 作为文档的一部分
Subsection — 作为文档的一小部分
Appendix — 定义文档的附加信息
Help — 链接帮助信息
Bookmark — 书签

rel与rev属性相同,它们都是属于LinkTypes属性.

注意:ie浏览器对此类型的支持非常不好,推荐使用Firefox

看来这样既方便搜索引擎也方便浏览器提前加载页面啊(PS:是不是说有一页的流量要被火狐类的浏览器浪费掉啦呢,囧)。

参考文档:rel 属性 link标签中的rel属性,定义了文档与链接的关系

wordpress支持, 今日一点 , ,

Robots META 标签说明和百度的Robots协议

May 23rd, 2009

对于单独页面你可以写一个HTML <meta>来告诉搜索引擎蜘蛛是否索引当前页,跟踪当前页内的链接。

简单的一个Robots <meta>例子:
<html>
<head>
<title>…</title>
<meta NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
</head>
</html>
content属性里面的包含的标签有:
<meta name=”robots” content=”index,follow”>
<meta name=”robots” content=”noindex,follow”>
<meta name=”robots” content=”index,nofollow”>
<meta name=”robots” content=”noindex,nofollow”>

当content需要包含多个属性的时候需要用英文逗号隔离,注意同种属性正反两个方面(例如:index与noindex)不能同时出现在content之中。

NOINDEX -不索引当前页面
NOFOLLOW -不跟踪当前页面中所有的链接
NOARCHIVE -在搜索结果中不保存当前页面的快照
NOSNIPPET – 在搜索结果中不采用当前页面的头部描述信息,且不保存当前页面的快照
NOODP -搜索结果中不使用
DMOZ中的描述信息,Yahoo、MSN也支持此类标签。
NONE -不索引当前页面以及其中的所有链接,跟“NOINDEX, NOFOLLOW” 含义相同

百度蜘蛛对“Robots <meta> 标签”是否敏感

今天查看百度快照才发现百度蜘蛛支持“NOARCHIVE”属性,因为提示
“ 对不起,您所查看的网页不允许百度保存其快照,您可以直接访问http://hiwish.cn/gallery-0–3–1–grid.html ”

检查下这个页面,也就发现这个Robots <meta> 标签

<meta name=”robots” content=”noindex,noarchive,follow” />

而后去查询“百度搜索帮助中心-禁止搜索引擎收录的方法”第四条:

禁止搜索引擎在搜索结果中显示网页快照,而只对网页建索引
百度支持通过设置网页的meta,防止搜索引擎显示网站的快照。方法如下:
要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 <head> 部分:
<meta name=”robots” content=”noarchive”>
要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:
<meta name=”Baiduspider” content=”noarchive”>
注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

不过这个页面已经被百度索引啦,只是没有快照,看来百度蜘蛛是只遵守“noarchive”这个属性啊!囧。不过仔细看看这个属性也不是完全遵守的,因为同样写有”noarchive”属性的页面却能查询到百度快照

同一个网站,一部分遵守“规则”,一部分忽视“规则”?

搜索结果中看到的差别在收录的时间上,一个“2009-5-7”(无快照),一个“2009-4-24”(有快照)。

以下为猜想:

难不成是先收录放入索引,然后在慢慢处理看那些结果是违反“规则”的?而这个时间可能需要花费两个星期。若真是这样那写这些规则还有啥用啊,干脆直接从robots.txt里过滤,从.htaccess里让服务器来控制好了,囧(仅适合需要保密的内容)

参考:
About the Robots META tag

今日一点, 搜索引擎 , , ,

今日杂碎:更改洛阳生活论坛和洛阳交友网Title和Description

May 22nd, 2009

洛阳生活社区的几项修改:

修改原来的“洛阳打折”为“洛阳打折网”。

简化Descript里的说明文字为“洛阳论坛,洛阳购物,美食,女人,婚嫁等一切与洛阳生活消费相关的优惠折扣资讯及洛阳消费体验,详情点击进入…”。也就是使用啦“洛阳论坛”这个关键字,原来为“洛阳打折,洛阳生活消费信息分享社区论坛,拥有购物,美食,女人,婚嫁等一切与洛阳生活消费相关的优惠折扣资讯及详尽即时的消费体验。”。

修改底部的“洛阳打折BBS”为“洛阳生活论坛”。

另外修改啦“
”。

洛阳交友网(白菜林好友圈)的首页和Title修改:

修改Title为“洛阳交友网|洛阳同城交友|找到洛阳的老朋友,结交洛阳的新朋友,一起享受生活.”,使用啦“洛阳交友”的关键字,并且突出啦网站的功能。原Title为“洛阳好友圈|洛阳交友|向左转 向右转–方向自己选『生个孩子 结个婚 谈个恋爱 吃个饭 来挑一个』”。

修改首页Descript为“洛阳交友网(白菜林好友圈)是一个真实的熟人交互平台,在这里您能,与洛阳地区的熟人(朋友、同学、同事、家人)建立紧密联系,了解他们的状况与动态。在这里你可以找到洛阳的老朋友,结交洛阳的新朋友,和他们保持紧密的联系,一起享受品质生活.详情点击进入…”。原来没有,这个Descript也是“雅虎关系”来的。

撤掉啦UCH自带的说明,换为目前参考“雅虎关系”的说明文字

* 在这里,你可以找到洛阳的老朋友,结交新朋友。和他们保持紧密的联系,一起享受生活。
* 与老朋友保持亲密联系;第一时间了解他们的最新消息;与好友分享你的喜怒哀乐
* 通过老朋友的推荐,认识可靠的新朋友;与朋友的朋友一起玩
* 更可轻松与洛阳地区的熟人(朋友,同学,同事,家人)建立紧密联系,与好友们一起玩有趣的小应用

洛阳生活信息点评网(洛阳生活网)顶部导航修改:

添加啦“收藏到QQ书签”和“添加到百度收藏”两个快捷方式链接。

在没有登录的状态下,显示洛阳生活网站功能引导信息——“:) 欢迎来到 洛阳生活信息点评网 分享曾到过的洛阳美食店,洛阳旅游景点等在洛阳的消费场所,并对这些店铺(消费地点)进行点评.”。登录后的状态信息为“欢迎回来…”。

修改的基本点:

尽量让网站相关关键字靠前写,并且完整(比如原来的“洛阳打折”就不完整,而使用“洛阳打折网”可以包含“洛阳打折”,以前的意思是是个论坛弄成“**网”感觉不好)。

在首页描述(Descript)中尽量突出网站的功能,引导搜索引擎用户进入网站,而不是单纯的推挤和突出关键字(原来的洛阳生活论坛有推挤关键字的倾向!)。

首页访问者能看到的说明文字,UCH自带的在说明在网站里可以怎样做能怎样,可能访问者并不知道那些“操作说明”意味着什么,于是修改为现在的啦,不过现在的看着有点单调的感觉。 囧

相关记录:

对洛阳生活信息网的keywords和description进行啦调整 http://clin003.com/search-engine/keywords-and-description-in-search-result-1639/

(欢迎各路朋友们提建议)

今日一点, 搜索引擎 , , ,

Google和百度对待网站标题关键词(长度)的差异

February 8th, 2009

Baidu:24字以内的标题关键词
Google:对19字以内的标题关键词

可能仅仅是个个例(仅供参考):我拿“洛阳生活信息点评网”的Baidu和Google搜索引擎“特殊关键词”收录来简单分析下!

洛阳生活信息点评网现在的网站标题:洛阳生活信息点评网,洛阳口碑网,洛阳生活网,洛阳消费,洛阳休闲娱乐 爱生活,爱洛阳,洛阳生活信息向导!

目前这个网站的网站标题前几个关键词在Baidu和Google的排名情况。

洛阳生活:百度第一 ,Google第一。
洛阳口碑网:百度第一,Google第五(前四个都是口碑网的)。
洛阳生活网:百度第一,Google第一。
洛阳消费:百度第一,Google无!
洛阳休闲娱乐:百度无,Google无!

按照关键词在洛阳生活网站标题中的顺序,“洛阳消费”似乎就是Baidu和Google对待网站标题关键词(长度)的临界点!就此得出开始提出的“猜测”。

不过后边的关键词不是就一无是处啦,只是被看重的程度(权重)低啦而已。

当搜索的关键词不能完全匹配网站标题中的关键词时,比如:

洛阳点评网:百度第一(但能看出后边也有显示关键词“洛阳”被红色标记),Google第三(前两个为大众点评网的,同百度对关键词的红色标记类似,后边的关键词“洛阳”也被标记出来了)。

结尾建议:把最重要的关键词尽量靠前放,若想在Google和Baidu都有个好的排名就最好放到前19个字内,后边的关键词只要考虑关键词百度搜索记录中的重要性了,重复的关键词完全造词造句放到最后也是个不错的办法

今日一点, 搜索引擎 , , , ,