Archive

Posts Tagged ‘搜索引擎’

添加百度博客搜索ping服务

November 16th, 2009

今天才发现百度这个博客搜索的ping服务,在百度博客搜索首页有提示:

使用ping服务,更快提交您的博客

百度提供了手动ping服务和自动ping服务:

手动ping:访问http://ping.baidu.com/ping.html页面,在输入框中输入博客地址或者feed地址,点击“提交博客”按钮即可。
自动ping:如果您的博客程序支持自动ping功能,您只需把百度的Ping服务地址配置到你的Blog发布后台或者客户端程序中,就可以实现自动通知的功能。百度ping服务的地址为:http://ping.baidu.com/ping/RPC2。

关于更多的搜索引擎ping服务,请看这里:搜索引擎的ping服务地址

附:
关于什么是Ping服务?

ping是基于XML_RPC标准协议的更新通告服务,是用于blog在内容更新时通知百度 blogsearch及时进行抓取、更新的方式。百度blogsearch在成功接受到ping以后,会立刻进行抓取并更新。使用ping服务,可以让百度blogsearch在第一时间抓取到您博客上的新内容。

搜索引擎 , ,

今日杂碎:4月1日全球上百家大型网站将面临DDOS主流攻击

March 27th, 2009

杂碎1:检测是否被感染Conficker蠕虫病毒
3月25日,两大国际知名安全机构冠群金辰、趋势科技也紧急针对该病毒发布了愚人节预警信息。预警称,在偷偷感染了全世界超过1500万台电脑之后,被微软研究人员发现并戏称为“蠕虫模范”的Conficker蠕虫病毒即将露出其狰狞面目。

“该蠕虫正在它所感染的电脑中进行休眠式死循环,一旦系统时间到2009年4月1日之后,它就会醒过来,在一系列浮点运算后,向上百家预先指定的网站发送数据包,以其在全球多达上千万台电脑的感染量来判断,它们所组成的僵尸网络在互联网世界中威力不亚于核武器,任何一家网站的服务器,在这样高强度攻击压力下都会迅速瘫痪,而这些攻击目标很可能是Conficker操纵者在Alexa流量排名中选取的高排名站点。”360安全中心的工程师分析称。

“Conficker作者如果没有进一步动作,那将很难追踪到他的真实身份,而一旦他启动攻击,后果绝对不堪设想。”360安全工程师称,Conficker蠕虫中仅“C”变种的感染量就在上千万台规模。

局域网更是Conficker容易传播的场所,往往一台电脑‘中招’就会导致整个局域网出现大面积感染,企业员工除了尽快为电脑修复漏洞补丁外,用户还应在使用U盘前尽量开启具有U盘防火墙功能的安全软件。

参考:黑客将可能发动史上最强攻击

杂碎2:Google会将“/”和“/index.html”视为一个页面
Search Engine Roundtable在Google网站管理员论坛上讨论有关链接的问题时,有Google员工证实Google搜索引擎通常会将“/”和“/index.html”视为相同的URL地址,除非通过这两个地址打开的是不同内容的网页。

参考:散人

杂碎3:再见,Google
当我加入时,我本来以为有可能帮助Google改变原有的设计理念。但是我最终明白了在我到来前Google的设计理念存在已久了。Google就像是一艘超级航母,而我只是一个试图把它推到正确方向上的小橡皮艇。
一封带有感情色彩的离职信
Keso说:很可能,Doug Bowman加入Google原本就是个错误,他应该去Apple。Google就是工程师主导的文化,相信技术,相信数据。而Apple则是以设计来统领技术的公司,用技术去实现不可能的设计。各有各的道。

白鸦:似乎大家都认为设计师就应该去Apple、工程师就应该去Google,那样的企业文化才适合作设计/研发,才不会埋没自己。但我不这么看,每个公司都有自己的文化,都有自己的主角、配角,不可能每个角色都是主角,Google的主角是工程师、Apple的主角是设计师、Sina的主角是编辑。
无论在企业文化中设计是主角还是配角,所有的设计师都得去面对他,先做好自己的主角。

杂碎4:快速消费品这个典型的传统行业和新兴的社会化媒体营销之间有多远的距离?
活动的参与者充分使用了包括Blog、Twitter、MySpace、Facebook、Youtube、Digg在内的多种社会化媒体工具,并利用他们在社会化媒体方面的技巧和丰富经验来推广这项活动,以期为自己的小组销售更多的T-Shirt。
4个小组在4小时内共卖出超过3000件T-Shirt,加上P&G的捐助,总共筹集了超过10万美元的善款。值得一提的是,在这次活动中Blog和Twitter这两种工具发挥了最重要的作用。
活动的结果无疑是非常成功的。4个小组在4小时内共卖出超过3000件T-Shirt,加上P&G的捐助,总共筹集了超过10万美元的善款。值得一提的是,在这次活动中Blog和Twitter这两种工具发挥了最重要的作用。
当然,这次活动的成功结果有着它的特殊原因,这40多位社会化媒体专家在活动中多少利用了自己在各种社区中的知名度和关系。而且这也不能算是纯粹的商业活动,因为所有的销售所得捐助给慈善机构。不过我们至少可以看到,即便是在快速消费品这样传统的行业中,社会化媒体作为一种工具,也还是可以为企业的市场营销活动所利用。

参考:
在Twitter上的讨论
P&G的Social Media Marketing实验

杂碎5:Blog营销中的精神认同

Keso应南非大使馆的邀请去了趟南非。这在吕欣欣看来,南非的这笔公关费花的太值了。因为在最开始的时候,人家就几乎没提什么要求

Keso的Play with 南非来说,在几乎没有要求的情况下,他作为一个知名的IT博客,为什么愿意以这样大的篇幅去撰写?大概会有以下一些原因:

1 一个Blogger被一个国家的大使馆邀请,尤其还是一个旅游胜地,本身就是一个非常高的荣誉。人,总是愿意把荣誉和别人分享的。

2 对于大部分的网民,南非是一个神秘的国度。作为被邀请的Blogger会感觉有揭秘的冲动,这同样会让自己产生荣誉感。

3 人总是有平等的心理的,南非邀请但不要求,反而会让这些Blogger产生回报的心理。

这些,就是我题目中所说的精神认同,是Blog营销中的最高境界。南非的这次邀请之旅无疑是成功的,可能他们在最开始的时候就预期,这些被邀请的Bloggers一定会如实的记录他们的行踪的。

参考:北城

杂碎6:youtube不能够访问
据百度新闻资讯,谷歌旗下的视频分享网站TouTube,近期出现不能够访问的情况,许多网民反映:youtube打不开、youtube上不去、youtube上不了。

根据相关信息表明,youtube是因为许多不恰当的视频内容,被有关方面做了技术上的合理处理,意在打击youtube此类对视频内容放任的经营态度。

参考:eastvipcn

杂碎7:知名域名8848忘记续费被抢注
域名8848.com指向了淘宝网,通过查看王峻涛博客原文《关于8848指向淘宝的个人声明》,认为这是因为忘记续费,被别人抢注了。

参考:eastvipcn

杂碎8:联通WCDMA学堂开课 3G iphone做奖品
客服证实联通iphone已经入华新闻后,又在上海一家当地社区上发现了联通的一个推广宣传专题。用户在了解WCDMA相关知识后进行答题可以获得如意通靓号和3G版iphone手机,我想联通提供的奖品不大可能是水货吧(*^__^*) 。
上海联通已经开始了WCDMA相关内容的宣传,介绍了WCDMA的三大卖点、WCDMA手机、九大特色业务等。
上海联通在网站上介绍,WCDMA是当前世界上采用的国家地区最广泛、终端种类最丰富的一种3G标准。已有254个WCDMA运营商在110个国家开通了 WCDMA网络,3G商用市场用户份额超过80%,而WCDMA向下兼容的GSM网络(可平滑过渡到WCDMA)已覆盖184个国家,遍布全球。 WCDMA用户数已超过2亿5千万。

参考:笑熬浆糊

杂碎9:Google AdSense测试人民币电子转帐 最低400元可支付

目前一些站长已经收到了测试邀请,对于个人用户,谷歌将从付款中预先扣除税金,企业帐户则需要在收款前提交发票。

以下为邮件全文:

尊敬的发布商您好,

如果您现在登录您的AdSense帐户的话,您会发现我们已经向您提供了测试版的人民币电子转账付款,您可以更加方便的获得您的付款了!

您将在以下方面受益:

1、Google会采用电子转帐的方式将您的AdSense收入以人民币存入您的银行帐户

2、只要您的收入达到400元人民币的下限,即可获得付款,无需达到100美元

3、累计收入以人民币计算,而非美元

4、可查看以人民币而非美元结算的报告和付款历史

请注意,对于个人账户,相应税金会从给您的付款中预先扣除。如果您有AdSense企业帐户,则需要在收款前提交发票。您将帐户切换至AdSense中国之后,就无法再切换回以美元为币种的帐户。

在下周的早些时候,我们还会向您推出有关此变化的详细说明并向您进行通知,您届时同样也可以点击您账户内的相关帮助中心链接了解更多详情。在此之前,如果您有任何问题的话,请回复此邮件,我们将很高兴为您解答。

此服务为我们推出的测试付款服务,请您与我们直接联系处理相关问题,请协助我们进行此测试并勿向外界泄露相关测试内容,感谢您的理解与配合。

Google AdSense 小组敬上

参考:笑熬浆糊

杂碎10:百度个性化首页即将上线(附外测ip地址)
功能和iGoogle相似。目前,外部可以通过ip地址进行访问。ip地址是:http://220.181.6.16/

参考:笑熬浆糊

杂碎11:Twitter的四种商业用途
根据Garnter的研究结果,公司使用Twitter的方法可以归为四类:直接、间接、内部使用,以及收集信号。
参考:pestwave

杂碎11.2:Twitter的收费尝试——付费高级账户

Twitter没提供多少关于付费账户所提供功能的细节。该公司指出,它的服务永远是免费的。即便是付费账户所针对的客户群——名流与商业用户,一样可以使用免费服务。创始人Biz Stone暗示,一些众望所归的功能已在开发中,如流量分析和确定名流身份的“帐户验证”。不管具体细节,Twitter已经非常清楚地表明,它打算使用、借鉴其他人已经在尝试的各种Twitter收入流。
参考:logout

杂碎12:尝试第二天
做个记录 :)

今日一点 , , , , ,

今日杂碎:辞岁迎元旦

December 31st, 2008

杂碎1:顺着友情链接送啦一圈新年祝福回来:)

杂碎2:修改永久链接格式

由原来的“/%category%/%postname%-%post_id%.shtml”改为现在的“/%category%/%postname%-%post_id%/”

主要是为啦兼容wp2.7的留言分页格式!

原来的永久链接和留言分页混在一起结果就变成“http://clin003.com/guest-bookcomment-page-1#comments” 这样的啦很郁闷,就遇到404错误页啦

于是修改永久链接格式在后边加个”/”。

在这里要特别表扬(感谢)下“淡然”兄帮俺把以前带“.shtml”的404链接转向到对应到现在的正确链接位置。

$tmp = $_SERVER['REQUEST_URI'];
if(strtolower(substr($tmp,-6)) == '.shtml')
{
$tmp = str_replace(".shtml", "/",$tmp);
header('Location: http://clin003.com'.$tmp);
}

这样子好了,又要忍痛让搜索引擎对偶换次血啦

另外,昨天对Rss输出进行啦重定向,就是非google的feedburner蜘蛛访问,都自动转向到google为我烧制的feed地址。
具体就是在”.htaccess”中添加如下内容:

RewriteCond %{HTTP_USER_AGENT} !FeedBurner
RewriteRule ^feed$ http://feeds.clin003.com/only [R,L]

杂碎3:在此祝福亲朋好友父老乡亲兄弟姐妹在牛年,牛气冲天,“牛”转乾坤,牛牛牛。。。

今日一点 , , ,

百度准备自杀啦?

September 14th, 2008

有点标题党的感觉

先是淘宝封百度蜘蛛,然后消息称百度有意重新收录被长期封掉的域名

。。。

现在发现百度开始对“博客”降权处理

依“总而言之,统而言之”的说法是针对投放啦“阿里妈妈”广告的站,那岂不是“被处理”的更多啦!

我也带问下“你们的网站因为投放阿里妈妈广告而被百度降权了吗?”。

以下是几个博客发的相关文章:

投放阿里妈妈,你被百度降权了吗?

前几天就有网友不断跟我说,自从投放阿里妈妈广告之后,网站就被 baidu 降权了;现在 baidu 已经不再收录或者只收录其网站首页。但昨天广告发布者论坛称,baidu 降权可能只是传闻。

投放Alimama是否真的影响Baidu的收录

现在DavidYin还不愿做任何猜测,而且数据也不够多,也只是一个Blog的数据。只是我觉得有趣的是自八月底开始投放Alimama广告后,来自Baidu的流量略有下降,而来自Yahoo的流量则是大踏步的前进。
。。。

顺便提一句,把某一个搜索引擎带来的流量当作唯一的依靠,是非常不可靠的,多样化是最好的保障。

百度真的遵守 Robots.txt 协议吗?

外根据最近一段时间对我爱水煮鱼在百度搜索结果的观察,百度已经不再收录很多博客新的文章,即使收录了一两篇也是权重很低,我原本以为是自己个人的问题,后来发现好几个博客也有同样的问题,比如潘大财经专题站。

留言中也有不一样的争论

这段时间花果山寨反而得到百度不少的收录,现在来自百度的IP要比GG多很多!

2008,百度的日子不好过

搜索引擎本应与个人博客(独立媒体)是同一意识形态阵营,如今却将个人独立博客尽数降权,这实在令人费解。我所尊敬的那个李彦宏,那个曾经坦言“面临各种诱惑仍然坚定不移地做最好搜索引擎”的百度,似乎已经开始变得难以追寻。自从“竞价排名”这种盈利模式像兴奋剂一样注入了百度,搜索引擎本身似乎已经不再被百度所重视了。反观Google通过Webmaster、Analytics等一系列产品进一步追踪整个互联网流量和用户行为并建立自己庞大的数据中心,百度实在太缺乏这方面的创新了。

检查是否被降权可以简单的在百度中搜索”site:clin003.com” (不带引号,域名换成你的),然后看首页是否在第一项!(PS:不保证这方法准确有效,但对google来说还是有效的,毕竟人家百度还有人工智能操作控制这一说 :P

今日一点 , , ,

“垃圾”网站信息搜集【信息内容来自互联网公布】

May 17th, 2008

弹出网页(很垃圾,不声不响就出来啦,机子没病毒插件。。,貌似isp服务商“合作伙伴”): 1583.cn

Pinging 1583.cn [210.51.23.87] with 32 bytes of data:

Reply from 210.51.23.87: bytes=32 time=45ms TTL=117
Reply from 210.51.23.87: bytes=32 time=45ms TTL=117

获得1583.cn的ip
查询“查询一个ip下多少网站”

http://whois.webhosting.info/ip

http://www.myipneighbors.com/

查询结果(部分ing)

1) 6xb.cn
2) CNOX.COM
3) LESHI.COM
4) XN–RHQ025M.COM
5) XN–RPY.NET
6) baid.qov.cn
7) bbs.jija.com.cn
8) btp.17010.com.cn
9) byeducation.com
10) cherison.cn
11) chinapace.com
12) chuanger.com
13) cnmedia.cn
14) diy163.com.cn
15) dopa.com
16) ebc.com.cn
17) ec51.cn
18) emailfly.com
19) focusme.cn
20) foodunion.com.cn
21) guanmao.com.cn
22) gzittv.com
23) jhjtgs.com.cn
24) jija.com.cn
25) jov.cn
26) liangjiao.com
27) microdrive.com.cn
28) online.jl.cn
29) paradise.sh.cn
30) ppk45.com
31) search3.365.com
32) simanan.net.cn
33) sy.chian.cn
34) toptech.com.cn
35) wecomesh.org.cn
36) woyumen.com
37) wucheng.cn
38) xinzhe.com
39) xn--turv34eulqseb.com
40) zhantang.com
41) zivi.com
42) zvc.com.cn

发现大多网站内容雷同,甚至最下边的备案信息都一样

浙ICP备05046553号

然后登录信息产业部icp/ip地址信息备案管理系统,公共查询
获知

备案公共信息查询结果
序号     主办单位名称     备案/许可证号     网站名称     网站首页网址     是否备案     详细信息
1     杭州三六五网络有限公司     浙ICP备05046553号     信息搜索,一步到位     www.61.151.253.88     已备案     浏览

是“杭州三六五网络有限公司”搜索下相关字,知道它有个商业搜索引擎(看着垃圾弹出网页的份上偶就不用啦,bs到底吧)
使用ip来查询下
在产业部查ip等于白查(不知道是不是系统bug),下边是ip所在地址信息。(PS:貌似这个“idc出来的都是垃圾站”,可以自己去搜索下这个ip和idc名称)

ip138.com IP查询(搜索IP地址的地理位置)
您查询的IP:210.51.23.87

* 本站主数据:上海市 漕河泾网通IDC
* 查询结果2:上海市 漕河泾网通IDC
* 查询结果3:上海市 漕河泾网通IDC机房

流氓

Ok365.com 平台服务提供商:
杭州三六五网络有限公司
地址:杭州市绍兴路400号8层
电话:0571-85357365
邮件:service@365.com

Ok365.com 投资商:
中国网络有限公司

今日一点 , ,

mediawiki页面伪静态配置调试

May 7th, 2008

简单mediawiki页面伪静态配置:

最简单的莫过于把LocalSettings.php中添加一句$wgUsePathInfo = true;啦这样默认的连接是”http://wiki.clin003.com/index.php/首页”,这种链接用的也很普遍的,并且还没有发现什么问题。

自定义mediawiki页面伪静态配置:

链接样子“http://wiki.clin003.com/wiki/%E9%A6%96%E9%A1%B5”(这是首页的链接)。

配置方法为:

首先建立一个.htaccess文件,内容为:

##安装路径在子目录!!

RewriteEngine on
RewriteRule index.htm /e/index.php ##这里需要在根目录建一个index.htm的空文件
RewriteRule wiki/(.+) /e/index.php/$1 ##主要这里解决的搜索没结果问题,和下边的重复有点混乱ing
RewriteRule wiki/(.+) /e/index.php?title=$1

推荐使用的.htaccess文件内容(来自官方文档):

PS:使用这个你就不用在根目录建index.htm空文件啦

##http://www.mediawiki.org/wiki/Manual:Short_URL/wiki/Page_title_–_no_root_access

Options FollowSymLinks
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^wiki/(.*)$ e/index.php?title=$1 [PT,L,QSA]
RewriteRule ^wiki/*$ wiki/ [L,QSA]
RewriteRule ^/*$ wiki/ [L,QSA]

然后编辑LocalSettings.php

$wgScriptPath = "/e";         # Path to the actual files (right part of first rewrite rule). Should already be there
##mediawiki安装的(相对根目录)路径,若在根目录安装的就留空吧
##推荐安装在子目录的目的是方便对搜索引擎蜘蛛的爬行控制
$wgArticlePath = "/wiki/$1";  # Virtual path (left part of first rewrite rule). MUST be DIFFERENT from the path above!
##虚拟路径,这个可以自定义,但不可以与安装目录重名(重名的话就没多大意义啦,直接使用第一种办法)。
想了解更多的mediawiki伪静态配置办法可以访问:http://www.mediawiki.org/wiki/Manual:Short_URL#Defaults

控制搜索引擎蜘蛛访问:
再根目录放置robots.txt内容为
User-agent: *
Disallow: /e/
Disallow: /wiki/Special:Search
Disallow: /wiki/Special:Random
这样就禁止所有搜索引擎蜘蛛爬行/e/目录(mediawiki程序安装目录),搜索结果页面,随机页面。
PS:本来以为自己找到解决这个搜索问题啦,可发现维基百科提供的.htaccess跟实用,所以就推荐官方的那个啦,我写的那个.htaccess就不推荐使用啦o(∩_∩)o...哈哈

考虑服务器负载的自定义mediawiki页面伪静态配置:
from:http://easun.org/archives/wikimedia_wiki_url_short.html
1.改名字:

    mv index.php show
    mv redirect.php redirect

2.修改.htaccess 规则

    <Files ~ (show|redirect)>
    ForceType application/x-httpd-php
    </Files>
    DirectoryIndex show

3.修改修改LocalSettings.php 中 $wgScript,$wgRedirectScript,$wgArticlePath 的值

    $wgScript = "$wgScriptPath/show";
    $wgRedirectScript = "$wgScriptPath/redirect";
    $wgArticlePath = "$wgScript/$1";

因为没有使用 mod_rewrite ,网站的负荷下降,效率当然提升了:)

Wiki支持, 今日一点, 搜索引擎 , , , ,