分类目录归档:Blog

WordPress SEO robots

robots.txt 是放置于域名根目录的一个文本文件,其作用是”声明站内规则”,即告诉搜索引擎一个站点中哪些内容它可以抓取,而哪些不能。站长通过向 robots.txt 写入规则来和搜索引擎”沟通”,以此保证站点的内容能够按照自己的意愿出现在搜索引擎当中(百度只部分遵守)。

搜索引擎爬虫开始抓取一个网站,它们首先做的事情便是读取这个网站的 robots.txt。

根据 WordPress 的特性,SEO 必须从 robots.txt 做起。WordPress SEO 权重调节篇已经阐明了单篇文章的重要性,本篇 robots.txt 和 meta robots 则是我们调整 WordPress 内部权重的重要工具。

先来看看我的 robots.txt 文件内的规则:

User-agent: *
Disallow: /index.php
Disallow: /wp-
Disallow: /*/feed
Disallow: /*/*/feed
Disallow: /*/*/trackback
Disallow: /wap
Disallow: /page
Sitemap: http://shawnster.org/sitemap.xml

我逐条分析并解释原因。

1. User-agent 即搜索引擎的爬虫,以星号(*)匹配,表明之后的规则通用于所有搜索引擎。如果需要针对单独的搜索引擎制定规则,则需要写出该搜索引擎爬虫的具体名称,例如 Baiduspider 。

2. 一定有人会奇怪为什么我要禁止爬虫抓取 index.php 。Disallow,意为不允许。当我发现搜索引擎并不那么聪明之后,我加入了这条规则。对搜索引擎来说,shawnster.org/ 是首页,而 shawnster.org/index.php 是”另一个”首页。搜索引擎一不小心发现 index.php 的存在,给抓进去了,最后的结果是:shawnster.org 有两个 meta description 页面描述完全相同的页面。首页就这么不明不白地被另一个自己分散了权重。

3. 不允许抓取 /wp- 。这是一个省略的写法,完整的意思是不允许抓取域名根目录下所有以 “wp-” 开头的文件和文件夹。名称为 “wp-” 的文件夹在我这里都是 WordPress 的系统文件,给搜索引擎抓了去对大家都没好处。

4. 不允许抓取 /*/feed 。shawnster.org/comments/feed 和 shawnster.org/comment/feed 都是我不希望被搜索引擎抓取到的,它们对搜索引擎和我来说都没有意义。为了简化写法,我用了通配符。反正我这里除了 /tag/feed 之外没有第四个可以被匹配到的路径了。前三个我本来就不希望它们被搜索引擎抓取。

5. 不允许抓取 /*/*/feed 。shawnster.org 的永久链接结构为 /分类名称/单篇文章,这个规则匹配的便是 /分类名称/单篇文章/feed,意为不允许搜索引擎抓取单篇文章的评论 feed。

6. 不允许抓取 /*/*/trackback 。理由同上,不允许抓取单篇文章的 trackback 地址。

7. 不允许抓取 /wap 。我安装了 wp-t-wap 插件,生成的 wap 页面都包含在里面,还是出于不被分散权重的理由,禁止。

8. 不允许抓取 /page 。举例来说,shawnster.org/page/2 是首页的”第二页”,它同样和首页的 meta description 相同,所以禁止理由也和第2条相同,我就不罗嗦了。需要注意的是写法,你也可以写成 Disallow: /page/* ,它们的意思都是一样的。

9. 声明 sitemap 所在地。其实这并不是一个必须的条目,不过写上可以让搜索引擎对 sitemap.xml 的读取更频繁一些。

需要注意的是,robots.txt 不通用,直接拿我的 robots.txt 内容放在你那里很可能起反作用。我看到有些博友无私地将自己的 robots.txt 分享出来让别人 copy,这种举动很愚昧。就像每个 blog 有不同的永久链接形式一样,你必须根据自己的实际情况来定制 robots.txt。之所以要逐条解释我的 robots.txt,也是出于这方面的考虑。

robots.txt 也不要写得太复杂。由于存在通配符,条目越多,交叉领域也越多,把爬虫搞糊涂对你的站点没有好处。这里有一个 Google 官方的 robots.txt 定制指南,详细解释了各种通配符的用法,有兴趣的朋友可以参考一下。

当然,要达到 “固定页面数量+单篇文章数量+首页” 的结果,仅依靠 robots.txt 是不够的。我们还需借助 meta robots 的帮助。

meta robots 是写在页面内的,具有更多可操作性的 “robots.txt” 。”shawnster.org/年份/月份” 是我这里按月存档的路径,我不想搜索引擎抓取它们,原本可以在 robots.txt 里面写 Disallow: /200* ,但这样的损失很大。要知道,写在 robots.txt 里面的内容是完全禁止搜索引擎抓取的。一旦我彻底禁止了爬虫对存档页面的爬取,那我的内链就会损失很多。

meta robots 更多可操作性的用处就在这里了。

<meta name=”robots” content=”noindex,follow” />

当搜索引擎读取到页面上的这个标签,便不会收录该页面。但其仍然会跟踪页面内的所有链接,使内链关系继续维持。

我们没有在页面内插入任何 meta robots 属性时, 爬虫对页面会以 “index,follow” 来对待,即收录且跟踪链接。如果有需求的话,我们也可以使用 “index,nofollow” —— 收录但不跟踪页内链接。meta robots 还有一个不常用的属性,noarchive 。该属性可以控制搜索引擎是否建立网页快照。

通过 robots.txt 和 meta robots,我们完全可以控制好搜索引擎对 blog 的收录数量,发挥单篇文章的最大价值。SEO for WordPress 的乐趣有很多,robots.txt 和 meta robots 便是其中之一。

再次提醒,本文的例子不能通用,请一定根据自己的实际需求进行相应操作。

P.S.

这里有个工具,地址为 http://whois.domaintools.com/ ,里面的 SEO Score 代表了页面对搜索引擎的友好程度。使用方法为地址栏输入: http://whois.domaintools.com/你的域名。

WordPress SEO 系列:

WordPress SEO 权重调节

WordPress SEO 友好程度

WordPress SEO Heading Tag

相关阅读:

WordPress SEO 搜索引擎优化

WordPress SEO Google Webmasters

Google Webmasters 听起来很像另一种 Google Analytics,实际上它是一款强大的可视化 SEO 工具。作为 WordPress Blogger 的你,无论是否了解 SEO,都应该马上开始使用 Google Webmasters。

要开启 Google Webmasters 的完整功能,首先需要进行网站验证。这一步同 GA 一样,选择添加元标记或上传 HTML 文件都可以。个人建议选择上传 HTML 文件,验证过程会更快一些。

验证通过之后,紧接着应该提交自己的 sitemap.xml 地址。即便安装了有关 Sitemap 的 WordPress 插件,这一步也是不可省略的。Wordpress 插件自动生成的 sitemap.xml 偶尔会出错并且不易察觉,该操作的目的之一便是检测 sitemap.xml 的正确性。不仅如此,提交 sitemap 给 GW 更为显著的好处是你可以随时选择”重新提交”来通知 Google 站点的变化(觉得 XML sitemap Generator 就可以做到?你错了!)。

在 概述 选项中, Google Webmasters 将给出站点的整体情况,包括主页抓取、索引状态以及网络抓取错误。应该注意的是 sitemap 中存在的网址错误。网址错误一般因 robots.txt 中的”越界”规则造成。以前我说过,robots.txt 里面大量使用通配符,如果语句过多会出现”交叉点”。有关如何撰写 robots.txt,请参考—— WordPress SEO robots

接下来重点关注 故障诊断-内容分析 一栏,如发现重复元描述(Meta)或重复内容的网页,则应尽快着手处理。含有相同 meta description 的页面,权重会被降低,重复度过高甚至将导致整站降权。要解决这些问题,你应该先了解问题产生的原因。

几乎所有的 WordPress 模板都调用同样的 header.php 生成头部内容,那么理论上每个页面的头部都是相同的。如果曾经为了 SEO 手动添加 meta description 和 meta keywords 标签到 header.php,出现重复元描述的警告就不可避免了。此情况要求你必须立刻移除之前添加的 meta,然后等待 Google 的更新。至于重复内容,基本上都是更改永久链接之后遗留下来的。例如曾经将 a.html 改为 b.html,之后若 a 和 b 同时存在于搜索结果中,Google 便会认为这个站点有两个地址不同但内容相同的网页。个别几个页面含有重复的元描述大体上也是更改永久链接的”后遗症”。

针对”后遗症”问题,请移步 Google Webmasters 工具 栏目中的 删除网址 选项。该选项让你可以删除不希望显示在搜索结果中的网页(当然只能是你自己网站里的网页),也就是说删除造成重复内容或元标记的过期网址。在过期网址出现于第三方的网页的情况下,其不可被删除。举例来说,如果有人引用了你 Blog 的内容,并给出了文章的地址且被 Google 索引到,则该网址不能被删除。

不能被删除的地址应使用 301 转向。在 .htaccess 里添加如下内容:

Redirect 301 /a.html /b.html

即把 a.html 重定向至 b.html,301 是对搜索引擎友好的永久转向形式。经过一段时间之后,a.html 将在 Google 的搜索结果中消失。

到这里,Google Webmasters 里面的重点部分就介绍完了,其实 GW 还有很多关于站点优化甚至用户体验优化的工具和选项,有兴趣的朋友可以自行尝试,因为是简体中文界面,我就不过于罗嗦地一一介绍了。

关注 SEO 你还可以参考这个页面(为了SEO XD)。

Dot TK免费域名申请以及Host1Freee免费空间申请绑定(二)

Dot TK免费域名申请以及Host1Freee免费空间申请绑定(一)已经说明怎样申请免费的域名了。现在来说一说如何申请免费空间。我用的是Host1Free的免费空间,感觉速度还行,是个挺不错的免费空间。Host1Free是一家来自英国的免费空间供应商,提供支持PHP+MySQL及容量10GB,月流量150GB的免费空间,Host1Free空间相关参数不多,绑域名数,子域名,子目录数量均为5,可建2个数据库,1个FTP连接,使用的DirectAdmin控制面板,较之cPanel操作比较笨拙。免费空间服务器在美国,速度还是不错的。申请过程简单,填写域名和电子信箱,到信箱确认一下,即可快速开通。 点评:Host1Free的免费空间速度不错,关于稳定性,做了很大的改善,很少时间有维护,确实做到了99.9%的运行率。新注册的朋友还可以享受稳定的服务,可以用来测试,但是不要浪费资源。访问速度很不错的,目前这个免费空间服务器还不到10台,不知道以后发展会怎样。

(一)申请免费空间,申请地址:http://www.host1free.com/,

1、复制并打开链接,如下图所示的网页

点击Order now!进行申请。

2、点击后跳转至下一个页面,如下图:

先填写你要绑定的域名,然后填写邮箱(作为登录账户)、密码,接着是验证码,最后点击Create Account完成账户注册。

3、完成账户注册之后,跳转至下一个页面,如下图所示:表明注册成功,并且告诉你所有的信息将会发送到你注册的邮箱中。

在邮箱中查看你的管理信息。

4、还在这个页面中,点击右上角你邮箱旁边的图标进入你的管理界面。如下图所示:

点击后,跳转后的页面会出项你的账户信息。

标记1的地方是你的DNS服务器名,标记2的地方是你上传时所用的FTP地址,用户名和密码。

5、申请完空间后,现在来设置域名的DNS服务器,进入你的域名管理界面(Dot TK),如下图所示,点击我的域名中的我的域名列表,然后在右侧点击修改。

6、点击修改后会转至下一个页面,如下图所示,首先在下拉列表中选择“使用自定义DNS服务”,然后点击“设定”,接着点击下面的“添加另外一个服务器名”,这样就有两个服务器要填了,而之前标记1的地方就有两个服务器名,把他们填在这儿,最后点击下一步,一切完成。

7、不过要等上一段时间才能访问该域名,不着急,你可以先使用FTP工具去连接你的空间,然后把public_html文件夹下面的内容删掉,在上传自己的网站源码。也可以在空间的网页控制面板中去添加数据库。一切就看你的了,祝你好运~~~

 

Dot TK免费域名申请以及Host1Freee免费空间申请绑定(一)

DotTK提供yourname.TK的免费顶级域名,网站有简体中文版,具有很多年的历史,应该是最先免费的顶级域名了!过去曾经屏蔽中国用户IP,最近发现中国大陆地区已经重新可以访问注册.TK域名了!(.TK是南太平洋岛国托克劳的国家域名)免费注册一个帐户可以任意申请.TK域名,支持域名转发(可隐藏原URL)、电邮转发、A记录解析、CNAME别名记录、MX邮件记录、设置DNS服务器等服务。

申请地址 :http://www.dot.tk/zh/pageA00.html

申请教程如下:

1、首先通过上面的 申请地址 进入.TK顶级域名注册官网上方填写您想注册的域名名称。填好域名之后点击下一步 。

2、点击下一步之后显示下图所示的页面即代表该域名可以继续免费注册。您可以直接点击“下一步 ”继续注册。

3、第二步中信息确认之后,如上图所示点击下一步 进入下一个注册页面,如下图所示:

注意:  这里的“您网站的URL”,图片中填写错误,应该是http://www.tygblog.tk,因为之前申请时申请的是http://www.tygblog.tk。

4、填写完所有后,点击下一步。进入账户注册。如下图所示:

这个账户信息会发送到上一步填写的邮箱中。点击下一步,注册完成,如下图:

现在你就可以去邮箱收取邮件并激活账号了。

5、进入邮箱查看邮件,点击激活链接,如下图所示:

在确认编码中填写邮件里的编码,点击确认完成账户激活。确认完之后,页面会跳转到首页,点击右上角的登陆进行登陆,账户名跟密码邮箱里也有。进入后点开我的域名(My Domains),其中有一个我的域名(List My Domains ),点击后就会显示你注册的域名。

到这里,您已经注册完一个免费域名了~下一步就是申请免费空间,然后将域名与空间相互绑定就可以了。

免费空间申请,以及域名绑定请看Dot TK免费域名申请以及Host1Freee免费空间申请绑定(二)。

 

教你在wordpress日志中插入音乐(免插件)

适当在博客中插入音乐会让文章更加出彩,那么如何在wordpress中插入音乐呢?对于有些WP新手还是有点小问题的,下边小编教你如何处理。

插入音乐的方法主要分为两类
1、在线音乐播放器
2、安装wordpress插件

小编今天主要教你如何免插件在文章中播放音乐,播放MP3。

第一款播放器

Blogcastone :http://www.blogcastone.net/()这个地址有时候不稳定,大家可以选择下边的。

Blogcastone基于Audio Player制作的在线音乐播放器,只要输入Mp3地址就可以自动生成播放代码,拥有多种配色方案.

NO.2

Google Reader MP3 Player

代码如下:

<embed type="application/x-shockwave-flash" src="http://www.google.com/reader/ui/3247397568-audio-player.swf?audioUrl=MP3文件url" width="400" height="27" allowscriptaccess="never" quality="best" bgcolor="#ffffff" wmode="window" flashvars="playerMode=embedded" />

这是Google Reader的音乐播放器,稳定性是有保证的不过可供选择的样式只有一种,使用时把以下代码粘贴到博客即可,别忘了替换Mp3文件的url.

Yahoo Mp3 Player

<embed src="http://webjay.org/flash/dark_player" width="400" height="30" wmode="transparent" flashVars="playlist_url=MP3文件URL&skin_color_1=-145,-89,-4,5& skin_color_2=-141,20,0,0" type="application/x-shockwave-flash" />

使用方法和Google Reader MP3 Player一样.

豆瓣 MP3  PLAYER

上面的都是国外的播放器,下面介绍一款国内的豆瓣的在线音乐播放器,使用方法和上面差不多

<embed src="http://www.douban.com/swf/player.swf?url=MP3文件URL&amp;autoplay=0" type="application/x-shockwave-flash" wmode="transparent" allowscriptaccess="always" width="400" height="30">

第二类:安装wordpress音乐插件

这类插件比较多,不一一介绍了。

http://www.hey33.com/tag/wordpress中插入音乐