Category: 狗尾草

狗尾草栏目讨论以Google为代表的搜索引擎及搜索引擎优化技术。与 SEO 有关的文章早已铺天盖地,我再写几篇权当狗尾续貂,因为SEO 实在很热门,想让我不谈及它也难。

  • W3C markup validator soap interface may be outdated

    我想在一个网站上添加W3C markup xhtml 自动验证功能:如果一个网页通过 xhtml 验证,就会在页脚出现 W3C 设计的一个”valid” Icon;如网页未通过验证则不会出现该标志。

    W3C markup validator 能以 soap 1.2 方式输出验证结果,但无论我在 php SoapClient 里怎么设置传递参数,它总拿不到 validator soap response。W3C 对此 soap interface 也没提供足够的说明文档,我仅知道它不支持 wsdl,我猜想 soap method 应该是 validate 或 check,但猜想归猜想,实际上没有一个能返回我想要结果。

    我想这跟 W3C 声称 soap output 只是个实验型产品有关,soap 以外还有其他方式的 output,难道多年来 soap 受到的关注较少?如果硬要以 soap 方式 得到 validator 的结果,我只能用 PEAR Service W3C HTMLValidator package,但看到这个 package 多年来一直没有更新,它所依赖的 HTTP Request package 已经废弃(Request2 取代之),而 HTTP Request package 所依赖的 Net URL package 也已废弃 (URL2 取代之)。这一连串的废弃让我觉得 Service W3C HTMLValidator 用起来不舒服。

    算了算了,反正我想要的只是一个网页自验证功能,何必用 soap client方式去访问 validator 呢?最后我用 file_get_content()了事。

  • No deplicate posts any more in WordPress

    刚用上WordPress后,我发现WordPress一个不足之处——同一个post_id的post,可以用不同的url来访问。

    以此blog为例,我设置permanent link structure为/%post_id%/%postname%/。我认为post_id查询最快,postname又是meaningful string,最有利seo,所以我把两者结合起来了(后来据说顶层目录的文件最利于seo,所以我更喜欢设置permanent link structure为/%postname%_%post_id%.html,但据说Google不吃这一套,那我就没必要为一些小引擎去劳师动众修改现有的blog,扯远了)。

    当permanent link structure存在post_id和postname两个参数时,post_id起决定作用。早期版本会完全忽略postname,造成只要post_id是正确的,任何杜撰的postname都会被承认。设想一下,如果我发布了一个post以后修改了postname,搜索引擎读到不同url上的相同内容,肯定会降低对此blog的评价。

    所以,当时我想改一下WordPress程序逻辑,当post_id存在但url中的postname不等于数据库中的postname时,返回404页。但是我还没来得及做这个修改,今天惊喜发现WordPress 2.6 (可能更早的版本已经实现了这个修改) 已经会把/(post_id)/(incorrect_postname) 301跳转到 /(post_id)/(postname),这应该比我设计的方案更完好,我非常喜欢WordPress的体贴。

  • Create Effective Backlinks

    要有好排名得有好的backlinks,这个道理我很早就知道了,但一直未及深入研究。最近读到一篇文章很有可操作性,我准备依样画瓢。

    1. Use wordpress.com for creating your blogs. – WordPress has grate on-site SEO and blogs on WordPress.com get indexed pretty quickly. Once you create an account there, you can create unlimited number of blogs without having to register any new accounts.

      不指是直接使用wordpress.com的blog好,还是自己安装一个wordpress blog好?

    2. Write more then one post per blog. – Google loves backlinks that look natural and active blog that has your link in blogrol seems pretty natural. You can also include some backlinks inside blog posts linking to relevant parts of the website you are building backlinks for.

      到底写几篇post才算好呢?要知道写post很累的啊!

    3. Use Scribefire – Scribefire is grate firefox plugin that will allow you to write into your wordpress blogs from your browser. It helps a lot to have all your blogs listed in it and be able to drag-and-drop pictures from the web directly into your blog posts.

      Scribefire倒不必了,我觉得在线编辑已经很方便了。

    4. Your blog posts don’t have to be masterpieces – Remember you are not writing content for readers, you are writing it for spiders so it only has to seem relevant to the topic.

      这我知道,但我总会尽力写好post的。随便写点东西,或者排版很糟糕,搜索引擎可以糊弄过去,观众糊弄不过去啊。

    5. Promote your blogs – You won’t have much use of these backlinks if you don’t build backlinks for the blog. Luckily, building these backlinks is not so hard as you can use all the benefits provided by RSS feed. Submit your blogs RSS feed to as many services as you can that will create some backlinks out of it. It is also easier to do this when you have more blogs to submit at once.

      我觉得submit rss feed是最值得操作的。

  • 芳草苑不是方草苑, 还是芳草苑就是方草苑

    突然想起关心一下我的芳草苑以“芳草苑”的排名,还没进page 1,但也挺有意思,能进page 2。看来芳草苑的“芳草苑”还得继续努力。

    Google一直倡导不要为排名而排名,但是谁能做得到?刚才我查询芳草苑时,不小心输入的是“方草苑”。不知为什么,微软拼音给“方草”造了一个词,所以误查了方草苑。估计没有哪个楼盘是以方草苑命名的,也没有一个叫方草苑宾馆的,倒是另有个方草苑blog,估计主人姓方。但微软拼音肯定不止一次造过“方草”这个词,给过我肯定也给过别人,如果,仅是如果——

    • 我是芳草苑小区楼盘的开发商,或
    • 我开了个芳草苑宾馆,或
    • 我的芳草苑blog芳名远播,大家都冲着芳草苑这个名来看我

    那么我就要担忧了:我欢迎你们来看我啊,但是如果你们输错字去了方草苑怎么办?为了不丢掉客户,在Google还没这么智能之前(Google能知道什么客户什么时候输入方草苑其实是想去芳草苑吗?),我得将错就错,我不光得有芳草苑,有时还得故意写几个错别字叫自己为方草苑,说不定还要照顾到输入“芳草原”、“芳草园”的客户,这样想来就错别字就更多了。

    所以,为了告诉人们“芳草苑不是方草苑”,首先得屈从“芳草苑就是方草苑”。有这个必要玩这么哲学的命题吗?有,除非搜索引擎集体自杀。

  • google和彩票预测

    忍不住又想说说google的优越性。

    很偶然我在淘宝网上看到连续两个淘宝partner中国雅虎(或是雅虎中国——马云玩的文字游戏)的赞助商广告,是关于预测彩票、双色球的。其实我浏览的是电子产品的网页,跟彩票根本没有关系,没有相关性中国雅虎也照样播放广告,这不浪费广告业主的钱嘛——不过浪费一下靠预测彩票发财的广告业主的钱也是件痛快的事情。

    当然啦,有点知识的人都知道预测彩票都是骗人的。我关心的问题是哪些搜索引擎接受这样的广告,于是我在google里搜索“彩票预测”,结果右侧为空白,页面顶端也没有任何广告,可见google不接受“彩票预测”广告,然后我在yahoo,baidu,sohu等搜索“彩票预测”,结果满是广告。

    google的社会责任感就在这里体现!

  • 我的原创排名竟不如别人的原文引用

    很高兴我有篇post被别人原文照搬去了。但是如果按该篇的title搜,我的blog竟被后来居上。但这里有一点显著区别,google收录的是我tag下的页面,而不是single post page,引用者被收录的恰恰是single post page。也就是说,我的tag view page在和别人的post view page在竞争排名,竞争不过也情有可原。

    我觉得问题出在这个blog以前没有xml sitemap,google不知道到底该收录哪些页面,特别是某个tag如果只有一篇post,那么tag view和post view的主体内容是一样的,但是tag view的title是tag本身,post view的title是post title。没有特殊原因,google是不喜欢多个页面显示相同内容的,这大概是google随机收录了tag view和post view之一的原因。

    我的原创排名竟不如别人的原文引用,那不意味着这个blog的seo很失败?虽然排名还有pagerank等很多综合因素,但我还是不服气,于是赶紧装一个xml sitemap generator plugin。我设置xml sitemap同时包括post pages和tag pages,因为我觉得尽管有时主题内容是一样的,post page和tag page的侧重点还是不一样的,有必要被同时收录。

    过几天再来看排名。

  • SEO的最高境界——实则虚之,虚则实之

    我认为企业不应该过分注重SEO。

    何谓过分注重SEO呢?就是专门花钱请企业外部的力量来做SEO。何谓企业外部的力量?比如通过买卖外部链接,可现在大家都知道买卖外部链接适得其反,于是SEO consultancy又提出各种方法,比如去publish article with backlinks,比如建blog,比如搞flickr,总之SEO consultancy认为这些方法比较自然。可是真的自然吗?

    一个小企业,每周发表两篇文章,快成新闻出版社了;blog强调一种自由的氛围,并不是所有企业都有这种氛围;flickr就更个人化了,把产品的照片放那上面怎么看怎么别扭。

    google的哲学其实很简单,google说,你们要当我不存在,做好usability,增强用户体验就可以了。google这一招欲擒故纵确实厉害,结果弄得大家越发看重搜索引擎,而且还要把SEO自然化。“自然”就是一个“度”的问题,我不是说SEO consultancy的建议没有用,但SEO consultancy作为一个第三方,它不了解企业的运作,只站在SEO的角度看问题,总归不那么自然。比如SEO consultancy要求企业不停地写文章,可是叫谁去写?相信绝大部分人都有读书时被逼着交essay的痛苦经历,恐怕没有人会愿意象小学生那样每周交两篇作文。

    我们毫不怀疑google的智能,既然google能看出谁买卖links,也能看出所谓自然化了的SEO手段,何况现在还有人肉搜索引擎。SEO其实是跟搜索引擎斗智斗勇的过程,SEO consultancy无法完全自然化,也就永远无法达到SEO的最高境界——实则虚之,虚则实之。

    一个企业要想SEO,最佳的模式是配备专门的人员或成立专门的部门,姑且称之为SEO专员,SEO专员充分了解企业的文化,在网站的维护过程中保持必要的SEO思维,不为排名做违背企业常规经营的事情。

    顺便说一下,my job descriptions里包含SEO专员的角色,以上我的观点并不想攻击SEO consultancy,我并不想把他们逼得没饭吃。

  • SEO is in the centre of business

    Blog helps SEO. I have decided to carry out an new ecommerce site using wordpress. From object-oriented point of view, wordpress has nothing to do with product, it would be hard to extend wordpress with ecommerce function. However, SEO is so important part of business. Anything helps SEO, we do it. We cut budget for ad on newspapers, televisions, etc, but we never cut budget on search engines.

    Marketing industry may have over appraised the search engines. Maybe it is a good thing for people like me – with some knowledge of SEO, we make it happen. Website is optimised a little bit, at least in the eye of search engines. But the rankings keep changing and keep worrying bosses, so bosses counting on SEO staff, SEO consultants, SEO tools, SEO budget?

    Oh, god, lots of money were stolen by our SEO consultancy.

  • 无纺布袋厂抢过独木桥

    search for non woven fabric bag in google uk

    在google.co.uk搜索无纺布袋厂的截图

    vs.

    search for non woven fabric bag in google cn

    在google.cn搜索无纺布袋厂的截图

    像我这样-身处国外,交替着使用多国google的人不在少数吧。我在寻找中国无纺布袋厂的过程中,发现adwords广告业主们都没有很好地把握在英语搜索引擎上的中文关键字搜索结果页面上的广告,推而广之,外地搜索引擎上本地语言的广告是被大家忽视了。

    很可惜吧?!

  • 等待新特性:导入、导出、重置Start Page的设置

    先看看我的Apps Start Page:

    my igoogle on apps

    Google确实是天才,无论Apps,Gadget,或是iGoogle都是巨作;Start Page把这些组合在一起,巨作中的巨作。但是美中还是有不足:未登录用户的Start Page setting保存在Cookie里,删掉Cookie就可以重置Start Page;登录用户的Start Page setting肯定是保存在google的某个数据库里,google暂未为导入、导出、重置Start Page的设置提供任何方便。

    我已经发了一个suggestion给google team:

    Recently I deployed Start Page of Apps. It is marvellous to combine the functionality of igoogle and apps! Each signed-in account can have different igoogle setting, that’s great. However, we can’t copy igoogle setting between accounts. We can’t reset the setting to the default either. That means if the apps domain administrator updates the start page, no one can get automatically updated.

    We will be very grateful to see this suggested feature come true. Thank you!

    希望不久的将来就能看到这个new feature。