W3C markup validator soap interface may be outdated

我想在一个网站上添加W3C markup xhtml 自动验证功能:如果一个网页通过 xhtml 验证,就会在页脚出现 W3C 设计的一个”valid” Icon;如网页未通过验证则不会出现该标志。 W3C markup validator 能以 soap 1.2 方式输出验证结果,但无论我在 php SoapClient 里怎么设置传递参数,它总拿不到 validator soap response。W3C 对此 soap interface 也没提供足够的说明文档,我仅知道它不支持 wsdl,我猜想 soap method 应该是 validate 或 check,但猜想归猜想,实际上没有一个能返回我想要结果。 我想这跟 W3C 声称 soap output 只是个实验型产品有关,soap 以外还有其他方式的 output,难道多年来 soap 受到的关注较少?如果硬要以 soap 方式 得到 validator 的结果,我只能用 PEAR Service W3C HTMLValidator package,但看到这个 package 多年来一直没有更新,它所依赖的… Continue reading W3C markup validator soap interface may be outdated

No deplicate posts any more in WordPress

刚用上WordPress后,我发现WordPress一个不足之处——同一个post_id的post,可以用不同的url来访问。 以此blog为例,我设置permanent link structure为/%post_id%/%postname%/。我认为post_id查询最快,postname又是meaningful string,最有利seo,所以我把两者结合起来了(后来据说顶层目录的文件最利于seo,所以我更喜欢设置permanent link structure为/%postname%_%post_id%.html,但据说Google不吃这一套,那我就没必要为一些小引擎去劳师动众修改现有的blog,扯远了)。 当permanent link structure存在post_id和postname两个参数时,post_id起决定作用。早期版本会完全忽略postname,造成只要post_id是正确的,任何杜撰的postname都会被承认。设想一下,如果我发布了一个post以后修改了postname,搜索引擎读到不同url上的相同内容,肯定会降低对此blog的评价。 所以,当时我想改一下WordPress程序逻辑,当post_id存在但url中的postname不等于数据库中的postname时,返回404页。但是我还没来得及做这个修改,今天惊喜发现WordPress 2.6 (可能更早的版本已经实现了这个修改) 已经会把/(post_id)/(incorrect_postname) 301跳转到 /(post_id)/(postname),这应该比我设计的方案更完好,我非常喜欢WordPress的体贴。

Create Effective Backlinks

要有好排名得有好的backlinks,这个道理我很早就知道了,但一直未及深入研究。最近读到一篇文章很有可操作性,我准备依样画瓢。 Use wordpress.com for creating your blogs. – WordPress has grate on-site SEO and blogs on WordPress.com get indexed pretty quickly. Once you create an account there, you can create unlimited number of blogs without having to register any new accounts. 不指是直接使用wordpress.com的blog好,还是自己安装一个wordpress blog好? Write more then one post per blog. – Google loves backlinks that… Continue reading Create Effective Backlinks

芳草苑不是方草苑, 还是芳草苑就是方草苑

突然想起关心一下我的芳草苑以“芳草苑”的排名,还没进page 1,但也挺有意思,能进page 2。看来芳草苑的“芳草苑”还得继续努力。 Google一直倡导不要为排名而排名,但是谁能做得到?刚才我查询芳草苑时,不小心输入的是“方草苑”。不知为什么,微软拼音给“方草”造了一个词,所以误查了方草苑。估计没有哪个楼盘是以方草苑命名的,也没有一个叫方草苑宾馆的,倒是另有个方草苑blog,估计主人姓方。但微软拼音肯定不止一次造过“方草”这个词,给过我肯定也给过别人,如果,仅是如果—— 我是芳草苑小区楼盘的开发商,或 我开了个芳草苑宾馆,或 我的芳草苑blog芳名远播,大家都冲着芳草苑这个名来看我 那么我就要担忧了:我欢迎你们来看我啊,但是如果你们输错字去了方草苑怎么办?为了不丢掉客户,在Google还没这么智能之前(Google能知道什么客户什么时候输入方草苑其实是想去芳草苑吗?),我得将错就错,我不光得有芳草苑,有时还得故意写几个错别字叫自己为方草苑,说不定还要照顾到输入“芳草原”、“芳草园”的客户,这样想来就错别字就更多了。 所以,为了告诉人们“芳草苑不是方草苑”,首先得屈从“芳草苑就是方草苑”。有这个必要玩这么哲学的命题吗?有,除非搜索引擎集体自杀。

google和彩票预测

忍不住又想说说google的优越性。 很偶然我在淘宝网上看到连续两个淘宝partner中国雅虎(或是雅虎中国——马云玩的文字游戏)的赞助商广告,是关于预测彩票、双色球的。其实我浏览的是电子产品的网页,跟彩票根本没有关系,没有相关性中国雅虎也照样播放广告,这不浪费广告业主的钱嘛——不过浪费一下靠预测彩票发财的广告业主的钱也是件痛快的事情。 当然啦,有点知识的人都知道预测彩票都是骗人的。我关心的问题是哪些搜索引擎接受这样的广告,于是我在google里搜索“彩票预测”,结果右侧为空白,页面顶端也没有任何广告,可见google不接受“彩票预测”广告,然后我在yahoo,baidu,sohu等搜索“彩票预测”,结果满是广告。 google的社会责任感就在这里体现!

我的原创排名竟不如别人的原文引用

很高兴我有篇post被别人原文照搬去了。但是如果按该篇的title搜,我的blog竟被后来居上。但这里有一点显著区别,google收录的是我tag下的页面,而不是single post page,引用者被收录的恰恰是single post page。也就是说,我的tag view page在和别人的post view page在竞争排名,竞争不过也情有可原。 我觉得问题出在这个blog以前没有xml sitemap,google不知道到底该收录哪些页面,特别是某个tag如果只有一篇post,那么tag view和post view的主体内容是一样的,但是tag view的title是tag本身,post view的title是post title。没有特殊原因,google是不喜欢多个页面显示相同内容的,这大概是google随机收录了tag view和post view之一的原因。 我的原创排名竟不如别人的原文引用,那不意味着这个blog的seo很失败?虽然排名还有pagerank等很多综合因素,但我还是不服气,于是赶紧装一个xml sitemap generator plugin。我设置xml sitemap同时包括post pages和tag pages,因为我觉得尽管有时主题内容是一样的,post page和tag page的侧重点还是不一样的,有必要被同时收录。 过几天再来看排名。

SEO的最高境界——实则虚之,虚则实之

我认为企业不应该过分注重SEO。 何谓过分注重SEO呢?就是专门花钱请企业外部的力量来做SEO。何谓企业外部的力量?比如通过买卖外部链接,可现在大家都知道买卖外部链接适得其反,于是SEO consultancy又提出各种方法,比如去publish article with backlinks,比如建blog,比如搞flickr,总之SEO consultancy认为这些方法比较自然。可是真的自然吗? 一个小企业,每周发表两篇文章,快成新闻出版社了;blog强调一种自由的氛围,并不是所有企业都有这种氛围;flickr就更个人化了,把产品的照片放那上面怎么看怎么别扭。 google的哲学其实很简单,google说,你们要当我不存在,做好usability,增强用户体验就可以了。google这一招欲擒故纵确实厉害,结果弄得大家越发看重搜索引擎,而且还要把SEO自然化。“自然”就是一个“度”的问题,我不是说SEO consultancy的建议没有用,但SEO consultancy作为一个第三方,它不了解企业的运作,只站在SEO的角度看问题,总归不那么自然。比如SEO consultancy要求企业不停地写文章,可是叫谁去写?相信绝大部分人都有读书时被逼着交essay的痛苦经历,恐怕没有人会愿意象小学生那样每周交两篇作文。 我们毫不怀疑google的智能,既然google能看出谁买卖links,也能看出所谓自然化了的SEO手段,何况现在还有人肉搜索引擎。SEO其实是跟搜索引擎斗智斗勇的过程,SEO consultancy无法完全自然化,也就永远无法达到SEO的最高境界——实则虚之,虚则实之。 一个企业要想SEO,最佳的模式是配备专门的人员或成立专门的部门,姑且称之为SEO专员,SEO专员充分了解企业的文化,在网站的维护过程中保持必要的SEO思维,不为排名做违背企业常规经营的事情。 顺便说一下,my job descriptions里包含SEO专员的角色,以上我的观点并不想攻击SEO consultancy,我并不想把他们逼得没饭吃。

无纺布袋厂抢过独木桥

在google.co.uk搜索无纺布袋厂的截图 vs. 在google.cn搜索无纺布袋厂的截图 像我这样-身处国外,交替着使用多国google的人不在少数吧。我在寻找中国无纺布袋厂的过程中,发现adwords广告业主们都没有很好地把握在英语搜索引擎上的中文关键字搜索结果页面上的广告,推而广之,外地搜索引擎上本地语言的广告是被大家忽视了。 很可惜吧?!

等待新特性:导入、导出、重置Start Page的设置

先看看我的Apps Start Page: Google确实是天才,无论Apps,Gadget,或是iGoogle都是巨作;Start Page把这些组合在一起,巨作中的巨作。但是美中还是有不足:未登录用户的Start Page setting保存在Cookie里,删掉Cookie就可以重置Start Page;登录用户的Start Page setting肯定是保存在google的某个数据库里,google暂未为导入、导出、重置Start Page的设置提供任何方便。 我已经发了一个suggestion给google team: Recently I deployed Start Page of Apps. It is marvellous to combine the functionality of igoogle and apps! Each signed-in account can have different igoogle setting, that’s great. However, we can’t copy igoogle setting between accounts. We can’t reset the setting to… Continue reading 等待新特性:导入、导出、重置Start Page的设置