|
|

微软的专利技术是用来识别网页是否是一个博客,一旦被确定为博客,他们将进一步加强关注。
本周微软Live Search宣布加大在华投入,立刻引起了轩然大波,据悉,Live Search对于博客在美国有三个专利:
1、确定一个网页属于一个博客。这项专利涵盖Live搜索的使用方法,用于区分HTML网页是否是博客的一部分。
2、使用超链接的博客排序方法。这种方法允许偏向博客链接,一边修改网页排名和提供更高质量的搜索结果。
3、基于视觉的文件分割。这项专利解释如何区分一个页面是否与主题无关。
确定网页属于博客专利
关于2006年6月19日微软提出了一项专利名为“识别网页属于一个博客。”专利清单丹尼斯克雷格和史蒂夫逸夫-汤笞蒽作为发明者,时间是12月20日,2007年,并获得美国专利申请数20070294252。
微软的专利技术是用来识别网页是否是一个博客,一旦被确定为博客,他们将进一步加强关注。
在过去几年中,博客迅速发展。博客,被称为博客,就是因为跨度范围广泛,从从个人的期刊阅读的几个人,到大网站或小社区,大的博客经常有数以万计的人访问。总体而言,这些大的博客形成了独特的博客群组,这些越来越重要,因为搜索引擎的信息来源是来自日常用户。
那该如何辨别一个网页是否属于博客呢?
1、如果一个网站是托管在www.iresearch.cn上,那么它就很有可能属于一个博客。
2、常见的字词或短语有一定的规律,如:评论、订阅、日志、相册等。
3、URL判断,如:www.8684.cn/blog。
4、网页有外部链接指向博客,并且博客也有链接指向网页。
5、如果有RSS或Atom存在,那很有可能属于一个博客。
当然微软也可能会验证很多重点环节和联系方式,以确定网页是否是博客,但解析HTML文件,寻找基于内容的特征需要花费很多时间。
一旦微软蜘蛛网页并提出通过这种算法,那它会通过上面的因素来制定评分,如果某个网页达到一定评分,那就不用解析网页,直接列为博客。
这项专利还一个有争议的声明说:“搜索引擎将越来越多的限制来自博客网页的查询结果。这样的声明,可以解释为雅各布尼尔森在他的文章“写文章,不是博客文章”这句话,他认为,写博客文章是不存在长期价值的。
同样有一个支持的论据:如果想查询或了解过去的信息,结果只得到博客的内容,没有谈到具体的新闻事件以及详细的新闻内容,这就会让用户的搜索体验下降,因此,新闻内容优于博客内容。
虽然这个论据很好,但对于成千上万的有用博客内容,如果不把内容放在重点位置,是不是会影响到用户体验,让用户以为微软忽略了他们?
使用超链接的博客排序方法
在2007年3月30号微软提出另一项专利名“使用超链接的博客排序方法。” 它列出的发明人是史蒂夫和丹尼斯,时间是2008年10月2号,并获得美国专利申请号20080243812。
搜搜引擎通常让静态的翁也文件有较高的评级,一种改进的得分技术评分规定,网页是否有一个高质量的链接,这就需要确定网页是否是博客。不过这个算法已经成了国外许多SEO的依赖,即越来越多的人在操纵搜索结果,微软也在开始着手解决这个算法的BUG。
微软指出,大多数博客的链接,都是相互信任并且相互熟识。有一个小行业是链接买卖,有许多博客也在提供链接的买卖交易,当然链接购买仍然是个小部分的经济,这给搜索引擎优化产业提供了一个绝好的机会,因为可以购买很多链接伪装。
更多精彩点击下一页 |
|