添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
前端笔记
首发于 前端笔记

让你的网站成为自定义搜索引擎

写于2015年6月5日,可能已过时,请谨慎参考。
http://www.zhouhua.site/2015/opensearch/ www.zhouhua.site

让你的网站成为自定义搜索引擎 - Step Over

有一天,我在打理博客的时候,无意看到了这样的提示:

“按tab可通过 zhouhua.info 进行搜索”?这是什么?于是我按了tab:

看起来很高级嘛!输入“正则表达式”看看:

竟然真的有效果!到底发生了什么……

打开chrome的搜索引擎管理:

我的博客怎么就被认为是搜索引擎呢?一定要搞明白怎么回事。

要让浏览器知道自己的网站是一个搜索引擎,在技术上并不难实现。很久之前amazon就提出了 OpenSearch标准草案 。浏览器们是认这个标准的,只是各自实现不太一样。而开发者大多不太了解这玩意儿。总之挺鸡肋的吧,不过挺简单的,单纯提升点逼格也不错。

本文所涉及的体验针对chrome,其他浏览器未测试。据我所知,IE浏览器处理OpenSearch时,并不会主动信任一个网站为搜索引擎,而是需要网站管理者向微软提出申请,审核通过才会被IE认为是搜索引擎。

那么就来试试吧。

首先要告诉浏览器:我是搜索引擎。做法很简单,在网页的head部分加上这样一行:


<link rel="search" type="application/opensearchdescription+xml" href="http://www.zhouhua.info/opensearch.xml" title="step over">

我们看到type定义了一种从来没见过的mine类型application/opensearchdescription+xml,不用紧张,这是openSearch标准规定的,你不用额外对服务器进行配置,只要提供一个能访问到的xml文件。在这个例子中,我的xml文件路径为 zhouhua.info/opensearch 。关键就是要看这个xml是什么样的。标准中定义了很多,但我觉得设置几个简单的属性就够了:

<?xml version="1.0"?>
<OpenSearchDescription xmlns="http://a9.com/-/spec/opensearch/1.1/">
	<ShortName>屠龙刀</ShortName>
	<Description>搜索周骅的博客</Description>
	<Url type="text/html" method="get" template="http://zhouhua.info/?s={searchTerms}"/>
</OpenSearchDescription>

我这里定义了三个属性,ShortName表示搜索引擎的名字,Description代表搜索引擎的描述,这都比较好理解。比较重要的是Url属性,它定义了搜索的方式。有这个例子里,规定了搜索结果是以text/html的形式返回,规定了用get方式去访问搜索action,规定了处理搜索的url为 zhouhua.info/? {searchTerms},其中{searchTerms}会被用户输入的关键字替换。有一个比较有意思的功能,我稍微说一下,如果你的站点有搜索词建议的功能,你可以再定义一条Url字段,将template指向请求搜索建议的ajax地址,同时设置rel属性为suggestion。类似这样:


<Url type="application/json" rel="suggestions" template="http://my_site/suggest?q={searchTerms}" />

标准里定义了Url可以有四种rel类型,我感觉比较有价值的就两种,一种是设置获取搜索结果的url,rel为result,这种最重要,如果不设置rel属性,那么会默认这个Url字段是这个作用;第二种是设置获取搜索建议的url,它的rel属性为suggestions,如果取这个值,那么这个属性是不可以省略的。其他的两种取值就不说了。

除了以上的一些字段,其实可定制的内容还有很多,有兴趣的可以 查看文档 ,我就不多介绍。因为我迫不及待地想看看设置的效果怎么样。

效果还是不错的嘛,设置的搜索引擎名称等都生效了,挺好玩的。

自定义搜索引擎无非就是通过现有的标准,网站向浏览器传达了自己是搜索引擎、传达了自己的特征和用法,而浏览器则根据这些信息把网站添加到搜索引擎列表中,并对它们启用特殊的交互体验(比如输入域名就可以按tab进入搜索功能、可以设置成默认搜索引擎等)。

但我的疑问是,一开始我可是什么也没有干呀,那么chrome是怎么知道我的网站有搜索功能,并把它添加到了搜索引擎列表中的呢?

在chrome的这篇文档中,我找到了答案: 传送门 (英文,需梯子)。

原来在使用chrome访问一个网站时,chrome会先查看有没有定义OpenSearch。如果没有的话,它会在网页中找有没有这样一个表单:

  1. 表单以GET方式提交(POST不可以);
  2. 表单的提交url为HTTP协议的(HTTPS不可以);
  3. 表单没有附加onSubmit事件(确保提交过程不被用户代码干涉);
  4. 表单中仅包含一个input输入框,而且类型为text(其他类型的都不可以,多余的控件也都不可以)

如果有这样一个表单,chrome会认为这是一个搜索框,并根据这个表单的信息推断出这个网站的搜索方法。在我的网站中,恰恰有这样的表单:


<form role="search" method="get" id="searchform" class="searchform" action="http://www.zhouhua.info/">
        <label class="screen-reader-text" for="s">搜索:</label>
	<input type="text" value="" name="s" id="s">
	<input type="submit" id="searchsubmit" value="搜索">
    </div>
</form>

这个表单提供的信息和

<Url type="text/html" method="get" template="http://zhouhua.info/?s={searchTerms}"/>

是等价的。但并不能提供更多的信息了,所以一开始,chrome直接是拿网站的域名当成是搜索引擎的名字。

对于chrome的这个设计,我持保留意见,毕竟存在一定的误判率。

在chrome的文档中,最后一句话提到了添加自定义引擎的第三种方法,使用AddSearchProvider这个API。虽然这个文档中只提到了一个词,但并不妨碍我们获取更多信息,MSDN和MDN上都有文档。

跳到MSDN 跳到MDN

MDN的文档中有一个示例程序还是值得学习一下,它对AddSearchProvider做了兼容性的提升:


function installSearchEngine() {
  if (window.external && ("AddSearchProvider" in window.external)) {
    // Firefox 2 and IE 7, OpenSearch
    window.external.AddSearchProvider("http://example.com/search-plugin.xml");
  } else if (window.sidebar && ("addSearchEngine" in window.sidebar)) {
    // Firefox <= 1.5, Sherlock
    window.sidebar.addSearchEngine("http://example.com/search-plugin.src",
                                  "http://example.com/search-icon.png",
                                  "Search Plugin", "");