使用設定檔建立程式化搜尋引擎

本頁面將介紹程式化搜尋引擎設定檔背後的基本概念,

  1. 總覽
  2. 程式化搜尋引擎有哪些內容
  3. 各項元件如何搭配運作
  4. 建立搜尋引擎
  5. 編輯程式化搜尋引擎檔案
  6. 選擇合適的格式

總覽

如果「控制台」無法提供您需要的自訂層級,建議您採用程式化搜尋 XML 格式,這種格式不但能讓您擁有更多掌控權和彈性,還能使用更強大的功能。

如要使用程式化搜尋引擎設定檔,請先透過程式化搜尋引擎控制台建立基本的搜尋引擎。建立搜尋引擎後,您可以從控制台的「總覽」頁面下載註解和結構定義 XML 檔案。

XML 基本概念

可擴充標記語言 (XML) 是一種一般用途的標記語言。是可以讀取的標記文字。舉例來說,程式化搜尋 XML 格式包含下列標記:<Context> </Context><LookAndFeel> </LookAndFeel>

如同任何 XML 檔案,程式化搜尋引擎規格必須符合 XML 語法 (<element attribute="value">content</element>),且格式必須正確。XML 有以下規則:

  • XML 要求您必須在頂層標記前面加上 XML 宣告 (<?xml version="1.0"?>),但程式化搜尋引擎設定檔不需要。
  • 所有元素都必須包含起始標記 (<tag>) 和結尾標記 (</tag>)。
  • 所有代碼都必須正確加入巢狀結構。您無法使用類似下方的 XML 程式碼:<sandwich><filling> peanut butter</sandwich></filling>。格式應該是:<sandwich><filling> peanut butter</filling></sandwich>
  • XML 會區分大小寫,因此請務必遵循操作說明中標記的大小寫和拼字。
  • 所有屬性值都必須以雙引號 (<element attribute="value">) 括住。
  • 所有屬性都必須在起始標記 (<element attribute="value">) 中定義,而不是在結尾標記 ( </element>) 中定義。

您可以使用註解標記 (<!-- your comment here -->) 自行撰寫附註,程式化搜尋引擎不會以 XML 程式碼剖析這行文字。除了撰寫提醒或說明,您也可以使用註解暫時排除某些 XML 程式碼 (原因可能是想嘗試某些效果或想排解問題)。不過,這些註解不會保留在您從控制台下載的檔案中。如果您想保留註解,在將註解過的 XML 檔案上傳到「控制台」後,建議您保留該檔案的副本。

您可以使用簡單的文字編輯器建立及編輯 XML 檔案。只儲存副檔名為 .xml 的文字檔案 (例如 cse_badminton.xml)。

返回頁首

程式化搜尋引擎的內容

程式化搜尋引擎有兩個主要元件,每個元件都是由 XML 檔案控管:

  • 內容:結構定義 XML 檔案會說明搜尋引擎的基本功能。它可指定搜尋引擎的通用設定,例如是否啟用圖片搜尋或置頂查詢。每個搜尋引擎都有專屬的內容檔案。進一步瞭解結構定義 XML 檔案。如要進一步瞭解如何選取最適合搜尋引擎的檔案格式,請參閱選擇適合搜尋引擎的格式
  • 註解:註解 XML 檔案會列出您希望搜尋引擎涵蓋的網頁或網站,並指出您對這些網站在搜尋結果中的排名方式。每個網站及其相關資訊稱為註解進一步瞭解註解 XML 檔案。

我們不建議你從頭開始建立這類檔案。請改為從控制台的「總覽」頁面下載。

除了這些主要元件外,搜尋引擎也可能包含下列輔助檔案:

  • 置頂查詢:促銷活動 XML 檔案會列出由一組預先定義的查詢字詞觸發的一系列自訂結果。當使用者輸入的搜尋字詞與您的查詢字詞完全相符時,宣傳活動會出現在頁面頂端。您可以利用宣傳活動,直接回答使用者的查詢、引導他們取得重要資訊,或將他們引導至搜尋結果網頁頂端,但關聯性更強的網頁。您可以在控制台的「促銷活動」分頁中定義促銷活動。進一步瞭解促銷活動
  • 同義詞:同義詞 XML 檔案會擴大使用者查詢內容,納入搜尋字詞的變體。舉例來說,如果使用者搜尋「simian」,搜尋引擎也會搜尋「Monkey」和「ape」。可在控制台的「同義詞」分頁中定義同義詞。進一步瞭解同義詞

元件如何搭配運作

結構定義 XML 檔案不會指定要使用的註解檔案,而註解 XML 也不會參照結構定義檔案。程式化搜尋引擎會使用標籤來與背景資訊和註解建立關聯。內容 XML 檔案包含可識別搜尋引擎的標籤,註解 XML 中列出的每個註解都會加上一或多個標籤,指出該標籤所屬的搜尋引擎。如果您變更結構定義檔案中的標籤名稱,必須變更所有已標記該標籤的註解。

雖然您可以上傳多個註解檔案,但當您透過「控制台」下載註解時,程式化搜尋引擎會將所有註解檔案合併成一個註解檔案。註解檔案可讓您在不同的搜尋引擎中靈活自訂相同的網站。舉例來說,某個搜尋引擎可能會只搜尋某些網站,而另一個搜尋引擎可能會刪除這些網站,但另一個搜尋引擎卻能夠宣傳這些網站。

context.xml

以下是 context.xml 檔案範例,內含標籤,用於識別要套用指令碼的搜尋引擎:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

以下列註解檔案為例,說明每個網站 (註解) 如何與標籤建立關聯:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

返回頁首

建立進階程式化搜尋引擎

建立進階引擎的步驟如下:

  1. 判斷格式是否符合需求。
  2. 為搜尋引擎定義規格
  3. 告知程式化搜尋引擎要搜尋哪些網站
  4. 告知程式化搜尋引擎如何為搜尋結果排名

編輯程式化搜尋引擎檔案

如要使用 XML 檔案,請前往控制台的「總覽」頁面下載 XML 規格。請勿從頭開始建立檔案。請執行下列步驟:

  1. 從「控制台」的「總覽」頁面下載結構定義檔案或註解檔案。按一下「搜尋功能」部分中的 [下載] 按鈕。
  2. 使用可處理 UNIX 樣式行尾的文字編輯器 (WordPad、Emacs 和 TextMate 則不支援;NotePad 則不支援)。不論檔案名稱為何,只要以副檔名 .xml (例如 cx_global.xml) 儲存即可
  3. 建議您為已下載的檔案建立備份,如果編輯後的版本無法順利運作,就必須還原至先前的版本。

    如果您並未建立副本,而編輯的版本無法正常運作,那麼您需要對檔案進行偵錯,或重新建立搜尋引擎。無趣。

  4. 編輯 XML 檔案,然後儲存檔案。請確認您的文字編輯器是以萬國碼 (Unicode) 文字文件儲存檔案,而非其他檔案格式。
  5. 在「總覽」頁面的「搜尋功能」部分下上傳檔案。

選擇合適的格式

開始建立程式化搜尋引擎前,請先決定最符合您需求的格式。避免選用比實際需求更強大複雜的格式,也不要使用容易快速成長的格式。

請從下表中挑選適當的格式。

如要建立 使用 因為 限制 更多資訊
只擁有少數網站的一或多個搜尋引擎 控制台 如要快速建立程式化搜尋引擎,您可以填寫文字方塊,而不要使用文字編輯器建立檔案並上傳檔案。 當您熟悉程式化搜尋引擎,以及如何建立內含少數網站的搜尋引擎,「控制台」最實用。 開始使用
使用大量網站的複雜搜尋引擎,會使用動態消息 結構定義檔案和註解檔案

程式化搜尋引擎檔案可讓您更全面地掌控搜尋引擎,並更輕鬆地定義及管理網站。

即使您打算利用背景資訊和註解檔案建立搜尋引擎,我們仍建議您熟悉「控制台」。

搜尋引擎越常,搜尋引擎就越複雜。您需要瞭解程式化搜尋元素和屬性,雖然這項任務並不難,但這需要您投入一些時間。

不過很抱歉,您必須閱讀開發人員指南的其餘部分,這並不是最值得期待的閱讀資料。

內容:定義搜尋引擎規格註解:選取網站

返回頁首