検索結果のチューニング
木曜日, 4 月 30th, 2009
ユーザーから検索がHITしないとのクレームがありまして…コンテンツの見せ方などは、サイト構成・コンテンツのクエリWebパーツ・検索範囲の用意などを利用して工夫はしているのですが、とにかく検索でHITして欲しいと…
で、探してみるとできるんですね…MSDNなどを見るとAPI経由で編集する必要があると記載されていて、諦めていたのですが・・・ツールがありました!
SharePoint Search Relevancy Tool
http://searchrelevancy.codeplex.com/
こんな感じな画面↓

このツールを見る限り、プロパティ毎に重みがかけれられていて、そのほかクリック距離などのパラメータの重みがついている感じですね。ちなみに検索結果に関連する要素はここに出ています。
ちなみにデフォルトのパラメータは以下のような重みになっています。
| パラメータ | 値(デフォルト) | 概要 |
| k1 | 16.404 | Saturation constant for term frequency. |
| Kqir | 2.12766 | Saturation constant for click distance. |
| wqir | 36.032 | Weight of click distance for calculating relevance. |
| Kud | 9.174312 | Saturation constant for URL depth. |
| wud | 31.468 | Weight of URL depth for calculating relevance. |
| languageprior | 0 | Weight for ranking applied to content in a language that does not match the language of the user. |
| filetypepriorhtml | 166.983 | Weight of HTML content type for calculating relevance. |
| filetypepriordoc | 163.109 | Weight of Microsoft Office Word content type for calculating relevance |
| filetypepriorppt | 163.367 | Weight of Microsoft Office PowerPoint content type for calculating relevance. |
| filetypepriorxls | 153.097 | Weight of Microsoft Office Excel content type for calculating relevance. |
| filetypepriorxml | 158.943 | Weight of XML content type for calculating relevance. |
| filetypepriortxt | 153.051 | Weight of plain text content type for calculating relevance. |
| filetypepriorlistitems | 0 | Weight of list item content type for calculating relevance. |
| Filetypepriormessage | 160.76 | Weight of Microsoft Outlook e-mail message content type for calculating relevance. |
とりあえず、これを使って結果は確認しましたが…ちょっとかなり気合いれてチューニングが必要ですね。
ただ、ユーザーさんへの説明責任ははこれで…
ちなみにプロパティは作成者、タイトル、名前だけに重みがついていました。へぇ~
あと、本日SP2が公開されましたね。ん~時間がない…ちょっと内容確認後スケジュールしますか…



