Archive for the ‘検索’ Category

WSS で Office 2007 形式のファイルを検索する

日曜日, 1 月 10th, 2010

弊社では WSS を一部限定的な用途で利用しているのですが、Office 2007 形式のファイル(docx , pptx など)を検索できないと報告され…確認すると確かにできません…年明けに

どうやら WSS にはOffice 2007 形式のファイルを検索するための ifilter が入っていないようです…ということで下記をインストールする必要があります。

 

Microsoft フィルタ パック

http://www.microsoft.com/downloads/details.aspx?displaylang=ja&FamilyID=60c92a37-719c-4077-b5c6-cac34f4227cc

いつまで経っても意外なところから問題が起きる SharePoint ですね。

SharePointの活用をするためには????【SDPS パートナ編】~User eXperience~

月曜日, 8 月 10th, 2009

SDPS パートナーを探ってみよう第2弾(そろそろ限界w)

個人的には、ユーザーの使い易さということにこだわっているつもりです。それは機能的なものもそうですが、どのように見せるか?というのが1つのポイントだと考えており、がんばってUI系はいろいろ工夫しているつもりです(ポータルのレイアウトや、リストの値はデータビュー利用して、グラフ化したり、KPIっぽく文字の色や、画像を表示したり…)

で、第2弾はUI系SDPSパートナー3社の中から「2nd factory」を取り上げてみます(UXという言葉もこのサイトで初めて知ったんですけどね…)

MOSS系のソリューション?を3つ販売してるんですけど、その中でちょっと良いな~と思ったのはインテリジェントサーチです!リンクの下のほうに画面があるのですが、原型留めてませんw個人的に気に入ったのはファイルストック機能ですね。MOSSの検索だといちいちファイルを開いて中身を確認する必要がありますが、これだとストックしてまとめてDLできるようです(リンクをメールで共有することも可能っぽいです)。あとはツリービューってのがどう見えるのかとか気になりますね。

これって、クリック数が減るとか、ユーザーが情報を活用できるようになるとかって説明がしやすいUXですね。

あとは、スマートランチャーなんて日本のGroupWareを利用していたユーザーは欲しいのではないでしょうか??

あと、当然のごとくポータルテンプレートとかもあったりします。あ~全部だといくらするんでしょね?

ま、このご時世上司の承認が通るかどうか…w(上司に承認を通す方法求w)

URLが1500文字を越えるとクロールされない…みたい

木曜日, 7 月 9th, 2009

MOSSとWSSはクロールのURL文字数が1500文字に制限されているようです。

http://support.microsoft.com/kb/972865/ja

まぁ、フォルダ階層を深く+日本語にすると該当しそうですよね。

ちなみにURL最大文字数は255文字ですが、KBによると「Microsoft Office SharePoint Server 2007 および Windows SharePoint Services 3.0 では、URL に含まれる 2 バイト文字 (DBCS) を、Canonicalized UTF-8 でエンコードし、DBCS 1 文字を 9 文字の 1 バイト文字 (SBCS) に変換して扱います。」ということなので、

ざっくり、

(1500/9)  = 167文字(http://servername/site/…は誤差ということで)

引数とかで多く見積もって2倍になると考えると、約83文字まで妥当ということですね。

そうするとフォルダ名+ファイル名ってことを考えると5階層ぐらいが無難ですかね??

クロールルールの制限

月曜日, 6 月 29th, 2009

HTTPプロトコルだけなんですね。

http://msdn.microsoft.com/en-us/library/ms562090.aspx

クロールルールで「file://」に対して「別のコンテンツアクセスアカウントを利用する」を設定していたのですが、クロールログにエラーが出てしまい…ということは、コンテンツアクセスアカウントは、File ServerのSuper Userに合わせるということになるのでしょうね。まぁ、普通はDomain Adminとか利用するのでしょうが、

…社内事情でね。面倒なんですよ

検索結果のチューニング

木曜日, 4 月 30th, 2009

ユーザーから検索がHITしないとのクレームがありまして…コンテンツの見せ方などは、サイト構成・コンテンツのクエリWebパーツ・検索範囲の用意などを利用して工夫はしているのですが、とにかく検索でHITして欲しいと…

で、探してみるとできるんですね…MSDNなどを見るとAPI経由で編集する必要があると記載されていて、諦めていたのですが・・・ツールがありました!
SharePoint Search Relevancy Tool

http://searchrelevancy.codeplex.com/

こんな感じな画面↓



 
このツールを見る限り、プロパティ毎に重みがかけれられていて、そのほかクリック距離などのパラメータの重みがついている感じですね。ちなみに検索結果に関連する要素はここに出ています。

 ちなみにデフォルトのパラメータは以下のような重みになっています。


パラメータ 値(デフォルト) 概要
k1  16.404 Saturation constant for term frequency.
Kqir 2.12766  Saturation constant for click distance.
wqir 36.032 Weight of click distance for calculating relevance.
Kud 9.174312 Saturation constant for URL depth.
wud 31.468 Weight of URL depth for calculating relevance.
languageprior 0 Weight for ranking applied to content in a language that does not match the language of the user.  
filetypepriorhtml 166.983 Weight of HTML content type for calculating relevance.
filetypepriordoc  163.109 Weight of Microsoft Office Word content type for calculating relevance
filetypepriorppt  163.367 Weight of Microsoft Office PowerPoint content type for calculating relevance.
filetypepriorxls  153.097 Weight of Microsoft Office Excel content type for calculating relevance.
filetypepriorxml  158.943 Weight of XML content type for calculating relevance. 
filetypepriortxt  153.051 Weight of plain text content type for calculating relevance.
filetypepriorlistitems  0 Weight of list item content type for calculating relevance.
Filetypepriormessage  160.76 Weight of Microsoft Outlook e-mail message content type for calculating relevance.
 ん~docよりpptのほうが重みが高いんですよ。とりえあえず、社内ではdocとxlsが多いので高めに設定しました。

とりあえず、これを使って結果は確認しましたが…ちょっとかなり気合いれてチューニングが必要ですね。

ただ、ユーザーさんへの説明責任ははこれで…

ちなみにプロパティは作成者、タイトル、名前だけに重みがついていました。へぇ~

 

あと、本日SP2が公開されましたね。ん~時間がない…ちょっと内容確認後スケジュールしますか…

Adobe ifilter ver 8.0 & 9.0 for x32 bit

木曜日, 12 月 4th, 2008

小ネタです。

Adobeのifilterの最新版に関するインストール方法のKBが公開されていました。今回からはReaderをインストールしないと動かないみたいですね(Adobe Acrobatがインストールされている状態ではできませんでした)。

http://support.microsoft.com/kb/960628/ja

x64 bit版が欲しい・・・

追記

x64でましたね。

http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025

SharePoint管理ツールキットとInfoPath ifilterの公開

日曜日, 8 月 31st, 2008

いつの間にか、SharePoint Server 2007 お役立ちツールというページができてました。

そこに以下のものが公開されていました。

SharePoint管理ツールキット

  • Batch Site Manager:サイトコレクションの移動・ロック・削除をするための機能のようです

インストールが正常に終わると、以下のメニューが追加されます。

0831-01.jpg

で、こんな画面でサイトコレクションの移動・ロック・削除をします(英語UIのようです)。

0831-02.png

  • Updatealert Stsadm:こちらは、既存のWebアプリの名前変更後・代替アクセスマッピング変更後に電子メールの通知の再設定するためのコマンドのようです

  • UserProfileReplication:あるServerからほかのServerにUserProfileをコピーするツールのようです。

こちらは、下記のようなアプリケーションがインストールされます。いまいち用途がわからない…ステージングとプロダクション環境を利用しているとか、他のファームにプロファイルを送る??だれか正しい用途を教えてください。

0831-03.png

上記の3つの機能がについては、日本語版の操作ガイドもダウンロードできます…助かりました
InfoPath ifilter

メイン?はInfoPathに添付されたファイルに対しても全文検索できるためのifilterのようです(動作確認した範囲ですが…あ、きちんと各フィールドの値も検索対象でした)…InfoPathに添付した場合、添付ファイルデータは、XMLのタグに囲まれたbase64でエンコードされた状態で*.xmlに保存されています。既存のXMLのifilterだと、エンコードされた状態の文字列が検索対象となりますが、このifilterを利用すると、添付ファイルをきちんと元のファイルに復元したあと、そのファイルのifilterでクロールを行うようです。

SharePointのzip, xlsb 検索

木曜日, 8 月 28th, 2008

SP1からzip, xlsbの検索が可能になってますね。

設定はこちらのKBに記載されていますが、設定手順どおりに設定をしてもzipの検索ができません…あれ?

で、*.regファイルの内容と、実際に登録されているレジストリの値を比較すると…全ての値が設定されていませんでした。ですので、*.regを実行した後、下記のレジストリの登録は手動で行う必要があるようです…

  • [HKEY_CLASSES_ROOT\CLSID\{20E823C2-62F3-4638-96BD-90F4F6784EBC}\InprocServer32]
     文字列値(既定)に“C:\Program Files\Common Files\Microsoft shared\Filters\offfiltx.dll”を値として設定
  • [HKEY_CLASSES_ROOT\CLSID\{312AB530-ECC9-496E-AE0E-C9E6C5392499}\InprocServer32]
     文字列値(既定)に“ C:\Program Files\Common Files\Microsoft shared\Filters\offfiltx.dll ”を値として設定
  • [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\
     ContentIndexCommon\Filters\Extension\.xlsb]

    •  新規のキーとして“ .xlsb ”を追加し、文字列値(既定)に “{312AB530-ECC9-496E-AE0E-C9E6C5392499}”を値として設定

  • [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\
     ContentIndexCommon\Filters\Extension\.zip]

    •  新規のキーとして“ .zip ”を追加し、文字列値(既定)に “{20E823C2-62F3-4638-96BD-90F4F6784EBC}”を値として設定

上記の設定を行うと検索が可能になりました。これはどうやら、Zipファイルの中のドキュメントも検索対象になるという仕様みたいです。私が試したところ、doc, docx, xls, xlsx, ppt, pptxは全文検索の対象になってました。また、txt, pdfに関してはファイル名のみが検索対象となっていました。これは、offfilt.dllというOffice用のモジュールを利用しているから??だから、それ以外のファイル名までは検索できる??Bug??

…どうなんでしょ?誰か知っているかたは教えてください…

検索フェデレーションのコネクタ

木曜日, 8 月 14th, 2008

Infrastructure Updateを適用すると、検索のフェデレーションができるようになります。そのコネクタ集のリンクを見つけました!

http://www.microsoft.com/japan/enterprisesearch/connectors/federated.aspx

これを見ると…

Yahooは普通に検索できるようですが、GoogleはNewのみが検索できるようになるみたいですね

また、他製品との検索も可能になるコネクタもでるようです。試したいけど時間が・・・

Federationを利用した検索でできること

日曜日, 7 月 20th, 2008

Federationを利用して、新たにできるようになったことがあります。その中で、私が一番実現したかったことができるようになりました!それは、1つの検索結果ページに複数の検索範囲の結果を表示させることです。たとえば、1つの検索結果のページにSharePointの検索結果とファイルサーバの検索結果を表示させるなどです(既定の検索結果のページは、1つの検索範囲のみ主要な検索結果のWebパーツに表示させることができました。ですので、異なる検索範囲を利用する場合は、検索タブで分けるしかありませんでした)。ちなみに、設定してみると、以下のような感じになります(XSLは既定の設定です。黒塗りが多くてすいません…)。

0720-01.png

また、この他に、検索のトリガを設定することができます。例えば、

  • プレフィックス:特定の検索文字が入っている場合のみ、検索結果を表示するときに利用します。おすすめWebパーツとかぶってますね
  • パターン:.NETの正規表現キャプチャグループを利用できます。たとえば、電話番号だとxx-xxxx-xxxxとか、メールアドレスのxxxxx@xxxx.xxxなど(.NETの正規表現はこちらに記載があります。)

あと、忘れていけないのはOpen Search1.1への対応です。Open Searchの規格に対応した検索エンジンをMOSSの検索結果として利用できます。ですので、検索結果にはAmazonの検索結果を出すことも可能になるはずです。また、社内リソースに対して検索を行ったときに、その検索単語に関連するInternetサイトの結果や、書籍の結果が出せるようになるはずです!

 以下、関連リンクです。


ホットワード 検索 background border Office
割引クーポンまとめ情報 - クー割