Posts Tagged ‘’

WSS で Office 2007 形式のファイルを検索する

日曜日, 1 月 10th, 2010

弊社では WSS を一部限定的な用途で利用しているのですが、Office 2007 形式のファイル(docx , pptx など)を検索できないと報告され…確認すると確かにできません…年明けに

どうやら WSS にはOffice 2007 形式のファイルを検索するための ifilter が入っていないようです…ということで下記をインストールする必要があります。

 

Microsoft フィルタ パック

http://www.microsoft.com/downloads/details.aspx?displaylang=ja&FamilyID=60c92a37-719c-4077-b5c6-cac34f4227cc

いつまで経っても意外なところから問題が起きる SharePoint ですね。

検索結果のチューニング

木曜日, 4 月 30th, 2009

ユーザーから検索がHITしないとのクレームがありまして…コンテンツの見せ方などは、サイト構成・コンテンツのクエリWebパーツ・検索範囲の用意などを利用して工夫はしているのですが、とにかく検索でHITして欲しいと…

で、探してみるとできるんですね…MSDNなどを見るとAPI経由で編集する必要があると記載されていて、諦めていたのですが・・・ツールがありました!
SharePoint Search Relevancy Tool

http://searchrelevancy.codeplex.com/

こんな感じな画面↓



 
このツールを見る限り、プロパティ毎に重みがかけれられていて、そのほかクリック距離などのパラメータの重みがついている感じですね。ちなみに検索結果に関連する要素はここに出ています。

 ちなみにデフォルトのパラメータは以下のような重みになっています。


パラメータ 値(デフォルト) 概要
k1  16.404 Saturation constant for term frequency.
Kqir 2.12766  Saturation constant for click distance.
wqir 36.032 Weight of click distance for calculating relevance.
Kud 9.174312 Saturation constant for URL depth.
wud 31.468 Weight of URL depth for calculating relevance.
languageprior 0 Weight for ranking applied to content in a language that does not match the language of the user.  
filetypepriorhtml 166.983 Weight of HTML content type for calculating relevance.
filetypepriordoc  163.109 Weight of Microsoft Office Word content type for calculating relevance
filetypepriorppt  163.367 Weight of Microsoft Office PowerPoint content type for calculating relevance.
filetypepriorxls  153.097 Weight of Microsoft Office Excel content type for calculating relevance.
filetypepriorxml  158.943 Weight of XML content type for calculating relevance. 
filetypepriortxt  153.051 Weight of plain text content type for calculating relevance.
filetypepriorlistitems  0 Weight of list item content type for calculating relevance.
Filetypepriormessage  160.76 Weight of Microsoft Outlook e-mail message content type for calculating relevance.
 ん~docよりpptのほうが重みが高いんですよ。とりえあえず、社内ではdocとxlsが多いので高めに設定しました。

とりあえず、これを使って結果は確認しましたが…ちょっとかなり気合いれてチューニングが必要ですね。

ただ、ユーザーさんへの説明責任ははこれで…

ちなみにプロパティは作成者、タイトル、名前だけに重みがついていました。へぇ~

 

あと、本日SP2が公開されましたね。ん~時間がない…ちょっと内容確認後スケジュールしますか…

SharePoint管理ツールキットとInfoPath ifilterの公開

日曜日, 8 月 31st, 2008

いつの間にか、SharePoint Server 2007 お役立ちツールというページができてました。

そこに以下のものが公開されていました。

SharePoint管理ツールキット

  • Batch Site Manager:サイトコレクションの移動・ロック・削除をするための機能のようです

インストールが正常に終わると、以下のメニューが追加されます。

0831-01.jpg

で、こんな画面でサイトコレクションの移動・ロック・削除をします(英語UIのようです)。

0831-02.png

  • Updatealert Stsadm:こちらは、既存のWebアプリの名前変更後・代替アクセスマッピング変更後に電子メールの通知の再設定するためのコマンドのようです

  • UserProfileReplication:あるServerからほかのServerにUserProfileをコピーするツールのようです。

こちらは、下記のようなアプリケーションがインストールされます。いまいち用途がわからない…ステージングとプロダクション環境を利用しているとか、他のファームにプロファイルを送る??だれか正しい用途を教えてください。

0831-03.png

上記の3つの機能がについては、日本語版の操作ガイドもダウンロードできます…助かりました
InfoPath ifilter

メイン?はInfoPathに添付されたファイルに対しても全文検索できるためのifilterのようです(動作確認した範囲ですが…あ、きちんと各フィールドの値も検索対象でした)…InfoPathに添付した場合、添付ファイルデータは、XMLのタグに囲まれたbase64でエンコードされた状態で*.xmlに保存されています。既存のXMLのifilterだと、エンコードされた状態の文字列が検索対象となりますが、このifilterを利用すると、添付ファイルをきちんと元のファイルに復元したあと、そのファイルのifilterでクロールを行うようです。

SharePointのzip, xlsb 検索

木曜日, 8 月 28th, 2008

SP1からzip, xlsbの検索が可能になってますね。

設定はこちらのKBに記載されていますが、設定手順どおりに設定をしてもzipの検索ができません…あれ?

で、*.regファイルの内容と、実際に登録されているレジストリの値を比較すると…全ての値が設定されていませんでした。ですので、*.regを実行した後、下記のレジストリの登録は手動で行う必要があるようです…

  • [HKEY_CLASSES_ROOT\CLSID\{20E823C2-62F3-4638-96BD-90F4F6784EBC}\InprocServer32]
     文字列値(既定)に“C:\Program Files\Common Files\Microsoft shared\Filters\offfiltx.dll”を値として設定
  • [HKEY_CLASSES_ROOT\CLSID\{312AB530-ECC9-496E-AE0E-C9E6C5392499}\InprocServer32]
     文字列値(既定)に“ C:\Program Files\Common Files\Microsoft shared\Filters\offfiltx.dll ”を値として設定
  • [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\
     ContentIndexCommon\Filters\Extension\.xlsb]

    •  新規のキーとして“ .xlsb ”を追加し、文字列値(既定)に “{312AB530-ECC9-496E-AE0E-C9E6C5392499}”を値として設定

  • [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\
     ContentIndexCommon\Filters\Extension\.zip]

    •  新規のキーとして“ .zip ”を追加し、文字列値(既定)に “{20E823C2-62F3-4638-96BD-90F4F6784EBC}”を値として設定

上記の設定を行うと検索が可能になりました。これはどうやら、Zipファイルの中のドキュメントも検索対象になるという仕様みたいです。私が試したところ、doc, docx, xls, xlsx, ppt, pptxは全文検索の対象になってました。また、txt, pdfに関してはファイル名のみが検索対象となっていました。これは、offfilt.dllというOffice用のモジュールを利用しているから??だから、それ以外のファイル名までは検索できる??Bug??

…どうなんでしょ?誰か知っているかたは教えてください…

検索フェデレーションのコネクタ

木曜日, 8 月 14th, 2008

Infrastructure Updateを適用すると、検索のフェデレーションができるようになります。そのコネクタ集のリンクを見つけました!

http://www.microsoft.com/japan/enterprisesearch/connectors/federated.aspx

これを見ると…

Yahooは普通に検索できるようですが、GoogleはNewのみが検索できるようになるみたいですね

また、他製品との検索も可能になるコネクタもでるようです。試したいけど時間が・・・

Federationを利用した検索でできること

日曜日, 7 月 20th, 2008

Federationを利用して、新たにできるようになったことがあります。その中で、私が一番実現したかったことができるようになりました!それは、1つの検索結果ページに複数の検索範囲の結果を表示させることです。たとえば、1つの検索結果のページにSharePointの検索結果とファイルサーバの検索結果を表示させるなどです(既定の検索結果のページは、1つの検索範囲のみ主要な検索結果のWebパーツに表示させることができました。ですので、異なる検索範囲を利用する場合は、検索タブで分けるしかありませんでした)。ちなみに、設定してみると、以下のような感じになります(XSLは既定の設定です。黒塗りが多くてすいません…)。

0720-01.png

また、この他に、検索のトリガを設定することができます。例えば、

  • プレフィックス:特定の検索文字が入っている場合のみ、検索結果を表示するときに利用します。おすすめWebパーツとかぶってますね
  • パターン:.NETの正規表現キャプチャグループを利用できます。たとえば、電話番号だとxx-xxxx-xxxxとか、メールアドレスのxxxxx@xxxx.xxxなど(.NETの正規表現はこちらに記載があります。)

あと、忘れていけないのはOpen Search1.1への対応です。Open Searchの規格に対応した検索エンジンをMOSSの検索結果として利用できます。ですので、検索結果にはAmazonの検索結果を出すことも可能になるはずです。また、社内リソースに対して検索を行ったときに、その検索単語に関連するInternetサイトの結果や、書籍の結果が出せるようになるはずです!

 以下、関連リンクです。

Infrastructure Update

水曜日, 7 月 16th, 2008

風の噂でSP1以降の修正パッケージであるRollUpパッケージというのをインストールすると、Search Serverで利用できるOpen Search1.1に対応した検索のWebパーツが利用できると聞いていましたが、WSSとMOSSのモジュールを上手く見つけることができず断念しておりました…

しかし!!! RollUpを含む修正パッケージが出たらしいです。その名もInfrastructure Update(日本名は"インフラストラクチャ更新プログラム"…なんかイケテナイ)

SP1と同様にWSSとMOSS用のモジュールがあるようです。

  • WSS用 Infrastructure Update

    • プラットフォームのパフォーマンスの向上および修正プログラム
    • いくつかのバックアップおよび復元機能関連の修正プログラム
    • いくつかの主要なワークフロー関連の修正プログラム

  • Office Server用 Infrastructure Update

    • フェデレーション検索や統合された検索管理ダッシュボードなどの新しい検索機能
    • 検索機能のパフォーマンスとスケーラビリティを向上するいくつかの主要な修正プログラム
    • プラットフォームのパフォーマンスの向上および修正プログラム
    • コンテンツ展開機能の発行の信頼性を向上するいくつかの主要な修正プログラムフェデレーション検索や統合された検索管理ダッシュボードなどの新しい検索機能

どうやら、SP1をインストール後に適用するようですね。ですので、今までの道のりはRTM+SP1+Infrastructure Updateということになります。
また、インストール方法もSP1の時と同様のようです。修正内容ですが、下記のリンクに修正内容一覧が出ています。

地味にコンテンツ展開機能系の修正が多い…コンテンツ展開機能を以前、簡単に試したときに動かなかったんですけど…Bug?だったんですね・・・

さて、話戻しまして検索ですが上記モジュールをインストールすると…共有サービスに検索管理というメニューが追加されてます。

0716-01.jpg

そして、クリックすると…

0716-02.jpg

ん~なんか格好良いw ここから一元管理ができて楽そうです!

あとは、追加された検索のWebパーツを追加すると以下のようにLive Search(既定はやっぱり…)と検索候補の単語が出てきます。夢が広がりますね~

0716-03.jpg

メールの宛先(To)による検索

金曜日, 7 月 11th, 2008

弊社で、メールのTOでフィルタをかけた状態で検索を行いたいという要望があったので実現できるかを調べてみました。共有サービス検索の設定メタデータ プロパティのマッピング新しい管理プロパティをクリックします。そして、プロパティ名に適当な名前(MailToとします)を入力したあと、マッピングの追加をクリックし、メールカテゴリの中にTo(テキスト)を選択します。その後、フルクロールを実施します。

また、高度な検索で先ほど作成したMailToで検索するためにXSLを編集します。

ページの編集高度な検索のボックスWebパーツ共有Webパーツの変更プロパティのテキストの入力ダイアログを以下のように編集します。

  • <PropertyDefs>の下に<PropertyDef Name="MailTo" DataType="text" DisplayName="表示名"/>
  • <Query/>  の下に<PropertyRef Name="MailTo" />

を設定すると準備完了です。実際に検索を行ってみると…*.msgはだめでした…が、*.emlはできました。

…微妙。

検索結果のカスタマイズ

日曜日, 7 月 6th, 2008

SharePointの検索結果を色を付けて強調表示する方法をご紹介します。

0706.png

以下のような感じです。

 SharePointの検索結果は、IndexファイルからXMLデータとして検索結果を受け取り、XSLで装飾をして表示させています。ですので、検索結果の見た目を変更したい場合は、XSLを編集すればOKです。では、まずは、検索結果のページが表示されている状態で、サイトの操作ページの編集を押します。そうすると、いくつかのWebパーツが表示されますが、今回は主要な検索結果のWebパーツのXSLを編集したいと思います。では、共有Webパーツの変更から、XSLエディタを選択します。そして、以下のようにXSLを編集します。

<以下、抜粋> 

<xsl:template match="ddd">
  … 
</xsl:template>
<xsl:template match="c0">
    <b style="background-color:yellow"><xsl:value-of select="."/></b>
</xsl:template>
<xsl:template match="c1">
    <b style="background-color:75FFEE"><xsl:value-of select="."/></b>
</xsl:template>
<xsl:template match="c2">
    <b><xsl:value-of select="."/></b>
</xsl:template>
<xsl:template match="c3">
    <b><xsl:value-of select="."/></b>

<以下、省略>

で、上記のように検索結果が強調表示されます。XMLとXSLの仕組みを理解するとかなりいろいろな検索結果にすることが可能になります!ちなみに、編集した個所は検索単語がワードブレイクされたものに適用されます。たとえば、契約書という一単語で検索すると「契約」「書」というようにワードブレイクされた後、Indexファイルと照合されます。ですので、上記の"c0"に「契約」"c1"に「書」が該当します。あ、あとこのカスタマイズは検索結果ページ分同じ作業をする必要があります…管理者殺し…

ShraePoint SP1適用時のIndexサイズの大きさについて

日曜日, 6 月 22nd, 2008

SharePointのIndexサイズの予測についてですが、SP1適用前は以下のリンクをもとに計算をしていました。

http://www.microsoft.com/japan/technet/archive/prodtechnol/office/sharepoint/library/5465aa2b-aec3-4b87-bce0-8601ff20615e.mspx?mfr=true

  • 検索対象のコンテンツサイズ:X
  • Indexサイズ:Y=(5%~12%)X ※5%~12%という数字は経験則の数値だそうです。
  • 最初にフルクロールを行うときに、2.5Yの領域が必要

 さて、SP1を適用後のIndexサイズのKBを見ると…

http://support.microsoft.com/kb/943105/ja

Microsoft Office SharePoint Server 2007 Service Pack 1 (SP1) のインストール後、
クエリ サーバーまたはインデックス サーバーで必要な最大ディスク領域が増加します。
必要な最大ディスク領域はインデックスの物理サイズの 2.85 倍になります。インストール前は、
必要な最大ディスク領域はインデックスの物理サイズの 2 倍でした。

2倍という数値が2.85倍になると記載されています。さて、ここで、上記の式に2という数値がありません…

そこで、1つ全てのつじつまがあう答えを導き出しました!
TechnetのCapacity Planのページには以下のような記述がみられます。

http://technet2.microsoft.com/Office/ja-JP/library/45997bad-da15-4442-8727-78e0f2dc5a9c1041.mspx?mfr=true

Free space Leave at least 25 percent free space for each hard disk or volume.

⇒すなわち、HDDまたはボリュームの25%は常に空き領域として残してくださいと記述してあります(私はH/W的な基準値だと考えています)。
これをもとに、SP1適用前の2.5という係数に注目してみます。
もともと、Indexの作業領域として2倍の領域が必要です。そして、25%の空きを取ることを考えると2+(2*0.25)=2.5になります。
すなわち、2.5という数値は25%の空き領域を考慮した係数だったんです…
そして、SP1適用後は、2という数値が2.85となるので…2.85+(2.85*0.25)=3.5625になります。
したがって、最終的には3.5625Yとなります…結構増えますね
おそらく、上記の考え方が一番矛盾のない考えかたであると思います。
でも、USのTechnetみると、2.5Y⇒2.85Yになっているんですよね…KBと矛盾してるし・・・

どっちを信じれば良いのでしょうか、MSさん! ま、結局社内では30%と計算しましたけどね・・・


ホットワード background border Office ファイル 検索
割引クーポンまとめ情報 - クー割