その218 ユーミンカタログ奮戦記(その2)
まず最初にお詫びと訂正。奮戦記その1で紹介したSpidering hacks―ウェブ情報ラクラク取得テクニック101選は、AmazonのWebサービスについてだけ書いているのではなく、ウェブ上の情報を取得する方法を、主にperlを使ったやり方で説明しているもので、XSLTの記述はなかった。人に本を紹介するなら、もう少しきちんと把握してからでないとね。ごめんなさいm(_ _)m。
ただ、収集した情報をRSSにする方法論などが書かれているようなので、実は私がかねてからやりたいと思っていたサービスに活用できるのではないかと、少し期待している。
でもねぇ、Perlなのよねぇ。しかもモジュールインストールしなくちゃならないし…。
それ自体は簡単なことだけど、私のようにプロバイダの無料領域を使っている場合には、これは無理なのよねぇ。
その処理はローカルでやって、あとはXSLTでやればいいじゃんと思っても、これまたプロバイダの無料領域だから、XSLT使えないのよねぇ。うちにくる人が全員IEの6.0以上なら問題ないのだけど、そういうわけにはいかないからねぇ(^^;。AmazonのWebサービスでXSLTを使えるのは、こちらでXSLファイルを用意すれば、あとはAmazonのサーバー上のXSLTプロセッサで処理してくれるからなのよ。私がユーミンカタログでXSLTにこだわるのは、この点があるから。早くレンタルサーバを用意したいのだけど、固定費のことを考えると、気が重いわ(^^;。でも、仕事的にもそうも言ってられない状況かも。
さて、ユーミンカタログの話。
G-ToolsさんのAmazon Web Service 3.0 技術情報を読んで、情報加工に必要なXMLデータをAmazonから取得。それを見ながらXSLTを書いてプロバイダのWeb領域にUP。早速呼び出した。
実はXMLデータを取得するURLはamazon.co.jpではなく、xml-jp.amznxslt.comだったことが躓きだった。そこで、G-Toolsさんからこの部分のURLをコピーさせていただいた。
何度か修正して、思うような形ができたのだが、では、ということでカートを試してみたところ、エラーが出る。何が悪いのだろうと調べてみたら、カートのURLがアメリカのURLなのだ。カートのところで訂正すべきところは訂正したと思ったのだが、肝心のURLを直していなかった。amazon.comをamazon.co.jpにしなければいけなかったのだ。そこで、アソシエイトのサイトからカートの画像をダウンロードしてきて、それをコードごと使った。
こうして何とかユーミンカタログを公開することができたのだが、翌月AmazonからAWS4.0のベータテストがもうすぐ終わりますというメールが…。
これを使うと取得できる情報が増えるということで、先月末になってようやく腰を上げた。G-Toolsさんに加えてこちらも参考にさせていただいて移行準備に入った。移行自体はそれほど難しくない。ただし、XSLTを新バージョンに合わせて変更しなくてはならないので、XSLTでアクセスする場合XSLTがわからないと難しい。
ユーミンカタログはCDの新着10タイトルの状態でまとめたいと思っているのだが、大変残念なことに、肝心のカスタマーレビューに不正な文字というエラーが出てきて、取得が止まってしまう。新着10タイトルは表示できているが、他の部分に広げようとするととたんにエラーになるのでまだ使えない。とりあえず新バージョンを安心して使うためには思い出の壁紙からのリンクのように、カスタマーレビューをレビューページへのリンクにすることで逃げるしかないようだ。
あと、これはたぶん3.0でもそうかもしれないが、呼び出すときに新着順でという指定をしているのにもかかわらず、まったく無視されているようなのだが、これはどうしたものか。sortの命令は、いったい何のためにあるのだろうか…。
なお、XMLやXSLTについては、PROJECT KySSさんの本と、XSLTバイブル―プログラマーズリファレンス がお勧め。
PROJECT KySSさんの本は、初めてXSLTを勉強したときにお世話になった。私が初めて読ませていただいたのは、その中の「XML+XSLサンプル集―いきなり理解するよりも、マネして覚えるほうが早くて簡単!」だ。このときはMSXMLのバージョンが古かったので、今では品切れになっているようだ。次は「XML+XSLT実用スーパーサンプル集―いきなり理解するよりも、マネして覚えるほうが早くて簡単! 」を読ませていただいた。
「XSLTバイブル」の方は、今現在文字通りバイブルにしている。ズシッとかなり重いが、頼りになる。ただし発行年月日が古いためか、これも品切れ(^^; 残念!!
Webでは、アットマーク・アイティーがお勧め。いつもお世話になっている。
2004-12-15
不正な文字についてはAmazon.com Discussion Boardsの専用スレッドに報告すれば対応してくれるとのこと。どのタイトルに問題があるか、調べて報告しなくては。と思ったら、Amazonの各カタログデータの最後にある修正依頼の項目から依頼を出してくれとのこと。早速7タイトルの不具合を報告。
そうそう。レンタルサーバも決めたわ(^^)
2004-12-21
さらに3タイトル報告。実は、15日の時点で投稿のニュアンスを読み違えたようで、修正依頼の項目からというのは間違いで、やはりAmazon.com Discussion Boardsへ投稿して欲しいとのこと。このところ専用スレッドの投稿がないから、すっかり勘違いしてしまった。Webサービスの問題は、カスタマーサービスとは関係ないようだ。でも、投稿するのも手続きが結構面倒なんだなぁ(--;
2004-12-24
さらに3タイトル報告。







