RSS feed encoding = EUC-JP -> UTF-8 フィードの文字コードがクロールに影響しているかも

まじめにGoogle sitemapにサイトマップを登録し、
htmlの文法も直した
しかし全然テクノラティとgoogleブログ検索に
引っかからないのはなんでだろうとだいぶ悩んでいたのだが、
(Yahoo! site explorerは非常に頻繁に拾ってくれている)

自分のサイトのいわゆるrss feed
(つまりatom.xml, index.xml, index.rdfだ)
googleのキャッシュで検索すると、文字化けしていた。
たぶん出力している文字コードをうまくgoogleが認識していない。

firefoxなんかのrssリーダで読み込むと問題なく読み込めるのだが
なぜgoogleが文字化けして認識してしまうのかイマイチ
理解不能だ。が、色々ググってみるとUTF-8で
出力しているrss feedは問題なくgoogleが拾っていた。

ということでEUC-JPでencodeされているrss feedのUTF-8化に着手。
色々探すとRSSで試行錯誤中 その2 が参考になる。

mt-jcodeをMovabletypeのプラグインディレクトリに放り込み、
あとはRSSの文字コードを変換、出力される日本語がある
MTコンテナタグにjcode=”euc”を追加していけば良いだけだ。
作業を終えて文字化けもなくfirefoxで見られることを確認し、
googleがもう一度クロールしてくれるのを待つか、、うーむ。