元派遣プログラマの自称技術系ブログです。雑記とか自作のオープンソースプロジェクトの話とか。
Javaとか組込とかできます。お仕事ください。

ニコ動RSSからの値抜き

ニコ動のRSSにはcontentのタグがあて、その中にあるhtml片に動画の情報が書いてある。

これを取るためには、DOMでRSSをパースして、該当タグのCDATAを取り出して、その部分だけもう一度DOMにかけるんだけど・・・。

Html片をそのままDOMにかけると、日本語が全部数値文字参照になってしまう。

$part_of_html=
''.
$this->PickupContentNode($entry[$i])->nodeValue.'';

見たいな感じで完全なHtmlを作って、DOMにかける。

そうすれば数値文字参照にはならない。