zuzara : ブログの記事本文を抽出するAPI: TSUBUAN
KOSHIANに続いてTSUBUANをつくりました。
URLを与えるとそのページに含まれる本文らしき文章をXMLで返すAPIです。
手前味噌第2弾。
ブログなどのページのURLを与えると本文を抽出して、返す。
仕様:
Documentation for Content Extraction API “TSUBUAN”
サンプルレスポンス:
http://usingapi.com/api/tsubuan?url=http://blog.zuzara.com/2006/12/12/173/


今週の話題(ブログの記事本文を抽出する API 、 Opera で Google サービスを動かす User JavaScript など)…
さあ、いよいよ年の瀬ですね。当 blog も今年はこれで最後の投稿とさせていただき、一週間お休みをいただこうと思います。ご了承くださいませ。一年の総括は元旦あたりに初投稿…
Trackback by WebOS Goodies — December 30, 2006 @ 8:51 pm
こんにちは、 WebOS Goodies の歩行者です。
面白い API ですね!
私の記事でいくつか試してみましたが、
きちんと本文が抽出できて感動しました。
やはりコメントは付いてきてしまいますが、
このあたりを汎用的に区別するのは
素人目にも難しそうな気がします(笑)。
いつもどおりまとめ記事で恐縮ですが、
トラックバックさせていただきました。
それでは、よいお年をお迎えください。
来年もよろしくお願いいたします。
Comment by 歩行者 — December 30, 2006 @ 8:58 pm