読者です 読者をやめる 読者になる 読者になる

あれもPython,これもPython

Pythonで世界を包みたい

PythonでRSSフィードを処理する

PythonRSSリーダーを作りたい時があります。
そういった時はfeedparserモジュールを使用します。

feedparserは標準モジュールではないので、
pip等でインストールします。

pip install feedparser

使い方

RSSフィードのURLを与えてあげると、
FeedParserDictという辞書型に似た形で返してくれます。

ドキュメントを見るとほとんどのパース作業を裏でやってくれているので、
使用する分には何も考えないでも使えてしまいます。

import feedparser
url = "feedのurl"
rss = feedparser.parse(url)

type(rss)
# <class 'feedparser.FeedParserDict'>

ほとんど辞書型と同様に扱えるので,
keyやvalueを確認して、必要なデータを取り出します。

for k in rss.keys():
    print k
# ['feed', 'status', 'updated', 'updated_parsed', 'encoding', 'bozo', 'headers', 'etag', 'href', 'version', 'entries', 'namespaces']

for content in rss["entries"]:
    print content["title"]#各エントリーのタイトル
    print content["link"]#各エントリーのurl

後はこれらのデータをデータベースに格納したり、
画面に表示すれば、RSSリーダーが作れます。