[Python]metaタグ内の要素を取得(スクレイピング)する

python

Pythonで特定のWebサイトをスクレイピングする時に、metaタグの要素を取得する時のメモです。

Pythonでmetaタグ内の要素を取得する

titleタグやimgタグなど比較的容易に取得できますが、metaタグの要素を取得する時に少し悩んだので備忘録を兼ねてメモ。

<meta property="og:title" content="test" />

上記のmetaタグを例にしていきます。

cssselect('meta[property="og:title"]')[0].get('content')

これでmetaタグ内のcontent部分の要素を取得することができます。



カテゴリー