[Python]metaタグ内の要素を取得(スクレイピング)する

Pythonで特定のWebサイトをスクレイピングする時に、metaタグの要素を取得する時のメモです。
Pythonでmetaタグ内の要素を取得する
titleタグやimgタグなど比較的容易に取得できますが、metaタグの要素を取得する時に少し悩んだので備忘録を兼ねてメモ。
<meta property="og:title" content="test" />
上記のmetaタグを例にしていきます。
cssselect('meta[property="og:title"]')[0].get('content')
これでmetaタグ内のcontent部分の要素を取得することができます。