2011年8月3日水曜日

Pythonでスクレイピング

PythonでスクレイピングするライブラリとしてBeautifulSoupを利用

HTMLを取得して、それを表示する簡単なサンプル
  1. import urllib2  
  2. from BeautifulSoup import BeautifulSoup  
  3.   
  4. if __name__ == '__main__':  
  5.     web = urllib2.urlopen('http://www.google.co.jp/')  
  6.     html = BeautifulSoup(web)  
  7.     print html.prettify()  
これで、指定したWebサイトのHTMLを取得/表示することができる

0 件のコメント: