本文章是关于采用Python方法来抓取某网站分享页面中的源码方法示例。需要大家注意的是Python抓取分享页面的源代码示例,是要在运行时导入BeautifulSoup.py文件后才可以使用。
Python抓取分享页面的源代码示例,需要用到python urllib2模块方法,论文,及BeautifulSoup模块。
源码如下:
#coding:utf-8 import urllib2 from BeautifulSoup import BeautifulSoup ''' ''' #define def readPage(Url): page = urllib2.urlopen(Url).read() pageContent = BeautifulSoup(page) OSC_Content = pageContent.find('div',{'id':'OSC_Content'}) preHandleCode = OSC_Content.find('pre').next print preHandleCode ''' 页面的url需指定 ''' #call readPage('')这里的目标网站已经隐藏,开题报告,大家可针对自己要抓取的目标站,参考本python源码适当修改。