cookie的自动获取以及自动更新的方法

这次给大家带来cookie的自动获取以及自动更新的方法，cookie自动获取以及自动更新的注意事项有哪些，下面就是实战案例，一起来看一下。
社交网站中的很多信息需要登录才能获取到，以微博为例，不登录账号，只能看到大v的前十条微博。保持登录状态，必须要用到cookie。以登录www.weibo.cn 为例：
分析控制台的headers的请求返回，会看到weibo.cn有几组返回的cookie。
实现步骤：
1，采用selenium自动登录获取cookie，保存到文件;
2，读取cookie，比较cookie的有效期，若过期则再次执行步骤1；
3，在请求其他网页时，填入cookie，实现登录状态的保持。
1，在线获取cookie
采用selenium + phantomjs 模拟浏览器登录，获取cookie；
cookies一般会有多个，逐个将cookie存入以.weibo后缀的文件。
def get_cookie_from_network(): from selenium import webdriver url_login = 'http://login.weibo.cn/login/' driver = webdriver.phantomjs() driver.get(url_login) driver.find_element_by_xpath('//input[@type=text]').send_keys('your_weibo_accout') # 改成你的微博账号 driver.find_element_by_xpath('//input[@type=password]').send_keys('your_weibo_password') # 改成你的微博密码 driver.find_element_by_xpath('//input[@type=submit]').click() # 点击登录 # 获得 cookie信息 cookie_list = driver.get_cookies() print cookie_list cookie_dict = {} for cookie in cookie_list:   #写入文件   f = open(cookie['name']+'.weibo','w')   pickle.dump(cookie, f)   f.close()   if cookie.has_key('name') and cookie.has_key('value'):    cookie_dict[cookie['name']] = cookie['value'] return cookie_dict
2，从文件中获取cookie
从当前目录中遍历以.weibo结尾的文件，即cookie文件。采用pickle解包成dict，比较expiry值与当前时间，若过期则返回为空；
def get_cookie_from_cache(): cookie_dict = {} for parent, dirnames, filenames in os.walk('./'):   for filename in filenames:    if filename.endswith('.weibo'):     print filename     with open(self.dir_temp + filename, 'r') as f:      d = pickle.load(f)      if d.has_key('name') and d.has_key('value') and d.has_key('expiry'):       expiry_date = int(d['expiry'])       if expiry_date > (int)(time.time()):        cookie_dict[d['name']] = d['value']       else:        return {} return cookie_dict
3，若缓存cookie过期，则再次从网络获取cookie
def get_cookie(): cookie_dict = get_cookie_from_cache() if not cookie_dict:   cookie_dict = get_cookie_from_network() return cookie_dict
4，带cookie请求微博其他主页
def get_weibo_list(self, user_id): import requests from bs4 import beautifulsoup as bs cookdic = get_cookie() url = 'http://weibo.cn/stocknews88' headers = {'user-agent': 'mozilla/5.0 (windows nt 6.1) applewebkit/537.36 (khtml, like gecko) chrome/31.0.1650.57 safari/537.36'} timeout = 5 r = requests.get(url, headers=headers, cookies=cookdic,timeout=timeout) soup = bs(r.text, 'lxml') ... # 用beautifulsoup 解析网页 ...
相信看了本文案例你已经掌握了方法，更多精彩请关注其它相关文章！
推荐阅读：
vue使用xe-utils函数库的步奏详解
vue在打包项目以后刷新显示404应该怎么处理
以上就是cookie的自动获取以及自动更新的方法的详细内容。

cookie的自动获取以及自动更新的方法

推荐信息