python的简单脚本,用于提取谷歌音乐搜索页面中的歌曲信息,包括歌曲名,作者,专辑名,现在链接等,最多只提取10页结果。
#! /usr/bin/env python#coding=utf-8'''created on 2011-8-19@author: yaoboyuan'''from urllib import request,parseimport re,sysdef extractsongrawdata(text): '抓取每一首歌的原始数据' text = re.sub('\n+','',text) songlist = re.findall('\