解析源码,得到目标信息 【python】
来源: 网络用户发布,如有版权联系网管删除 2020-04-04
解析源码,得到目标信息 45 def parse_html(html,*args):
46 if not args:
47 pattern = re.compile(r'g_page_config = (.*?)g_srp_loadCss',re.S)
48 # 去掉末尾的';'
49 result = re.findall(pattern, html)[0].strip()[:-1]
50 # 格式化json,可以用json在线解析工具查看结构
51 content = json.loads(result)
52 data_list = content['mods']['itemlist']['data']['auctions']
53 else:
54 pattern = re.compile(r'{.*}',re.S)
55 result = re.findall(pattern,html)[0]
56 content = json.loads(result)
57 data_list = content['API.CustomizedApi']['itemlist']['auctions']
58
59 get_target(data_list)
查看评论 回复