Python如何爬取爱奇艺电影信息-创新互联
                                            这篇文章主要介绍Python如何爬取爱奇艺电影信息,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

一,使用库
1.requests
2.re
3.json
二,抓取html文件
def get_page(url): response = requests.get(url) if response.status_code == 200: return response.text return None
三,解析html文件
我们需要的电影信息的部分如下图(评分,片名,主演):

抓取到的html文件对应的代码:

可以分析出,每部电影的信息都在一个
def parse_page(html):
  pattern = re.compile('四,写入文件
def write_to_file(content):
  with open('result.txt', 'a', encoding='utf-8')as f:
    f.write(json.dumps(content, ensure_ascii=False) + '\n')#将字典格式转换为字符串加以保存,并设置中文格式
    f.close()五,调用函数
def main(): url = 'https://list.iqiyi.com/www/1/-------------8-1-1-iqiyi--.html' html = get_page(url) for item in parse_page(html): print(item) write_to_file(item)
六,运行结果


七,完整代码
import json
import requests
import re
# 抓取html文件
# 解析html文件
# 存储文件
def get_page(url):
  response = requests.get(url)
  if response.status_code == 200:
    return response.text
  return None
def parse_page(html):
  pattern = re.compile('以上是“Python如何爬取爱奇艺电影信息”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注创新互联行业资讯频道!
文章题目:Python如何爬取爱奇艺电影信息-创新互联
本文来源:http://www.scyingshan.cn/article/hhopc.html


 咨询
咨询
 建站咨询
建站咨询 
 