Skip to content

liu983/reptile

Repository files navigation

项目一:获取广东省人民政府办公厅特定日期间的政策数据

功能:

  a.收集索引号、发布机构、发布日期、政策标题、政策正文文本、政策正文附件链接,以上六项信息
  b.收集特定时间区间内的全部政策信息

说明:

  使用lxml库做页面解析

使用:

输入:日期范围	例:(20220101-20230601)
输出:指定时间范围内的全部政策信息

环境:

  ide:pycharm,python3.7
  库:requests,lxml,time,json,random,datetime

项目二:获取天眼查平台某家公司的全部专利数据

功能:

  a.完成自动登录并获取Cookie
  b.获取任意一家企业的全部专利数据

说明:

  selenium库完成账号登录

使用:

    输入:企业名称	例:(华为技术有限公司)
输出:指定企业的全部专利数据列表

环境:

  ide:pycharm,python3.7
  库:seleium,chajiying,time

About

爬虫项目练习

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages