当前位置: 代码迷 >> 综合 >> ieee 论文爬虫
  详细解决方案

ieee 论文爬虫

热度:98   发布时间:2023-12-26 09:22:34.0
import requests, json, pandas as pd, re, os, sys, zipfile, time  # tqdm是一个进度条模块
from tqdm import tqdm  # 这个模块需要特别导入进去# 思路:爬取异步加载的网站,抓到传输数据的包进行下载,在抓到的数据中提取有效的信息。得到pdf地址,进行文章的下载。
# number = str(input('请输入会议标记数字:'))
# 1.爬取所需要的参数,为爬取toc包做准备
# a_list = ['8566021', '8606809', '8635382', '8661586', '8680720', '8703188', '8730464', '8755525', '8789435', '8832290',
#           '8861188', '8893432']
# yufen_list = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12']
# a=int(8566021) #一月份
yuefen=str(1)
# #https://ieeexplore.ieee.org/rest/search/pub/69/issue/8566021/toc
# #toc文件是为了下载文章标题的啊!!!!!!!!!!!
# url = "https://ieeexplore.ieee
  相关解决方案