内容转载自我的博客
目录
- 1. 目标网站
- 2. 编写代码
1. 目标网站
本代码是专门为了下载中国地球物理学科中心WDC for Geophysics的数据而编写的,也只能运行在此网站的控制台窗口。实现的功能是替代用户手动点击,很多数据动辄就是一年共三百多个文件,手动点击费时费力。本代码不对服务器造成任何破坏,仅将点击操作换成自动,且下载时间间隔为5秒
2. 编写代码
此网站的数据如果需要下载,必须注册并登录账号
本代码假定已经登录账号的情况下,假定用户下载的数据为此网页
body = document.getElementById(\"NewsBody\");center = body.getElementsByTagName(\"center\")[0];elements = center.children;// 当前下载的文件是第几个var index = 0;// 数据文件总个数var count = 0;// 下载间隔时间,单位毫秒var sleep_interval = 5000;// 睡眠时间var sleep_time = 0;// 定时器的回调函数function download(index){e = elements[index];if(e.href){e.setAttribute(\"download\",e.innerText.trim());sleep_time = sleep_interval;e.click();count = count + 1;console.log(\"下载文件: \" + e.innerText);}else{sleep_time = 1;}index = index + 1;if(index<elements.length){setTimeout(download, sleep_time, index);}else{console.log(\"网页包含文件总个数: \"+count);}}// 启动下载setTimeout(download, 1, 0);