Python FTP文件定时自动下载实现过程解析
Python  /  管理员 发布于 7年前   405
这篇文章主要介绍了Python FTP文件定时自动下载实现过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
一、需求:
某数据公司每日15:00~17:00之间,在其FTP发布当日数据供下载,我方需及时下载当日数据至指定本地目录。
二、分析:
1、需实现FTP登陆、查询、下载功能;
解答:使用内置的ftplib模块中FTP类;
2、需判断文件是否下载;
解答:使用os模块中path.exists方法;
3、需判断在指定时间段内才执行下载任务;
解答:使用内置的time模块抓取当前时间,并与指定时间做比较;
4、需考虑日期切换问题;
解答:使用内置的time模块抓取当前日期,并与变量中的日期做比较。
三、代码实现
#!/usr/bin/env python# _*_ coding:utf-8 _*_'''@Time : 2019-11-11 13:30@Author : Peanut_C@FileName: ftp_auto_download.py'''import timefrom ftplib import FTPimport osremote_path = "/xxx/yy/z/" # 远端目录begin_time = 1500 # 任务开始时间end_time = 1700 # 任务结束时间today = time.strftime("%Y%m%d") # 当天日期today_file = today + 'test.txt' # 得到当天日期的目标文件名remote_file = remote_path + today_file # 远端文件名local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名log_file = 'C:\\\\log\\ftp_log.txt'def ftp_connect(): """用于FTP连接""" ftp_server = 'w.x.y.z' # ftp站点对应的IP地址 username = 'ftpuser' # 用户名 password = 'ftppass' # 密码 ftp = FTP() ftp.set_debuglevel(0) # 较高的级别方便排查问题 ftp.connect(ftp_server, 21) ftp.login(username, password) return ftpdef remote_file_exists(): """用于FTP站点目标文件存在检测""" ftp = ftp_connect() ftp.cwd(remote_path) # 进入目标目录 remote_file_names = ftp.nlst() # 获取文件列表 ftp.quit() if today_file in remote_file_names: return True else: return Falsedef download_file(): """用于目标文件下载""" ftp = ftp_connect() bufsize = 1024 fp = open(local_file, 'wb') ftp.set_debuglevel(0) # 较高的级别方便排查问题 ftp.retrbinary('RETR ' + remote_file, fp.write, bufsize) fp.close() ftp.quit()while True: if int(time.strftime("%H%M")) in range(begin_time, end_time): # 判断是否在执行时间范围 if int(time.strftime("%Y%m%d")) - int(today) == 0: # 判断是否跨日期 while not os.path.exists(local_file): # 判断本地是否已有文件 if remote_file_exists(): # 判断远端是否已有文件 download_file() with open(log_file, 'a') as f:f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 今日文件已下载!") time.sleep(60) # 下载完毕静默1分钟 else: time.sleep(180) break # 注意,此处跳出循环重新判断日期,避免周末或当天没文件时陷入内层循环 else: time.sleep(180) else: """如果跨日期,则根据当前日期,更新各文件日期""" today = time.strftime("%Y%m%d") # 当天日期 today_file = today + 'test.txt' # 得到当天日期的目标文件名 remote_file = remote_path + today_file # 远端文件名 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名 with open(log_file, 'a') as f: f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 任务启动, 文件日期已更新。") else: time.sleep(1800)
四、运行情况
保存为pyw文件,任务在后台持续运行,不需要计划任务,省心省力。
不用下载标记,一则较为简洁,二则本地文件如果被人误删或移动可自动重新下载。
日志中,每天仅写入任务启动和文件已下载标志,并记录对应时间,如有需要可再添加。
希望能帮到有需要的朋友。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号