python多进程并发demo实例解析-侯体宗的博客

python多进程并发demo实例解析
Python / 管理员发布于 8年前 235

这篇文章主要介绍了python多进程并发demo实例解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

前言

下午需要简单处理一份数据，就直接随手写脚本处理了，但发现效率太低，速度太慢，就改成多进程了；

程序涉及计算、文件读写，鉴于计算内容挺多的，就用多进程了（计算密集）。

代码

import pandas as pdfrom pathlib import Pathfrom concurrent.futures import ProcessPoolExecutorparse_path = '/data1/v-gazh/CRSP/dsf_full_fields/parse'source_path = '/data1/v-gazh/CRSP/dsf_full_fields/2th_split' # 目录中有3.3W个csv文件，串行的话，效率大打折扣def parseData():  source_path_list = list(Path(source_path).glob('*.csv'))  multi_process = ProcessPoolExecutor(max_workers=20)  multi_results = multi_process.map(func, source_path_list)def func(p):  source_p = str(p)  parse_p = str(p).replace('2th_split', 'parse')  df = pd.read_csv(source_p)  df['date'] = pd.to_datetime(df['date'].astype(str)).dt.date  df.sort_values(['date'], inplace=True)  # 处理close为负的值(abs)，添加status标识  df['is_close'] = df['PRC'].map(lambda x: 0 if x < 0 or pd.isna(x) else 1)  df['PRC'] = df['PRC'].abs()  df.rename(columns={'CFACPR': 'factor'}, inplace=True)  df['adj_low'] = df['BIDLO'] * df['factor']  df['adj_high'] = df['ASKHI'] * df['factor']  df['adj_close'] = df['PRC'] * df['factor']  df['adj_open'] = df['OPENPRC'] * df['factor']  df['adj_volume'] = df['VOL'] / df['factor']  # calc change  df['change'] = df['adj_close'].diff(1) / df['adj_close'].shift(1)　　 df.drop_duplicates(inplace=True)  df.to_csv(parse_p, index=False)parseData()

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

上一条：
python opencv实现gif图片分解的示例代码
下一条：
python plotly画柱状图代码实例

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top