最近一直跟着廖大在学Python,关于分布式进程的小例子挺有趣的,这里做个记录。
分布式进程
Python的multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者,将任务分布到其他多个进程中,依靠网络通信。由于managers模块封装很好,不必了解网络通信的细节,就可以很容易地编写分布式多进程程序。
master服务端原理:通过managers模块把Queue通过网络暴露出去,其他机器的进程就可以访问Queue了
服务进程负责启动Queue,把Queue注册到网络上,然后往Queue里面写入任务,代码如下:
#task_master.py #coding=utf-8 #多进程分布式例子 #服务器端 from multiprocessing.managers import BaseManager from multiprocessing import freeze_support #server启动报错,提示需要引用此包 import random,time,queue #发送任务的队列 task_queue = queue.Queue() #接收结果的队列 result_queue = queue.Queue() #从BaseManager继承的QueueManager class QueueManager(BaseManager): pass #win7 64 貌似不支持callable下调用匿名函数lambda,这里封装一下 def return_task_queue(): global task_queue return task_queue def return_result_queue(): global result_queue return result_queue def test(): #把两个Queue注册到网络上,callable参数关联了Queue对象 #QueueManager.register('get_task_queue',callable=lambda:task_queue) #QueueManager.register('get_result_queue',callable=lambda:result_queue) QueueManager.register('get_task_queue',callable=return_task_queue) QueueManager.register('get_result_queue',callable=return_result_queue) #绑定端口5000,设置验证码‘abc' manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#这里必须加上本地默认ip地址127.0.0.1 #启动Queue manager.start() #server = manager.get_server() #server.serve_forever() print('start server master') #获得通过网络访问的Queue对象 task = manager.get_task_queue() result = manager.get_result_queue() #放几个任务进去 for i in range(10): n = random.randint(0,10000) print('put task %d...' % n) task.put(n) #从result队列读取结果 print('try get results...') for i in range(10): r = result.get(timeout=10) print('result:%s' % r) #关闭 manager.shutdown() print('master exit') if __name__ == '__main__': freeze_support() test()
运行截图如下:
在分布式多进程环境下,添加任务到Queue不可以直接对原始的task_queue进行操作,那样就绕过了QueueManager的封装,必须通过manager.get_task_queue()获得的Queue接口添加。
任务进程,代码如下:
#task_worker.py #coding=utf-8 #多进程分布式例子 #非服务端:worker import time,sys,queue from multiprocessing.managers import BaseManager #创建类似的QueueManager class QueueManager(BaseManager): pass #由于这个QueueManager只从网络上获取Queue,所以注册时只提供名字即可 QueueManager.register('get_task_queue') QueueManager.register('get_result_queue') #连接到服务器,也就是运行task_master.py的机器 server_addr = '127.0.0.1' print('connect to server %s...'% server_addr) #端口和验证码注意要保持完全一致 m = QueueManager(address=(server_addr,5000),authkey=b'abc') #从网络连接 m.connect() #获取Queue的对象 task = m.get_task_queue() result = m.get_result_queue() #从task队列获取任务,并把结果写入result队列 for i in range(10): try: n = task.get(timeout=1) print('run task %d * %d...'% (n,n)) r = '%d * %d = %d' % (n,n,n*n) time.sleep(1) result.put(r) except queue.Empty: print('task queue is empty') #处理结果 print('worker exit')
运行截图如下:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
标签:
python3,多进程分布式
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
白云城资源网 Copyright www.dyhadc.com
暂无“python3学习笔记之多进程分布式小例子”评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
2025年01月11日
2025年01月11日
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]