基于python的多进程共享变量正确打开方式

下面为大家分享一篇基于python的多进程共享变量正确打开方式，具有很好的参考价值，希望对大家有所帮助。一起过来看看吧
多进程共享变量和获得结果
由于工程需求，要使用多线程来跑一个程序。但是因为听说python的多线程是假的，于是使用多进程，反正任务需要共享的参数少。
查阅资料，发现实现多进程主要使用multiprocessing，有两种方式，一种是process，另一种是pool。
p = process(target=fun,args=(args))
再通过p.start()来启动一个子进程，通过p.join()方法来使得子进程运行结束后再执行父进程。
但是这样很烦，还要写个for 循环来开n个线程和join。
于是推荐用pool。它可以开一个固定大小的进程池，然后每个线程执行apply_async()函数调用要执行的函数，最后再close和join。
代码如下：
pathm=manager().queue(len(pathlist)) for d in pathlist: pathm.put(d) p=pool(cp.threads) results=[] for i in range(cp.threads): temp=p.apply_async(processworker,args=(i,pathm,cp)) results.append(temp) print 'waiting for all subprocesses done...' p.close() p.join() print 'all subprocesses finish processing.' results=[r.get() for r in results]
上面的代码演示了如何使用pool多进程，如何在pool里的进程之间共享变量pathm，以及如何获得进程函数执行的结果。需要注意的是，processworker必须是个无界的函数，否则报错该函数无法被pickle从而不能分配到各个进程。
cpickle.picklingerror: can't pickle <type 'instancemethod'>: attribute lookup __builtin__.instancemethod failed
有界函数和python的多进程机制
从上面引申到了一个概念，就是有界函数无界函数的概念。
查阅资料之后我总结如下：
有界函数是包在一个类中，并且只有当类被实例化之后才能使用的函数，它的界就是这个实例。我们常常把这些函数称为类方法。例如以self为参数的类方法。
无界函数可以是没有被包在类中的函数，也可以是类中的静态方法，它们跟类是独立的。如类中的静态方法，它即使在某个类中被定义，但是不能访问类中的参数和其他方法。
python多进程的机制应该是把每个进程要调用的方法和传入的参数（如上面例子中的processworker）编译然后打包，然后复制到每个进程中执行。如果输入的是一个有界函数，那么它的参数应该是它所属的类（包括参数和方法），但是这是无法获得的，而且类属性和方法可能会有坑，导致难以打包。所以python限定了多进程要调用的函数不能是类方法。
我们要把多进程调用的函数放到类外面，或者变成静态函数。但是静态函数的话不能被所属的类的方法调用（self.processworker的形式），需要在外部调用，如mc=myclass(),mc.processworker来调用，或者myclass().processworker来调用。
相关推荐：
基于python 装饰器装饰类中的方法
基于python numpy的数组array和矩阵matrix详解_python
以上就是基于python的多进程共享变量正确打开方式的详细内容。

基于python的多进程共享变量正确打开方式

推荐信息