Python 多线程--结束其线程的困惑，请告知

对这个多线程如何结束子线程有不理解的地方，请前辈们指点，非常感谢！如下：
data=[]
def get(url):
if re.search('满足条件',s,re.S):
data.append(url)

用 4 线程启动上面的函数，当这 4 线程同时运行的时候，只要其中一个线程满足了条件，就把数据添加到全局 data 里去，其他线程则马上结束，以避免修改 data 的数据，请问该如何使用 threading 模块或者 multiprocessing.dummy 模块呢？迷惑了一些时间，请指点，非常感谢

线程

Data

URL

指点

12 replies • 2017-08-31 14:40:00 +08:00

misaka19000

Aug 30, 2017 via Android

用一个 flag 做消息同步就行了

hititan

Aug 30, 2017

@misaka19000 感谢你的回复，我的意思是只要其中一个线程添加数据到了全局 data 里面，其他线程立即结束，用 flag 能实现吗？

zbl430

Aug 30, 2017

我猜楼上的意思是你每次 data.append(url) 都检测一个全局 flag 状态

nifury

Aug 30, 2017

你这种情况是 4 个线程对同一个 url 处理才会这样的吧。非要这样的话就和楼上一样用 flag 吧

NoAnyLove

Aug 30, 2017

Python 的 threading 模块没有提供强制终止其他线程的功能，正确的做法是线程检查一个标志位，然后自行退出。全局的 data 明显是一个共享变量，操作和访问它需要加锁啊，线程进入临界区的时候再检查不就好了？

如果你一定想要干掉其他线程的话（不推荐这样做），那么用 ctypes 调用 API 强杀吧，Win 下用 TerminateThread，Linux 下用 pthread_cancel，我没试过这样做，总感觉会搞出问题的样子

tscat

Aug 30, 2017

用 flag 可以实现吧，在其他线程填入数据之前判断一下 flag 的状态，如果已经填入就结束线程。

keisuu

Aug 30, 2017

用异步 io

ysc3839

Aug 30, 2017 via Android

@NoAnyLove Python 有 GIL，应该不用加锁吧

264768502

Aug 30, 2017 via iPad

append
原子操作不用加锁

NoAnyLove

Aug 31, 2017

@ysc3839
@264768502

PyList_Append 是在 GIL 里面操作的，但是不可能只向里面加数据，不访问它吧，不然共享的变量要来何用？

264768502

Aug 31, 2017 via Android

就楼主的业务逻辑,拿数据用 pop 就行,也不用锁
当然了,还是推荐自带锁的 deque

NoAnyLove

Aug 31, 2017

@264768502 如果只是 append/pop 简单的内容，的确不需要锁，基本上是线程安全的。不过如果其它线程要主动判断`data`是否有数据，以便于决定是不是要自行终止的话，就需要加锁了，因为`if data: pass`，if 判断再执行这种操作不是线程安全的。

deque 本身不带锁，带锁的 deque 就是 Queue，如果从实现上来说的话。

仔细想想，我以前写的 Python 多线程代码好像有点过度加锁了，如果对 list 的操作足够简单，并且确保线程安全的话，可以不用加锁的。不过总感觉加锁比较安全。

另外，这个案例其实比较适合 asyncio。