【背景】
截至 Python 3.6.6, concurrent.futures.ThreadPoolExecutor 中用的都是无·界队列,在生产速度大于消费速度时,可能会耗光系统资源,希望找到一种方式避免这种情况。
【方案一】
继承 ThreadPoolExecutor,直接修改 _work_queue 为有界队列。
优点:简单粗暴直接。
缺点:修改了私有属性。
示例: https://stackoverflow.com/a/48327162
【方案二】
将任务分组,每组完成后再提交下一组。
优点:无需继承,不改变私有属性;能切实有效的避免资源耗费。
缺点:组之间的任务是同步的,未充分利用线程,即使有剩余任务也有空闲线程存在。
示例: https://stackoverflow.com/a/49622149
【方案三】
创建工具类委托给 ThreadPoolExecutor 实例。
优点:无需继承,不改变私有属性;充分利用了线程,有剩余任务时不会有空闲线程存在。
缺点:实现较为复杂。
示例: https://www.bettercodebytes.com/theadpoolexecutor-with-a-bounded-queue-in-python/
【相关阅读】
Python3并发检验代理池地址
*** walker ***