虽然golang中协程开销很低,但是在一些情况下还是有必要限制一下协程的开启数,比如爬虫中的下载协程,因为受到带宽限制,开的多了也没有效果。本来想在网上找找有没协程池,类似其它语言线程池这样的东西,可以限制最大开启数。找了一番,这方面的资料非常少,难道golang不需要协程池这种东东?自己动手写一个吧。
要限制协程最大数量,就是考虑开启一个协程的时候记录一下,然后超过最大数就不再开启。可以考虑用一个变量count来记录协程开启数量,不过这种方式比较out了,golang中可以用channel来实现。
不限制的代码:
package main
import (
"fmt"
"strconv"
"time"
)
// 模拟下载页面的方法
func download(url string) {
fmt.Println("download from ",url)
}
func main() {
urls := [100]string{}
for i := 0; i < 100; i++ {
urls[i] = "url" + strconv.Itoa(i)
}
for i := 0; i < len(urls); i++ {
go download(urls[i])
}
// 休眠一下
for {
time.Sleep(1 * 1e9)
}
}
根据url数量开启若干协程,每个协程会去下载页面内容,通常受到带宽的限制,协程开多了没有什么提升效果。
限制一下
package main
import (
"fmt"
"strconv"
"time"
)
var (
maxRoutineNum = 10
)
// 模拟下载页面的方法
func download(url string,ch chan int) {
fmt.Println("download from ",url)
// 休眠两秒模拟下载页面
time.Sleep(2 * 1e9)
// 下载完成则从ch推出数据
<-ch
}
func main() {
ch := make(chan int,maxRoutineNum)
urls := [100]string{}
for i := 0; i < 100; i++ {
urls[i] = "url" + strconv.Itoa(i)
}
for i := 0; i < len(urls); i++ {
// 开启下载协程前往ch塞一个数据
// 如果ch满了则会处于阻塞,从而达到限制最大协程的功能
ch <- 1
go download(urls[i],ch)
}
// 休眠一下
for {
time.Sleep(1 * 1e9)
}
}
主要就是用golang中channel的阻塞性和最大数量处理,可以考虑封装一下提供使用。
golang真的不需要协程池?