node.js“多线程”如何处理高并发任务？

下面本篇文章给大家介绍一下使用 nodejs “多线程”处理高并发任务的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。
相关推荐：《nodejs视频教程》
摩尔定律摩尔定律是由英特尔联合创始人戈登·摩尔(gordon moore)在 1965 年提出的，即集成电路上可容纳的元器件的数量每隔 18 至 24 个月就会增加一倍，性能也将提升一倍。也就是说，处理器（cpu）的性能每隔大约两年就会翻一倍。
距离摩尔定律被提出到现在，已经过去了 50 多年。如今，随着芯片组件的规模越来越接近单个原子的规模，要跟上摩尔定律的步伐变得越来越困难。
在 2019 年，英伟达 ceo 黄仁勋在 ecs 展会上说：“摩尔定律过去是每 5 年增长 10 倍，每 10 年增长 100 倍。而如今，摩尔定律每年只能增长几个百分点，每 10 年可能只有 2 倍。因此，摩尔定律结束了。”
单个处理器（cpu）的性能越来越接近瓶颈，想要突破这个瓶颈，则需要充分利用多线程技术，让单个或多个 cpu 可以同时执行多个线程，更快的完成计算机任务。
node 的多线程我们都知道，javascript 是单线程语言，nodejs 利用 javascript 的特性，使用事件驱动模型，实现了异步 i/o，而异步 i/o 的背后就是多线程调度。
node 异步 i/o 的实现可以参考朴灵的《深入浅出 node.js》在 go 语言中，可以通过创建 goroutine 来显式调用一条新线程，并且通过环境变量 gomaxprocs 来控制最大并发数。
在 node 中，没有 api 可以显式创建新线程的，node 实现了一些异步 i/o 的 api，例如 fs.readfile、http.request。这些异步 i/o 底层是调用了新线程执行异步任务，再利用事件驱动的模式来获取执行结果。
服务端开发、工具开发可能都会需要使用到多线程开发。比如使用多线程处理复杂的爬虫任务，用多线程来处理并发请求，使用多线程进行文件处理等等...
在我们使用多线程时，一定要控制最大同时并发数。因为不控制最大并发数，可能会导致文件描述符耗尽引发的错误，带宽不足引发的网络错误、端口限制引发的错误等等。
在 node 中并没有用于控制最大并发数的 api 或者环境变量，所以接下来，我们就用几行简单的代码来实现。
代码实现我们先假设下面的一个需求场景，我有一个爬虫，需要每天爬取 100 篇掘金的文章，如果一篇一篇爬取的话太慢，一次爬取 100 篇会因为网络连接数太多，导致很多请求直接失败。
那我们可以来实现一下，每次请求 10 篇，分 10 次完成。这样不仅可以把效率提升 10 倍，并且可以稳定运行。
下面来看看单个请求任务，代码实现如下：
const axios = require(axios);async function singlerequest(article_id) {  // 这里我们直接使用 axios 库进行请求  const reply = await axios.post(    https://api.juejin.cn/content_api/v1/article/detail,    {      article_id,    }  );  return reply.data;}
为了方便演示，这里我们 100 次请求的都是同一个地址，我们来创建 100 个请求任务，代码实现如下：
// 请求任务列表const requestfnlist = new array(100)  .fill(6909002738705629198)  .map((id) => () => singlerequest(id));
接下来，我们来实现并发请求的方法。这个方法支持同时执行多个异步任务，并且可以限制最大并发数。在任务池的一个任务执行完成后，新的异步任务会被推入继续执行，以保证任务池的高利用率。代码实现如下：
const chalk = require(chalk);const { log } = require(console);/** * 执行多个异步任务 * @param {*} fnlist 任务列表 * @param {*} max 最大并发数限制 * @param {*} taskname 任务名称 */async function concurrentrun(fnlist = [], max = 5, taskname = 未命名) {  if (!fnlist.length) return;  log(chalk.blue(`开始执行多个异步任务，最大并发数： ${max}`));  const replylist = []; // 收集任务执行结果  const count = fnlist.length; // 总任务数量  const starttime = new date().gettime(); // 记录任务执行开始时间  let current = 0;  // 任务执行程序  const schedule = async (index) => {    return new promise(async (resolve) => {      const fn = fnlist[index];      if (!fn) return resolve();      // 执行当前异步任务      const reply = await fn();      replylist[index] = reply;      log(`${taskname} 事务进度 ${((++current / count) * 100).tofixed(2)}% `);      // 执行完当前任务后，继续执行任务池的剩余任务      await schedule(index + max);      resolve();    });  };  // 任务池执行程序  const schedulelist = new array(max)    .fill(0)    .map((_, index) => schedule(index));  // 使用 promise.all 批量执行  const r = await promise.all(schedulelist);  const cost = (new date().gettime() - starttime) / 1000;  log(chalk.green(`执行完成，最大并发数： ${max}，耗时：${cost}s`));  return replylist;}
从上面的代码可以看出，使用 node 进行并发请求的关键就是 promise.all，promise.all 可以同时执行多个异步任务。
在上面的代码中，创建了一个长度为 max 最大并发数长度的数组，数组里放了对应数量的异步任务。然后使用 promise.all 同时执行这些异步任务，当单个异步任务执行完成时，会在任务池取出一个新的异步任务继续执行，完成了效率最大化。
接下来，我们用下面这段代码进行执行测试（代码实现如下）
(async () => {  const requestfnlist = new array(100)    .fill(6909002738705629198)    .map((id) => () => singlerequest(id));  const reply = await concurrentrun(requestfnlist, 10, 请求掘金文章);})();
最终执行结果如下图所示：
到这里，我们的并发请求就完成啦！接下来我们分别来测试一下不同并发的速度吧~ 首先是 1 个并发，也就是没有并发（如下图）
耗时 11.462 秒！当不使用并发时，任务耗时非常长，接下来我们看看在其他并发数的情况下耗时（如下图）
从上图可以看出，随着我们并发数的提高，任务执行速度越来越快！这就是高并发的优势，可以在某些情况下提升数倍乃至数十倍的效率！
我们仔细看看上面的耗时会发现，随着并发数的增加，耗时还是会有一个阈值，不能完全呈倍数增加。这是因为 node 实际上并没有为每一个任务开一个线程进行处理，而只是为异步 i/o 任务开启了新的线程。所以，node 比较适合处理 i/o 密集型任务，并不适合 cpu（计算）密集型任务。
到这里，我们的使用 node “多线程”处理高并发任务就介绍完了。如果想要程序完善一点的话，还需要考虑到任务超时时间、容错机制，大家感兴趣的可以自己实现一下。
更多编程相关知识，请访问：编程入门！！
以上就是node.js“多线程”如何处理高并发任务？的详细内容。

node.js“多线程”如何处理高并发任务？

推荐信息