如何debugging一个NodeJS阻塞的事件循环?

我们有一个运行在生产环境中的NodeJS / Express服务器,有时候所有的请求都被阻塞了。 networking请求正在接收,但没有处理(他们最终全部超时)。 几分钟后,它会再次接受请求,但几乎立即像以前一样开始阻塞。

我们一直试图在本地重现此问题,但无法重现并确定原因。 我的猜测是,事件循环被阻塞的时间太长,无法完成,或者根本不完成。

是否有任何方法来debugging现场制作系统,并找出是什么原因导致该块? 我search了,但只能find本地发展的解决scheme。 我最好的解决scheme是回顾日志,查看最后一个没有阻塞的请求(在开始阻塞之前),并debugging它?

使用Node 6.2.2,Express 4.13.4,并在Heroku上运行。