检测使用nodejs的响应主体编码
我正在用jsdom和jQuery写一个蜘蛛,就像这个例子
只有一个问题:当网页不是UTF-8编码,响应头的内容types不告诉我的字符集,如何检测响应体的编码?
我知道节点iconv可以帮助,但问题是我需要先了解编码
(奖金问题:Web浏览器如何自动检测网页的编码?)
npm安装node-ice-charset-detector
我正在用jsdom和jQuery写一个蜘蛛,就像这个例子
只有一个问题:当网页不是UTF-8编码,响应头的内容types不告诉我的字符集,如何检测响应体的编码?
我知道节点iconv可以帮助,但问题是我需要先了解编码
(奖金问题:Web浏览器如何自动检测网页的编码?)
npm安装node-ice-charset-detector