Tag: Unicode

Node.JS刮编码?

我使用Node.JS中的 这个请求库来获取这个页面 ,并使用cheerioparsing正文。 在parsing的响应正文上调用$.html()发现页面的title属性是: <title>Le Relais de l'Entrec?te</title> …当它应该是: <title>Le Relais de l'Entrecôte</title> 我已经尝试设置请求库的选项,包括encoding: 'utf8' ,但似乎没有改变任何东西。 我如何保留这些字符?

Chrome✗和Firefox中的ES6 / Unicode正则expression式中的逻辑或序列✓

考虑下面的Unicode重正则expression式(表情符号代表非ASCII和额外的BMP字符): '🍤🍦🍋🍋🍦🍤'.match(/🍤|🍦|🍋/ug) Firefox返回[ "🍤", "🍦", "🍋", "🍋", "🍦", "🍤" ] 🤗。 Chrome 52.0.2743.116和节点6.4.0都返回null ! 如果我把string放在一个variables中,并且执行str.match(…) ,也不关心我是否通过new RegExp('🍤|🍦|🍋', 'gu')一个RegExp对象。 (Chrome可以用ORing 两个序列来确定: '🍤🍦🍋🍋🍦🍤'.match(/🍤|🍦/ug)可以,非Unicode也可以: 'aakkzzkkaa'.match(/aa|kk|zz/ug)作品。) 难道我做错了什么? 这是一个Chrome的错误? ECMAScript兼容性表格说,我应该与Unicode正则expression式确定。 (PS:在这个例子中使用的三个表情符号就是stand-ins,在我的应用程序中,它们是任意的但是不同的string,但是我想知道'🍤🍦🍋🍋🍦🍤'.match(/[🍤🍦🍋]/ug)在Chrome中工作是相关的?)