Tag:

我如何处理JavaScript中的正则expression式边界的收缩

我有一个nodejs脚本读入一个文件并计算词频。 我目前每行都进入一个函数: function getWords(line) { return line.match(/\b\w+\b/g); } 这匹配几乎所有东西,除了它忽略了收缩 getWords("I'm") -> {"I", "m"} 然而,我不能只包括撇号,因为我想要匹配的撇号是字的边界: getWords("hey'there'") -> {"hey", "there"} 有没有一种方法来捕捉收缩,同时仍然把其他撇号作为单词边界?