Tag: 文本分析

如何在文本中匹配关键字/短语？: 我有… 一个固定的大集（约100万）关键词和短语，如birthday ， happy new year ， vacation等。一些10至500字的variables文本。我想… 确定文本中出现的关键字/短语（例如， Hi John, happy birthday to you. birthday Hi John, happy birthday to you. birthday ），最好是关于相等数目的一些信息容忍语法变化（ vacations应该与vacation匹配， countries应该匹配country ）或者“拼写错误”（ nodejs == node.js ）。本质上类似于谷歌search（但他们可能使用更复杂的方法）或Stackoverflow的标签匹配/search答案。基本上用户input一些文本，我的程序应该尽量build议相关的关键字。在我的情况下，该algorithm需要大部分操作英文文本，但也应该适用于其他语言，如德语，意大利语，法语，西class牙语，… 是否有一些Linux / NodeJS库可以做到这一点？或者至less有一个众所周知的algorithm？

Interesting Posts

Node.js断言库与其他断言库

将angularjs应用程序从Windows移动到Ubuntu

Angular.js / D3.js / Node.js之间有什么区别和相似点

服务器端使用threeJS进行渲染

在Heroku和Node.js上扩展websockets

运行两个MongoDB实例

要求“d3-select-multi”作为节点模块不工作

Passportjs Facebookloginstream程（passport-facebook vs passport-token）

我应该添加yarn-error.log到我的.gitignore文件吗？

节点代理和asynchronous数据库调用

mongoose – MissingSchema错误的人口

我应该caching数据在我的服务器还是只依靠MongoDB

Node.JS POST请求input数组

不能使用基于mongo的会话存储

是否有可能在nodejs中创build一个自定义的http请求方法