Tag: 分类

iab分类API响应顺序https://iab.taxonome.org

我正在发送一系列文本,通过https://iab.taxonome.org分类API进行分类,但由于我以适当的asynchronous方式在节点JS环境中工作,所以响应与请求不同步。 我可以使用recorsive调用,但这可能会溢出我的堆栈。 任何想法如何与分类响应同步呼叫?

数据集Node.js中的最近邻居

我有一个将数据保存到MongoDB的Node.js应用程序。 给定一个文件,我想在数据库中find最相似的文件。 我的想法是实现某种最近邻algorithm,将所有logging作为训练序列,并返回最相似的文档(包括这两个文档相似程度的某种百分比)。 例如在我的数据库中有这些logging… { name: "Bill", age: 10, pc: "Mac", ip: "68.23.13.8" } { name: "Alice", age: 22, pc: "Windows", ip: "193.186.11.3" } { name: "Bob", age: 12, pc: "Windows", ip: "56.89.22.1" } …我想find最接近这个文件的文件 { name: "Tom", age: 10, pc: "Mac", ip: "68.23.13.10" } // algorithm returns "Bill", .76 是否有任何节点模块/实现采取任何forms的对象/参数,并返回最近的邻居?

在node.js上训练分类器(自然 – NLP),用于意外的句子

一些上下文:Node.js,Bot, 自然模块 。 我想build立一个Bot,我正在使用自然模块来parsing和整体分类用户input。 var classifier = new natural.BayesClassifier(); classifier.addDocument('Hi', 'welcome'); classifier.addDocument('Hello', 'welcome'); classifier.addDocument('Hey', 'welcome'); classifier.addDocument('Good', 'welcome'); … //back to home classifier.addDocument('go back to home', 'back2home'); classifier.addDocument('go back home', 'back2home'); classifier.addDocument('return', 'back2home'); classifier.addDocument('return to home', 'back2home'); … classifier.train(); … classifier.classify(text); 那些testing工作正常: "I would like to go back home" => back2home "Hi" => welcome 一切都很好,但如果用户文本包含诸如“bla bla […]

如何提高nodejs-multilabel SVM分类器的精度?

这是我们的代码。 分类器一直是错误的分类。 我们需要对数字数据进行分类。 请让我们知道如何提高其准确性或如果我们错过了什么。 var multilabel = require('multilabelsvm'); var actionClassifier = new multilabel.Classifier({kernel:'linear'}); var jsonObject=new Object(); var jsonObject = require("/home/Desktop/Final/data.json"); var trainSet=[]; for(var i=0;i<3;i++){ trainSet[i] = { input:jsonObject.users[i].cap_dim1,output:jsonObject.users[i].username }; } console.log(trainSet); actionClassifier.trainBatch(trainSet); var json = actionClassifier.toJSON() var newActionClassifier = new multilabel.Classifier(); console.log('———-SVM Classifier—-'); //importing newActionClassifier.fromJSON(json); console.log(newActionClassifier.classify(captchadim));

在sorting时stream式传输大数据

我有大量的数据,因此我不能把它全部放在内存中,而且总是出现内存不足的错误。 显然其中一个解决scheme将使用Node.JS中的stream; 但是stream式传输是不可能的(就我所知),sorting是我应用于数据的function之一。 是否有任何algorithm可能分而治之algorithm,我可以使用stream和sorting的组合(这是我的function之一,我的数据?)

比较Mongoose查询中的ObjectID

我正在尝试更新扩展的Mongo数据库中的每个文档。 我的计划是从最年轻,最近创build的文档开始,然后从这里开始,一个一个地查询下一个最早的文档。 问题是我的Mongoose查询正在跳过同一秒内创build的文档。 我认为大于/小于运营商将在同一秒生成_ids工作。 但是现在数据库中有150个文件,这个函数只有8个循环,从最小的文件到最老的文件。 这是我在recursion节点循环中的Mongoose查询: function loopThroughDatabase(i, doc, sizeOfDatabase){ if (i < sizeOfDatabase) { (function(){ myMongooseCollection.model(false) .find() .where("_id") .lt(doc._id) .sort("id") .limit(1) .exec(function(err, docs) { if (err) { console.log(err); } else { updateDocAndSaveToDatabase(docs[0]); loopThroughDatabase(i + 1, docs[0], sizeOfDatabase); //recursion here } }); })(); } } loopThroughDatabase(1, youngestDoc, sizeOfDatabase);