Tag: 分类

iab分类API响应顺序https://iab.taxonome.org: 我正在发送一系列文本，通过https://iab.taxonome.org分类API进行分类，但由于我以适当的asynchronous方式在节点JS环境中工作，所以响应与请求不同步。我可以使用recorsive调用，但这可能会溢出我的堆栈。任何想法如何与分类响应同步呼叫？

数据集Node.js中的最近邻居: 我有一个将数据保存到MongoDB的Node.js应用程序。给定一个文件，我想在数据库中find最相似的文件。我的想法是实现某种最近邻algorithm，将所有logging作为训练序列，并返回最相似的文档（包括这两个文档相似程度的某种百分比）。例如在我的数据库中有这些logging… { name: "Bill", age: 10, pc: "Mac", ip: "68.23.13.8" } { name: "Alice", age: 22, pc: "Windows", ip: "193.186.11.3" } { name: "Bob", age: 12, pc: "Windows", ip: "56.89.22.1" } …我想find最接近这个文件的文件 { name: "Tom", age: 10, pc: "Mac", ip: "68.23.13.10" } // algorithm returns "Bill", .76 是否有任何节点模块/实现采取任何forms的对象/参数，并返回最近的邻居？

在node.js上训练分类器（自然 – NLP），用于意外的句子: 一些上下文：Node.js，Bot，自然模块。我想build立一个Bot，我正在使用自然模块来parsing和整体分类用户input。 var classifier = new natural.BayesClassifier(); classifier.addDocument('Hi', 'welcome'); classifier.addDocument('Hello', 'welcome'); classifier.addDocument('Hey', 'welcome'); classifier.addDocument('Good', 'welcome'); … //back to home classifier.addDocument('go back to home', 'back2home'); classifier.addDocument('go back home', 'back2home'); classifier.addDocument('return', 'back2home'); classifier.addDocument('return to home', 'back2home'); … classifier.train(); … classifier.classify(text); 那些testing工作正常： "I would like to go back home" => back2home "Hi" => welcome 一切都很好，但如果用户文本包含诸如“bla bla […]

如何提高nodejs-multilabel SVM分类器的精度？: 这是我们的代码。分类器一直是错误的分类。我们需要对数字数据进行分类。请让我们知道如何提高其准确性或如果我们错过了什么。 var multilabel = require('multilabelsvm'); var actionClassifier = new multilabel.Classifier({kernel:'linear'}); var jsonObject=new Object(); var jsonObject = require("/home/Desktop/Final/data.json"); var trainSet=[]; for(var i=0;i<3;i++){ trainSet[i] = { input:jsonObject.users[i].cap_dim1,output:jsonObject.users[i].username }; } console.log(trainSet); actionClassifier.trainBatch(trainSet); var json = actionClassifier.toJSON() var newActionClassifier = new multilabel.Classifier(); console.log('———-SVM Classifier—-'); //importing newActionClassifier.fromJSON(json); console.log(newActionClassifier.classify(captchadim));

在sorting时stream式传输大数据: 我有大量的数据，因此我不能把它全部放在内存中，而且总是出现内存不足的错误。显然其中一个解决scheme将使用Node.JS中的stream; 但是stream式传输是不可能的（就我所知），sorting是我应用于数据的function之一。是否有任何algorithm可能分而治之algorithm，我可以使用stream和sorting的组合（这是我的function之一，我的数据？）

比较Mongoose查询中的ObjectID: 我正在尝试更新扩展的Mongo数据库中的每个文档。我的计划是从最年轻，最近创build的文档开始，然后从这里开始，一个一个地查询下一个最早的文档。问题是我的Mongoose查询正在跳过同一秒内创build的文档。我认为大于/小于运营商将在同一秒生成_ids工作。但是现在数据库中有150个文件，这个函数只有8个循环，从最小的文件到最老的文件。这是我在recursion节点循环中的Mongoose查询： function loopThroughDatabase(i, doc, sizeOfDatabase){ if (i < sizeOfDatabase) { (function(){ myMongooseCollection.model(false) .find() .where("_id") .lt(doc._id) .sort("id") .limit(1) .exec(function(err, docs) { if (err) { console.log(err); } else { updateDocAndSaveToDatabase(docs[0]); loopThroughDatabase(i + 1, docs[0], sizeOfDatabase); //recursion here } }); })(); } } loopThroughDatabase(1, youngestDoc, sizeOfDatabase);