Tag: 机器学习

用nlp从句子中挑出主语+形容词对: python或node.js中是否有可以提取主题和形容词的包？例如，使用这句话： “不像橘子，苹果不多汁，但确实有紧缩感。” 我希望能够按照以下方式提取一些内容： { orange: 'juicy', apple: 'crunchy' } 这个function是否已经在任何nlp库中可用，或者我可以以某种方式训练分类器？ thx为build议栈向导。

突触/ Neataptic简单的NEAT XOR解决scheme: 编辑：我设法在一起简单的例子几个https://github.com/developer239/neural-network-playground 任何人都可以帮助我简单整洁的例子教网如何解决异或其他类似的问题？但是使用NEAT技术，我不需要指定训练数据集？使用javascript： https ： //github.com/cazala/synaptic或https://github.com/wagenaartje/netaptic 1. Initialize network 2. Generate generation 3. Go through each genome in generation and evaluate its fitness (how good it is) 4. Take 2 best genomes from generation 5. Merge genomes 50 / 50 at random 6. Mutate final genome 7. Generate second generation 这将是非常有益的。同样的技巧在这里被使用： https://github.com/ivanseidel/IAMDinosaur 我经历了源代码，但有很多事情正在进行。 […]

通过键下划线聚集哈希: 我在机器学习应用程序上工作。当我需要使用数组和哈希运算时，我使用underscorejs。问题在于，ML中有一个交叉validation的方法，当你需要计算性能的几倍。对于每一个折叠，我有一个哈希的性能参数，如下所示 { 'F1': 0.8, 'Precision': 0.7, 'Recall':0.9 } 我把所有的哈希都推送到数组中，最后我有一组哈希，就像下面这样 [ { 'F1': 0.8, 'Precision': 0.7, 'Recall':0.9 }, { 'F1': 0.5, 'Precision': 0.6, 'Recall':0.4 }, { 'F1': 0.4, 'Precision': 0.3, 'Recall':0.4 } ] 问题是，最后我想计算散列的每个参数的平均值，即我想根据参数对所有散列进行总结，然后将每个参数除以折叠的数量，在我的情况3中。如果有任何优雅的方式来做下划线和JavaScript？一个重要的一点是有时候我需要做这个聚合，当这样的哈希像下面这样折叠 { label1:{ 'F1': 0.8, 'Precision': 0.7, 'Recall':0.9 }, label2:{ 'F1': 0.8, 'Precision': 0.7, 'Recall':0.9 }, … } […]

如何将机器学习分类器连接到Web应用程序？: 我试图build立一个情感分类器的networking应用程序，但我不明白是谁连接到机器学习组件与networking应用程序。我已经构build了在NodeJS服务器上运行的客户端Web应用程序，并且已经培训了一个保存为Python脚本的情感分类器。我的目标是让用户在Web应用程序上提交文本，将其发送到Python脚本，分类并通过JSON发回结果。我应该如何设置机器学习-Web应用程序pipe道？一个build议是在Flask中加载Python脚本，并使用Flask作为REST API。看起来好像使用Flask会过度杀伤，因为我只需要执行一项任务。

testing统计方法: 我为应用程序编写了很多统计方法。问题是我不知道如何适当地testing它。例如，在unit testing中，我检查所有分布概率的总和是否收敛到1，但不是1。例如，所有概率的总和可能是0.9999999甚至1.0000000005，实际值如果强烈取决于分布有多less不同的结果。也许我可以这样testing value should be less that 1.1 value should be more that 0.9 但我不确定这个testing是否一致，也许有一个分布，由于数值计算会输出1.1 如何正确testing。