小编neo*_*o33的帖子

如何在JavaScript中按值过滤字典?

我正在编写一个脚本来创建一个名为dict的字典,其中我存储了文本区域中某些单词的频率.我的数组看起来像这样:

var dict = removeArray.reduce(function(p,c) {
    if (p[c] === undefined) {
        p[c] = 1;
    } else {
        p[c]++;
    }
    return p;
}, {});
Run Code Online (Sandbox Code Playgroud)

我想根据它们的值过滤这个字典的元素.我需要创建一个列表,其中包含值大于1的单词.我的字典看起来像这样:

{
    "92173": 6,
    "C": 6,
    "GJHGWO.NAYE": 1,
    "GJHGX4.NAYE": 1,
    "GJHGX6.NAYE": 1,
    "GJHGX8.NAYE": 1,
    "GJHGXA.NAYE": 1,
    "GJHGXC.NAYE": 1,
    "RBD": 10,
    "RBD3": 2,
    "SAMBORNSiPOSSSTHRa": 2,
    "SAMBORNSiPOSSSTHRa1": 2,
    "SAMBORNSiPOSSSTHRa2": 2,
    "X": 4,
    "X3": 2
}
Run Code Online (Sandbox Code Playgroud)

为了实现我尝试使用lodash,如下:

var filtered = _.find(dict, function(user) {
    return user.frecuency > 1;
});
Run Code Online (Sandbox Code Playgroud)

但是自从我得到以后我失败了:

undefined
Run Code Online (Sandbox Code Playgroud)

我不知道如何适当地使用lodash来过滤这个数组.

我的完整代码如下所示:

var splitWords = document.getElementById("texto").value.split(/[["\|~]/);
var removeArray …
Run Code Online (Sandbox Code Playgroud)

html javascript lodash

13
推荐指数
1
解决办法
1万
查看次数

如何设置列的固定宽度?

大家好我正在创建一个关于latex的表我的代码如下所示:

\begin{table}[H]
\centering
\caption{caption}
\label{my-label}
\begin{tabular}{lll}
\hline
\multicolumn{3}{|c|}{\cellcolor[HTML]{34CDF9}{\color[HTML]{000000} Matriz confusión  Genero.}} \\ \hline
\multicolumn{1}{|l|}{}        & \multicolumn{1}{l|}{M}       & \multicolumn{1}{l|}{F}        \\ \hline        
\multicolumn{1}{|l|}{M}        & \multicolumn{1}{l|}{43}       & \multicolumn{1}{l|}{7}        \\ \hline
\multicolumn{1}{|l|}{F}        & \multicolumn{1}{l|}{11}       & \multicolumn{1}{l|}{39}       \\ \hline
\end{tabular}
\end{table}
Run Code Online (Sandbox Code Playgroud)

它运行良好,但问题出现在我尝试修复我尝试的列的宽度时:

\begin{tabular}{l{2cm}|l{2cm}|l{2cm}}
Run Code Online (Sandbox Code Playgroud)

结果是相同的表,具有可变长度的列,我想修复列的长度,我想欣赏任何解决此问题的建议.

latex

9
推荐指数
1
解决办法
4万
查看次数

如何使用 sed 替换字符串中的多个字符?

我想用 sed 替换字符串的一些字符。

我尝试了以下两种方法,但我需要知道是否有更优雅的形式来获得相同的结果,而不使用管道或-e选项:

sed 's#a#A#g' test.txt | sed 's#l#23#g' > test2.txt
sed -e 's#a#A#g' -e 's#l#23#g' test.txt > test2.txt
Run Code Online (Sandbox Code Playgroud)

linux sed

7
推荐指数
2
解决办法
1万
查看次数

sklearn 如何计算 precision_score 指标?

您好,我正在使用 sklearn,为了更好地理解指标,我遵循了以下 precision_score 示例:

from sklearn.metrics import precision_score
    y_true = [0, 1, 2, 0, 1, 2]

    y_pred = [0, 2, 1, 0, 0, 1]
    print(precision_score(y_true, y_pred, average='macro'))  
Run Code Online (Sandbox Code Playgroud)

我得到的结果如下:

0.222222222222
Run Code Online (Sandbox Code Playgroud)

我了解 sklearn 按照以下步骤计算该结果:

  • 标签 0 的精度是 tp / (tp + fp) = 2 / (2 + 1) = 0.66
  • 标签 1 的精度为 0 / (0 + 2) = 0
  • 标签 2 的精度为 0 / (0 + 1) = 0

最后 sklearn 计算所有三个标签的平均精度: precision = (0.66 + 0 + 0) / 3 …

scikit-learn

6
推荐指数
1
解决办法
6873
查看次数

如何从下面的向量中获得具有最高值的5个元组?

我正在使用gensim进行实验.我正在使用lda模型来获得一个概率向量,如下所示:

[(0, 0.01666666666666804), (1, 0.01666666666666982), (2, 0.01666666666667857), 
 (3, 0.016666666666667104), (4, 0.016666666666668519), (5, 0.01666666666666838), 
 (6, 0.016666666666681464), (7, 0.016666666666669494), (8, 0.016666666666669269), 
 (9, 0.016666666666667069), (10, 0.016666666668398125), (11, 0.016666666666666666), 
 (12, 0.51666666666481131), (13, 0.01666666666668485), (14, 0.01666666666666948), 
 (15, 0.016666666666667097), (16, 0.016666666666666666), (17, 0.016666666666666767), 
 (18, 0.016666666666667922), (19, 0.016666666666678695), (20, 0.016666666666667683), 
 (21, 0.016666666666677307), (22, 0.016666666666669522), (23, 0.016666666666675913), 
 (24, 0.016666666666670923), (25, 0.016666666666667409), (26, 0.016666666666680405), 
 (27, 0.016666666666666666), (28, 0.0166666666666705), (29, 0.016666666666668353)]
Run Code Online (Sandbox Code Playgroud)

它是由元组组成的列表,元组的第一个组成部分是主题,第二个是概率:

(topic, probability)
Run Code Online (Sandbox Code Playgroud)

我想在元组列表中获得具有最高概率的5个主题,如下所示:

max = [(topicN, probability),...]
Run Code Online (Sandbox Code Playgroud)

我尝试首先将这个元组转换为numpy结构,如下所示:

vector = lda[ques_vec]
print(vector)
types = numpy.dtype('int,float')
data = numpy.array(vector,dtype=types) …
Run Code Online (Sandbox Code Playgroud)

python numpy

4
推荐指数
1
解决办法
125
查看次数

如何避免在此bash函数中使用"for"循环?

我正在创建这个函数,在文件的每一行上创建多个grep.我运行如下:

cat file.txt | agrep string1 string2 ... stringN 

function agrep () {  
   for a in $@;  do
     cmd+=" | grep '$a'";
   done ;
   while read line ; do
     eval "echo "\'"$line"\'" $cmd";
   done;
}
Run Code Online (Sandbox Code Playgroud)

我们的想法是打印包含所有字符串的每一行:string1,string2,..., stringN.这已经有效,但我想避免使用for构造表达式:

| grep string1 | grep string2 ... | stringN
Run Code Online (Sandbox Code Playgroud)

如果可能,也可以使用eval.我尝试进行如下扩展:

echo "| grep $"{1..3}
Run Code Online (Sandbox Code Playgroud)

我得到:

| grep $1 | grep $2 | grep $3
Run Code Online (Sandbox Code Playgroud)

这几乎是我想要的,但问题是,当我尝试:

echo "| grep $"{1..$#}
Run Code Online (Sandbox Code Playgroud)

由于bash不能扩展,{1..$#}因此不会发生扩展$#.它只适用于数字.我想构建一些有效的扩展,以避免 …

bash

3
推荐指数
1
解决办法
99
查看次数

sklearn如何逐步计算准确性得分?

我在阅读有关sklearn中使用的指标的信息,但发现以下内容非常令人困惑:

在此处输入图片说明

sklearn在文档中提供了其用法示例,如下所示:

import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
accuracy_score(y_true, y_pred)
0.5
Run Code Online (Sandbox Code Playgroud)

我了解sklearns会按以下方式计算该指标:

在此处输入图片说明

我不确定过程,我想感谢有人自从我研究以来就可以逐步解释这个结果,但是我很难理解。为了理解更多,我尝试了以下情况:

import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3,0]
y_true = [0, 1, 2, 3,0]
print(accuracy_score(y_true, y_pred))
0.6
Run Code Online (Sandbox Code Playgroud)

我认为正确的计算如下:

在此处输入图片说明

但是我不确定,我想看看是否有人可以支持我的计算,而不是复制并粘贴sklearn的文档。

我如果怀疑在sumatory是一样的括号里面的公式,它是我不清楚,我不知道元素在sumatory的数量与刚元素的数量在样本中是否还取决于类的数量。

scikit-learn

2
推荐指数
2
解决办法
6238
查看次数

如何对分类数据进行矢量化

我想对一些分类数据进行矢量化以构建训练和测试矩阵.

我有85个城市,我想得到一个282520行的矩阵,每行都是一个矢量

[1 0 0 ..., 0 0 0]
Run Code Online (Sandbox Code Playgroud)

我希望每行有一个向量,其中1或0取决于城市,因此每个城市应该是一列:

print(df['city'])
Run Code Online (Sandbox Code Playgroud)
0         METROPOLITANA DE SANTIAGO
1         METROPOLITANA DE SANTIAGO
2         METROPOLITANA DE SANTIAGO
3         METROPOLITANA DE SANTIAGO
4                          COQUIMBO
5                          SANTIAGO
6                          SANTIAGO
7         METROPOLITANA DE SANTIAGO
8         METROPOLITANA DE SANTIAGO
9         METROPOLITANA DE SANTIAGO
10                          BIO BIO
11                         COQUIMBO
...                             ...
282520    METROPOLITANA DE SANTIAGO
Name: city, dtype: object
Run Code Online (Sandbox Code Playgroud)

这是我试过的:

from sklearn import preprocessing

list_city = getList(df,'city')
le = preprocessing.LabelEncoder()
le.fit(list_city)

print(le.transform(['AISEN'])) 
print(le.transform(['TARAPACA']))
print(le.transform(['AISEN DEL GENERAL CARLOS IBANEZ DEL …
Run Code Online (Sandbox Code Playgroud)

python scikit-learn sklearn-pandas

2
推荐指数
1
解决办法
1408
查看次数

如何使用perl获取以下子串?

您好我正在使用perl脚本,我有以下变量:

   $string1="ZZ:DPHTEST1ZZ";
Run Code Online (Sandbox Code Playgroud)

我想通过使用":"作为分隔符从$ string1获取子字符串来构建另外两个变量,我想在我的脚本中添加两个打印输出:

print $fragment1;
print $fragment2;  
Run Code Online (Sandbox Code Playgroud)

获得以下输出:

ZZ
DPHTEST1ZZ
Run Code Online (Sandbox Code Playgroud)

我尝试过:

$fragment1 =  substr $string1, index($string1, ':');
print $fragment1;
Run Code Online (Sandbox Code Playgroud)

但我得到了:

:DPHTEST1ZZ
Run Code Online (Sandbox Code Playgroud)

因此,我想通过使用分隔符得到这个字符串,我正在研究一点,我刚刚找到使用该位置的perl方法,感谢支持,

perl

0
推荐指数
1
解决办法
60
查看次数

如何在bash中转义双引号?

我想在 bash 中转义双引号,我遵循了以下方法:

#!/bin/bash
this is a  \"number\"!
Run Code Online (Sandbox Code Playgroud)

但我需要知道是否有另一种方式。

bash

-1
推荐指数
2
解决办法
9539
查看次数

标签 统计

scikit-learn ×3

bash ×2

python ×2

html ×1

javascript ×1

latex ×1

linux ×1

lodash ×1

numpy ×1

perl ×1

sed ×1

sklearn-pandas ×1