小编neo*_*o33的帖子

如何在JavaScript中按值过滤字典？

我正在编写一个脚本来创建一个名为dict的字典,其中我存储了文本区域中某些单词的频率.我的数组看起来像这样:

var dict = removeArray.reduce(function(p,c) {
    if (p[c] === undefined) {
        p[c] = 1;
    } else {
        p[c]++;
    }
    return p;
}, {});

Run Code Online (Sandbox Code Playgroud)

我想根据它们的值过滤这个字典的元素.我需要创建一个列表,其中包含值大于1的单词.我的字典看起来像这样:

{
    "92173": 6,
    "C": 6,
    "GJHGWO.NAYE": 1,
    "GJHGX4.NAYE": 1,
    "GJHGX6.NAYE": 1,
    "GJHGX8.NAYE": 1,
    "GJHGXA.NAYE": 1,
    "GJHGXC.NAYE": 1,
    "RBD": 10,
    "RBD3": 2,
    "SAMBORNSiPOSSSTHRa": 2,
    "SAMBORNSiPOSSSTHRa1": 2,
    "SAMBORNSiPOSSSTHRa2": 2,
    "X": 4,
    "X3": 2
}

Run Code Online (Sandbox Code Playgroud)

为了实现我尝试使用lodash,如下:

var filtered = _.find(dict, function(user) {
    return user.frecuency > 1;
});

Run Code Online (Sandbox Code Playgroud)

但是自从我得到以后我失败了:

undefined

Run Code Online (Sandbox Code Playgroud)

我不知道如何适当地使用lodash来过滤这个数组.

我的完整代码如下所示:

var splitWords = document.getElementById("texto").value.split(/[["\|~]/);
var removeArray …

Run Code Online (Sandbox Code Playgroud)

html javascript lodash

neo*_*o33

2017 06-03

13
推荐指数

1
解决办法

1万
查看次数

如何设置列的固定宽度？

大家好我正在创建一个关于latex的表我的代码如下所示:

\begin{table}[H]
\centering
\caption{caption}
\label{my-label}
\begin{tabular}{lll}
\hline
\multicolumn{3}{|c|}{\cellcolor[HTML]{34CDF9}{\color[HTML]{000000} Matriz confusión  Genero.}} \\ \hline
\multicolumn{1}{|l|}{}        & \multicolumn{1}{l|}{M}       & \multicolumn{1}{l|}{F}        \\ \hline        
\multicolumn{1}{|l|}{M}        & \multicolumn{1}{l|}{43}       & \multicolumn{1}{l|}{7}        \\ \hline
\multicolumn{1}{|l|}{F}        & \multicolumn{1}{l|}{11}       & \multicolumn{1}{l|}{39}       \\ \hline
\end{tabular}
\end{table}

Run Code Online (Sandbox Code Playgroud)

它运行良好,但问题出现在我尝试修复我尝试的列的宽度时:

\begin{tabular}{l{2cm}|l{2cm}|l{2cm}}

Run Code Online (Sandbox Code Playgroud)

结果是相同的表,具有可变长度的列,我想修复列的长度,我想欣赏任何解决此问题的建议.

latex

neo*_*o33

2016 05-24

9
推荐指数

1
解决办法

4万
查看次数

如何使用 sed 替换字符串中的多个字符？

我想用 sed 替换字符串的一些字符。

我尝试了以下两种方法，但我需要知道是否有更优雅的形式来获得相同的结果，而不使用管道或-e选项：

sed 's#a#A#g' test.txt | sed 's#l#23#g' > test2.txt
sed -e 's#a#A#g' -e 's#l#23#g' test.txt > test2.txt

Run Code Online (Sandbox Code Playgroud)

linux sed

neo*_*o33

2016 02-25

7
推荐指数

2
解决办法

1万
查看次数

sklearn 如何计算 precision_score 指标？

您好，我正在使用 sklearn，为了更好地理解指标，我遵循了以下 precision_score 示例：

from sklearn.metrics import precision_score
    y_true = [0, 1, 2, 0, 1, 2]

    y_pred = [0, 2, 1, 0, 0, 1]
    print(precision_score(y_true, y_pred, average='macro'))

Run Code Online (Sandbox Code Playgroud)

我得到的结果如下：

0.222222222222

Run Code Online (Sandbox Code Playgroud)

我了解 sklearn 按照以下步骤计算该结果：

标签 0 的精度是 tp / (tp + fp) = 2 / (2 + 1) = 0.66
标签 1 的精度为 0 / (0 + 2) = 0
标签 2 的精度为 0 / (0 + 1) = 0

最后 sklearn 计算所有三个标签的平均精度： precision = (0.66 + 0 + 0) / 3 …

scikit-learn

neo*_*o33

lucky-day

6
推荐指数

1
解决办法

6873
查看次数

如何从下面的向量中获得具有最高值的5个元组？

我正在使用gensim进行实验.我正在使用lda模型来获得一个概率向量,如下所示:

[(0, 0.01666666666666804), (1, 0.01666666666666982), (2, 0.01666666666667857), 
 (3, 0.016666666666667104), (4, 0.016666666666668519), (5, 0.01666666666666838), 
 (6, 0.016666666666681464), (7, 0.016666666666669494), (8, 0.016666666666669269), 
 (9, 0.016666666666667069), (10, 0.016666666668398125), (11, 0.016666666666666666), 
 (12, 0.51666666666481131), (13, 0.01666666666668485), (14, 0.01666666666666948), 
 (15, 0.016666666666667097), (16, 0.016666666666666666), (17, 0.016666666666666767), 
 (18, 0.016666666666667922), (19, 0.016666666666678695), (20, 0.016666666666667683), 
 (21, 0.016666666666677307), (22, 0.016666666666669522), (23, 0.016666666666675913), 
 (24, 0.016666666666670923), (25, 0.016666666666667409), (26, 0.016666666666680405), 
 (27, 0.016666666666666666), (28, 0.0166666666666705), (29, 0.016666666666668353)]

Run Code Online (Sandbox Code Playgroud)

它是由元组组成的列表,元组的第一个组成部分是主题,第二个是概率:

(topic, probability)

Run Code Online (Sandbox Code Playgroud)

我想在元组列表中获得具有最高概率的5个主题,如下所示:

max = [(topicN, probability),...]

Run Code Online (Sandbox Code Playgroud)

我尝试首先将这个元组转换为numpy结构,如下所示:

vector = lda[ques_vec]
print(vector)
types = numpy.dtype('int,float')
data = numpy.array(vector,dtype=types) …

Run Code Online (Sandbox Code Playgroud)

python numpy

neo*_*o33

2017 01-16

4
推荐指数

1
解决办法

125
查看次数

如何避免在此bash函数中使用"for"循环？

我正在创建这个函数,在文件的每一行上创建多个grep.我运行如下:

cat file.txt | agrep string1 string2 ... stringN 

function agrep () {  
   for a in $@;  do
     cmd+=" | grep '$a'";
   done ;
   while read line ; do
     eval "echo "\'"$line"\'" $cmd";
   done;
}

Run Code Online (Sandbox Code Playgroud)

我们的想法是打印包含所有字符串的每一行:string1,string2,..., stringN.这已经有效,但我想避免使用for构造表达式:

| grep string1 | grep string2 ... | stringN

Run Code Online (Sandbox Code Playgroud)

如果可能,也可以使用eval.我尝试进行如下扩展:

echo "| grep $"{1..3}

Run Code Online (Sandbox Code Playgroud)

我得到:

| grep $1 | grep $2 | grep $3

Run Code Online (Sandbox Code Playgroud)

这几乎是我想要的,但问题是,当我尝试:

echo "| grep $"{1..$#}

Run Code Online (Sandbox Code Playgroud)

由于bash不能扩展,{1..$#}因此不会发生扩展$#.它只适用于数字.我想构建一些有效的扩展,以避免 …

bash

neo*_*o33

2016 04-03

3
推荐指数

1
解决办法

99
查看次数

sklearn如何逐步计算准确性得分？

我在阅读有关sklearn中使用的指标的信息，但发现以下内容非常令人困惑：

sklearn在文档中提供了其用法示例，如下所示：

import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
accuracy_score(y_true, y_pred)
0.5

Run Code Online (Sandbox Code Playgroud)

我了解sklearns会按以下方式计算该指标：

我不确定过程，我想感谢有人自从我研究以来就可以逐步解释这个结果，但是我很难理解。为了理解更多，我尝试了以下情况：

import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3,0]
y_true = [0, 1, 2, 3,0]
print(accuracy_score(y_true, y_pred))
0.6

Run Code Online (Sandbox Code Playgroud)

我认为正确的计算如下：

但是我不确定，我想看看是否有人可以支持我的计算，而不是复制并粘贴sklearn的文档。

我如果怀疑我在sumatory是一样的我括号里面的公式，它是我不清楚，我不知道元素在sumatory的数量与刚元素的数量在样本中是否还取决于类的数量。

scikit-learn

neo*_*o33

2016 06-07

2
推荐指数

2
解决办法

6238
查看次数

如何对分类数据进行矢量化

我想对一些分类数据进行矢量化以构建训练和测试矩阵.

我有85个城市,我想得到一个282520行的矩阵,每行都是一个矢量

[1 0 0 ..., 0 0 0]

Run Code Online (Sandbox Code Playgroud)

我希望每行有一个向量,其中1或0取决于城市,因此每个城市应该是一列:

print(df['city'])

Run Code Online (Sandbox Code Playgroud)

0         METROPOLITANA DE SANTIAGO
1         METROPOLITANA DE SANTIAGO
2         METROPOLITANA DE SANTIAGO
3         METROPOLITANA DE SANTIAGO
4                          COQUIMBO
5                          SANTIAGO
6                          SANTIAGO
7         METROPOLITANA DE SANTIAGO
8         METROPOLITANA DE SANTIAGO
9         METROPOLITANA DE SANTIAGO
10                          BIO BIO
11                         COQUIMBO
...                             ...
282520    METROPOLITANA DE SANTIAGO
Name: city, dtype: object

Run Code Online (Sandbox Code Playgroud)

这是我试过的:

from sklearn import preprocessing

list_city = getList(df,'city')
le = preprocessing.LabelEncoder()
le.fit(list_city)

print(le.transform(['AISEN'])) 
print(le.transform(['TARAPACA']))
print(le.transform(['AISEN DEL GENERAL CARLOS IBANEZ DEL …

Run Code Online (Sandbox Code Playgroud)

python scikit-learn sklearn-pandas

neo*_*o33

2017 02-04

2
推荐指数

1
解决办法

1408
查看次数

如何使用perl获取以下子串？

您好我正在使用perl脚本,我有以下变量:

   $string1="ZZ:DPHTEST1ZZ";

Run Code Online (Sandbox Code Playgroud)

我想通过使用":"作为分隔符从$ string1获取子字符串来构建另外两个变量,我想在我的脚本中添加两个打印输出:

print $fragment1;
print $fragment2;

Run Code Online (Sandbox Code Playgroud)

获得以下输出:

ZZ
DPHTEST1ZZ

Run Code Online (Sandbox Code Playgroud)

我尝试过:

$fragment1 =  substr $string1, index($string1, ':');
print $fragment1;

Run Code Online (Sandbox Code Playgroud)

但我得到了:

:DPHTEST1ZZ

Run Code Online (Sandbox Code Playgroud)

因此,我想通过使用分隔符得到这个字符串,我正在研究一点,我刚刚找到使用该位置的perl方法,感谢支持,

perl

neo*_*o33

lucky-day

0
推荐指数

1
解决办法

60
查看次数

如何在bash中转义双引号？

我想在 bash 中转义双引号，我遵循了以下方法：

#!/bin/bash
this is a  \"number\"!

Run Code Online (Sandbox Code Playgroud)

但我需要知道是否有另一种方式。

bash

neo*_*o33

2016 02-24

-1
推荐指数

2
解决办法

9539
查看次数

标签统计

scikit-learn ×3

bash ×2

python ×2

html ×1

javascript ×1

latex ×1

linux ×1

lodash ×1

numpy ×1

perl ×1

sed ×1

sklearn-pandas ×1

标签 统计

小编neo_o33的帖子

标签统计