我正在编写一个脚本来创建一个名为dict的字典,其中我存储了文本区域中某些单词的频率.我的数组看起来像这样:
var dict = removeArray.reduce(function(p,c) {
if (p[c] === undefined) {
p[c] = 1;
} else {
p[c]++;
}
return p;
}, {});
Run Code Online (Sandbox Code Playgroud)
我想根据它们的值过滤这个字典的元素.我需要创建一个列表,其中包含值大于1的单词.我的字典看起来像这样:
{
"92173": 6,
"C": 6,
"GJHGWO.NAYE": 1,
"GJHGX4.NAYE": 1,
"GJHGX6.NAYE": 1,
"GJHGX8.NAYE": 1,
"GJHGXA.NAYE": 1,
"GJHGXC.NAYE": 1,
"RBD": 10,
"RBD3": 2,
"SAMBORNSiPOSSSTHRa": 2,
"SAMBORNSiPOSSSTHRa1": 2,
"SAMBORNSiPOSSSTHRa2": 2,
"X": 4,
"X3": 2
}
Run Code Online (Sandbox Code Playgroud)
为了实现我尝试使用lodash,如下:
var filtered = _.find(dict, function(user) {
return user.frecuency > 1;
});
Run Code Online (Sandbox Code Playgroud)
但是自从我得到以后我失败了:
undefined
Run Code Online (Sandbox Code Playgroud)
我不知道如何适当地使用lodash来过滤这个数组.
我的完整代码如下所示:
var splitWords = document.getElementById("texto").value.split(/[["\|~]/);
var removeArray …Run Code Online (Sandbox Code Playgroud)大家好我正在创建一个关于latex的表我的代码如下所示:
\begin{table}[H]
\centering
\caption{caption}
\label{my-label}
\begin{tabular}{lll}
\hline
\multicolumn{3}{|c|}{\cellcolor[HTML]{34CDF9}{\color[HTML]{000000} Matriz confusión Genero.}} \\ \hline
\multicolumn{1}{|l|}{} & \multicolumn{1}{l|}{M} & \multicolumn{1}{l|}{F} \\ \hline
\multicolumn{1}{|l|}{M} & \multicolumn{1}{l|}{43} & \multicolumn{1}{l|}{7} \\ \hline
\multicolumn{1}{|l|}{F} & \multicolumn{1}{l|}{11} & \multicolumn{1}{l|}{39} \\ \hline
\end{tabular}
\end{table}
Run Code Online (Sandbox Code Playgroud)
它运行良好,但问题出现在我尝试修复我尝试的列的宽度时:
\begin{tabular}{l{2cm}|l{2cm}|l{2cm}}
Run Code Online (Sandbox Code Playgroud)
结果是相同的表,具有可变长度的列,我想修复列的长度,我想欣赏任何解决此问题的建议.
我想用 sed 替换字符串的一些字符。
我尝试了以下两种方法,但我需要知道是否有更优雅的形式来获得相同的结果,而不使用管道或-e选项:
sed 's#a#A#g' test.txt | sed 's#l#23#g' > test2.txt
sed -e 's#a#A#g' -e 's#l#23#g' test.txt > test2.txt
Run Code Online (Sandbox Code Playgroud) 您好,我正在使用 sklearn,为了更好地理解指标,我遵循了以下 precision_score 示例:
from sklearn.metrics import precision_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]
print(precision_score(y_true, y_pred, average='macro'))
Run Code Online (Sandbox Code Playgroud)
我得到的结果如下:
0.222222222222
Run Code Online (Sandbox Code Playgroud)
我了解 sklearn 按照以下步骤计算该结果:
最后 sklearn 计算所有三个标签的平均精度: precision = (0.66 + 0 + 0) / 3 …
我正在使用gensim进行实验.我正在使用lda模型来获得一个概率向量,如下所示:
[(0, 0.01666666666666804), (1, 0.01666666666666982), (2, 0.01666666666667857),
(3, 0.016666666666667104), (4, 0.016666666666668519), (5, 0.01666666666666838),
(6, 0.016666666666681464), (7, 0.016666666666669494), (8, 0.016666666666669269),
(9, 0.016666666666667069), (10, 0.016666666668398125), (11, 0.016666666666666666),
(12, 0.51666666666481131), (13, 0.01666666666668485), (14, 0.01666666666666948),
(15, 0.016666666666667097), (16, 0.016666666666666666), (17, 0.016666666666666767),
(18, 0.016666666666667922), (19, 0.016666666666678695), (20, 0.016666666666667683),
(21, 0.016666666666677307), (22, 0.016666666666669522), (23, 0.016666666666675913),
(24, 0.016666666666670923), (25, 0.016666666666667409), (26, 0.016666666666680405),
(27, 0.016666666666666666), (28, 0.0166666666666705), (29, 0.016666666666668353)]
Run Code Online (Sandbox Code Playgroud)
它是由元组组成的列表,元组的第一个组成部分是主题,第二个是概率:
(topic, probability)
Run Code Online (Sandbox Code Playgroud)
我想在元组列表中获得具有最高概率的5个主题,如下所示:
max = [(topicN, probability),...]
Run Code Online (Sandbox Code Playgroud)
我尝试首先将这个元组转换为numpy结构,如下所示:
vector = lda[ques_vec]
print(vector)
types = numpy.dtype('int,float')
data = numpy.array(vector,dtype=types) …Run Code Online (Sandbox Code Playgroud) 我正在创建这个函数,在文件的每一行上创建多个grep.我运行如下:
cat file.txt | agrep string1 string2 ... stringN
function agrep () {
for a in $@; do
cmd+=" | grep '$a'";
done ;
while read line ; do
eval "echo "\'"$line"\'" $cmd";
done;
}
Run Code Online (Sandbox Code Playgroud)
我们的想法是打印包含所有字符串的每一行:string1,string2,..., stringN.这已经有效,但我想避免使用for构造表达式:
| grep string1 | grep string2 ... | stringN
Run Code Online (Sandbox Code Playgroud)
如果可能,也可以使用eval.我尝试进行如下扩展:
echo "| grep $"{1..3}
Run Code Online (Sandbox Code Playgroud)
我得到:
| grep $1 | grep $2 | grep $3
Run Code Online (Sandbox Code Playgroud)
这几乎是我想要的,但问题是,当我尝试:
echo "| grep $"{1..$#}
Run Code Online (Sandbox Code Playgroud)
由于bash不能扩展,{1..$#}因此不会发生扩展$#.它只适用于数字.我想构建一些有效的扩展,以避免 …
我在阅读有关sklearn中使用的指标的信息,但发现以下内容非常令人困惑:
sklearn在文档中提供了其用法示例,如下所示:
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
accuracy_score(y_true, y_pred)
0.5
Run Code Online (Sandbox Code Playgroud)
我了解sklearns会按以下方式计算该指标:
我不确定过程,我想感谢有人自从我研究以来就可以逐步解释这个结果,但是我很难理解。为了理解更多,我尝试了以下情况:
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3,0]
y_true = [0, 1, 2, 3,0]
print(accuracy_score(y_true, y_pred))
0.6
Run Code Online (Sandbox Code Playgroud)
我认为正确的计算如下:
但是我不确定,我想看看是否有人可以支持我的计算,而不是复制并粘贴sklearn的文档。
我如果怀疑我在sumatory是一样的我括号里面的公式,它是我不清楚,我不知道元素在sumatory的数量与刚元素的数量在样本中是否还取决于类的数量。
我想对一些分类数据进行矢量化以构建训练和测试矩阵.
我有85个城市,我想得到一个282520行的矩阵,每行都是一个矢量
[1 0 0 ..., 0 0 0]
Run Code Online (Sandbox Code Playgroud)
我希望每行有一个向量,其中1或0取决于城市,因此每个城市应该是一列:
print(df['city'])
Run Code Online (Sandbox Code Playgroud)
0 METROPOLITANA DE SANTIAGO
1 METROPOLITANA DE SANTIAGO
2 METROPOLITANA DE SANTIAGO
3 METROPOLITANA DE SANTIAGO
4 COQUIMBO
5 SANTIAGO
6 SANTIAGO
7 METROPOLITANA DE SANTIAGO
8 METROPOLITANA DE SANTIAGO
9 METROPOLITANA DE SANTIAGO
10 BIO BIO
11 COQUIMBO
... ...
282520 METROPOLITANA DE SANTIAGO
Name: city, dtype: object
Run Code Online (Sandbox Code Playgroud)
这是我试过的:
from sklearn import preprocessing
list_city = getList(df,'city')
le = preprocessing.LabelEncoder()
le.fit(list_city)
print(le.transform(['AISEN']))
print(le.transform(['TARAPACA']))
print(le.transform(['AISEN DEL GENERAL CARLOS IBANEZ DEL …Run Code Online (Sandbox Code Playgroud) 您好我正在使用perl脚本,我有以下变量:
$string1="ZZ:DPHTEST1ZZ";
Run Code Online (Sandbox Code Playgroud)
我想通过使用":"作为分隔符从$ string1获取子字符串来构建另外两个变量,我想在我的脚本中添加两个打印输出:
print $fragment1;
print $fragment2;
Run Code Online (Sandbox Code Playgroud)
获得以下输出:
ZZ
DPHTEST1ZZ
Run Code Online (Sandbox Code Playgroud)
我尝试过:
$fragment1 = substr $string1, index($string1, ':');
print $fragment1;
Run Code Online (Sandbox Code Playgroud)
但我得到了:
:DPHTEST1ZZ
Run Code Online (Sandbox Code Playgroud)
因此,我想通过使用分隔符得到这个字符串,我正在研究一点,我刚刚找到使用该位置的perl方法,感谢支持,
我想在 bash 中转义双引号,我遵循了以下方法:
#!/bin/bash
this is a \"number\"!
Run Code Online (Sandbox Code Playgroud)
但我需要知道是否有另一种方式。