小编Nau*_*lid的帖子

归一化编辑距离

我有一个问题,我们可以用ed值除以两个字符串的长度来归一化levenshtein编辑距离吗?我之所以这样问是因为,如果我们比较两个长度不相等的字符串,那么两个长度之间的差异也将被计算在内。例如:ed('has a','has a ball')= 4,而ed('has a','has a ball the round')=15。如果我们增加字符串的长度,则编辑距离即使它们相似,也会增加。因此,我无法设置一个值,好的编辑距离值应该是多少。

algorithm edit-distance ranking string-matching levenshtein-distance

6
推荐指数
2
解决办法
3892
查看次数

不同域上的站点地图文件

我正在为我的网站创建多个站点地图文件。问题是我的站点地图文件与我的网站位于不同的文件服务器上。例如,我有一个按域www.example.com划分的网站,但是我的站点地图索引文件和其他站点地图文件驻留在www.filestack.com.

我的站点地图索引文件将如下所示:

<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>
https://www.filestack.com/sitemap1.xml
</loc>
</sitemap>
Run Code Online (Sandbox Code Playgroud)

虽然我的sitemap1.xml意愿是:

<url>
<loc>
https://www.example.com/test
</loc>
<lastmod>2017-09-04</lastmod>
<changefreq>weekly</changefreq>
</url>
Run Code Online (Sandbox Code Playgroud)

是否可以添加链接来做这样的事情以及如何做?

sitemap seo

3
推荐指数
1
解决办法
3283
查看次数

使用scikit-learn Logistic回归获得特征权重

我对此有点新意.我在python scikit-learn中使用了一个简单的Logistic回归分类器.我有4个功能.我的代码是

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.2, random_state = 42) 
classifier = LogisticRegression(random_state = 0, C=100)
classifier.fit(X_train, y_train)
coef = classifier.coef_[0]
print (coef)

[-1.07091645 -0.07848958  0.66913624  0.43500273]
Run Code Online (Sandbox Code Playgroud)
  • 我想知道coef数组表示什么?
  • 我们可以使用这些coef*功能排名吗?
  • 这是否意味着最后两个特征在分类结果中最重要?

machine-learning scikit-learn logistic-regression coefficients

1
推荐指数
2
解决办法
1万
查看次数