小编Nau*_*lid的帖子

归一化编辑距离

我有一个问题，我们可以用ed值除以两个字符串的长度来归一化levenshtein编辑距离吗？我之所以这样问是因为，如果我们比较两个长度不相等的字符串，那么两个长度之间的差异也将被计算在内。例如：ed（'has a'，'has a ball'）= 4，而ed（'has a'，'has a ball the round'）=15。如果我们增加字符串的长度，则编辑距离即使它们相似，也会增加。因此，我无法设置一个值，好的编辑距离值应该是多少。

algorithm edit-distance ranking string-matching levenshtein-distance

Nau*_*lid

lucky-day

6
推荐指数

2
解决办法

3892
查看次数

不同域上的站点地图文件

我正在为我的网站创建多个站点地图文件。问题是我的站点地图文件与我的网站位于不同的文件服务器上。例如，我有一个按域www.example.com划分的网站，但是我的站点地图索引文件和其他站点地图文件驻留在www.filestack.com.

我的站点地图索引文件将如下所示：

<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>
https://www.filestack.com/sitemap1.xml
</loc>
</sitemap>

Run Code Online (Sandbox Code Playgroud)

虽然我的sitemap1.xml意愿是：

<url>
<loc>
https://www.example.com/test
</loc>
<lastmod>2017-09-04</lastmod>
<changefreq>weekly</changefreq>
</url>

Run Code Online (Sandbox Code Playgroud)

是否可以添加链接来做这样的事情以及如何做？

sitemap seo

Nau*_*lid

2017 09-13

3
推荐指数

1
解决办法

3283
查看次数

使用scikit-learn Logistic回归获得特征权重

我对此有点新意.我在python scikit-learn中使用了一个简单的Logistic回归分类器.我有4个功能.我的代码是

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.2, random_state = 42) 
classifier = LogisticRegression(random_state = 0, C=100)
classifier.fit(X_train, y_train)
coef = classifier.coef_[0]
print (coef)

[-1.07091645 -0.07848958  0.66913624  0.43500273]

Run Code Online (Sandbox Code Playgroud)