小编Lon*_*guy的帖子

数据库水平和垂直缩放之间的差异

我遇到过许多NoSQL数据库和SQL数据库.有各种参数来衡量这些数据库的优缺点,可扩展性就是其中之一.水平和垂直缩放这些数据库有什么区别？

database database-design scalability nosql

Lon*_*guy

lucky-day

638
推荐指数

8
解决办法

36万
查看次数

线性回归和逻辑回归有什么区别？

当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归.我相信我们使用线性回归来预测输入值给出的结果值.

那么,这两种方法有什么区别？

machine-learning data-mining linear-regression

Lon*_*guy

2018 02-26

211
推荐指数

7
解决办法

21万
查看次数

什么是期望最大化技术的直观解释？

期望最大化如果采用一种概率方法对数据进行分类.如果我错了,请纠正我,如果它不是分类器.

这种EM技术的直观解释是什么？这里的期望是什么,最大化的是什么？

cluster-analysis machine-learning mathematical-optimization data-mining expectation-maximization

Lon*_*guy

2019 04-29

105
推荐指数

4
解决办法

4万
查看次数

如何从包含特定列中特定字符串的pandas数据框中删除行？

我在python中有一个非常大的数据框,我想删除在特定列中具有特定字符串的所有行.

例如,我想删除所有具有字符串"XYZ"的行作为数据帧的C列中的子字符串.

可以使用.drop()方法以有效的方式实现吗？

python pandas

Lon*_*guy

lucky-day

82
推荐指数

6
解决办法

16万
查看次数

具有未知数量的簇的无监督聚类

我有三个维度的大量向量.我需要基于欧几里德距离对这些进行聚类,使得任何特定聚类中的所有向量彼此之间的欧几里德距离小于阈值"T".

我不知道有多少个集群存在.最后,可能存在不属于任何聚类的个体向量,因为其欧氏距离不小于空间中任何向量的"T".

这里应该使用哪些现有的算法/方法？

algorithm math artificial-intelligence cluster-analysis machine-learning

Lon*_*guy

2018 06-26

70
推荐指数

3
解决办法

4万
查看次数

为什么F-Measure是一个调和均值而不是精确和召回措施的算术平均值？

当我们计算考虑精度和召回的F-测量时,我们采用两个测量的调和平均值而不是简单的算术平均值.

采用调和均值而不是简单平均值的直观原因是什么？

classification machine-learning data-mining

Lon*_*guy

lucky-day

64
推荐指数

5
解决办法

1万
查看次数

无法创建新的maven hello-world项目

我正在看几个maven教程视频,然后我在安装maven后遇到了这个命令:

mvn archetype:create -DgroupId=com.di.maven -DartifactId=hello-world

Run Code Online (Sandbox Code Playgroud)

构建失败并引发以下错误:

Failed to execute goal org.apache.maven.plugins:maven-archetype-plugin:2.3:create 
(default-cli) on project standalone-pom: Unable to parse configuration of mojo 
org.apache.maven.plugins:maven-archetype-plugin:2.3:create for parameter #: Abstract 
class or interface 'org.apache.maven.artifact.repository.ArtifactRepository' cannot be 
instantiated -> [Help 1]

Run Code Online (Sandbox Code Playgroud)

是什么原因,我该如何解决？我在Ubuntu中以用户身份运行.

java maven

Lon*_*guy

2017 01-23

58
推荐指数

3
解决办法

3万
查看次数