小编Ami*_*mir的帖子

函数如何选择性地返回一个或多个值

忽略函数 f() 的可选返回值的首选方法是什么?

A)

foo, _ = f()
Run Code Online (Sandbox Code Playgroud)

b)

foo = f()[0]
Run Code Online (Sandbox Code Playgroud)

C)

def f(return_bar=True):
    if return_bar:
        return foo, bar
    else:
        return foo

foo = f(return_bar=False)
Run Code Online (Sandbox Code Playgroud)

python return

8
推荐指数
1
解决办法
2万
查看次数

如何从字符串中提取数字?

我有字符串包含一个路径

string="toto.titi.12.tata.2.abc.def"
Run Code Online (Sandbox Code Playgroud)

我想只从这个字符串中提取数字.

要提取第一个数字:

tmp="${string#toto.titi.*.}"
num1="${tmp%.tata*}"
Run Code Online (Sandbox Code Playgroud)

要提取第二个数字:

tmp="${string#toto.titi.*.tata.*.}"
num2="${tmp%.abc.def}"
Run Code Online (Sandbox Code Playgroud)

因此,要提取参数,我必须分两步完成.如何一步提取数字?

linux bash shell substring sh

7
推荐指数
5
解决办法
3万
查看次数

从许多2d图像生成点云

从我对点云如何工作的理解有限,我觉得应该能够从一个对象外部的一组二维图像中生成一个点云.我遇到的问题是我似乎无法找到如何生成这种点云的任何示例.

3d point-clouds point-cloud-library

7
推荐指数
2
解决办法
3万
查看次数

如何加速R中的主题模型?

背景 我试图使用以下数据和规范文档来拟合主题模型= 140 000,单词= 3000,主题= 15.我topicmodels在Windows 7机器上使用R(3.1.2)中的软件包(ram 24 GB ,8核心).我的问题是计算只能继续进行,而不会产生任何"收敛".

我在LDA()函数中使用默认选项topicmodels:

运行模型

dtm2.sparse_TM <- LDA(dtm2.sparse, 15)
Run Code Online (Sandbox Code Playgroud)

该模型已经运行了大约72个小时 - 仍然像我写的那样.

问题 所以,我的问题是(a)这是否是正常行为; (b)如果不是第一个问题,你对做什么有任何建议; (c)如果对第一个问题是肯定的,我怎样才能大大提高计算的速度?

附加信息:原始数据不包含3000字,但约370万字.当我跑(在同一台机器上)它没有收敛,甚至在几周之后.所以我用300个单词运行它,只有500个文件(随机选择)并且都不是很好.对于所有模型,我使用与以前相同的主题和默认值.

因此,对于我当前的模型(请参阅我的问题),我在tm包的帮助下删除了稀疏术语.

删除稀疏术语

dtm2.sparse <- removeSparseTerms(dtm2, 0.9)
Run Code Online (Sandbox Code Playgroud)

感谢提前输入Adel

r machine-learning lda unsupervised-learning topic-modeling

7
推荐指数
1
解决办法
1873
查看次数

将pandas.DataFrame转换为字节

我需要将存储在a中的数据pandas.DataFrame转换为字节字符串,其中每列可以具有单独的数据类型(整数或浮点).这是一组简单的数据:

df = pd.DataFrame([ 10, 15, 20], dtype='u1', columns=['a'])
df['b'] = np.array([np.iinfo('u8').max, 230498234019, 32094812309], dtype='u8')
df['c'] = np.array([1.324e10, 3.14159, 234.1341], dtype='f8')
Run Code Online (Sandbox Code Playgroud)

和df看起来像这样:

    a            b                  c
0   10  18446744073709551615    1.324000e+10
1   15  230498234019            3.141590e+00
2   20  32094812309             2.341341e+02
Run Code Online (Sandbox Code Playgroud)

DataFrame对各类型列的都知道df.dtypes,所以我想这样做:

data_to_pack = [tuple(record) for _, record in df.iterrows()]
data_array = np.array(data_to_pack, dtype=zip(df.columns, df.dtypes))
data_bytes = data_array.tostring()
Run Code Online (Sandbox Code Playgroud)

这通常工作正常,但在这种情况下(由于存储的最大值df['b'][0].上面的第二行将元组数组转换为np.array具有给定类型的一组导致以下错误:

OverflowError: Python int too large to convert to C long
Run Code Online (Sandbox Code Playgroud)

错误结果(我相信)在第一行中将记录提取为Series具有单个数据类型(默认为float64),并且 …

python numpy type-conversion dataframe pandas

7
推荐指数
1
解决办法
7154
查看次数

为什么需要在机器学习问题中使用正则化?

这似乎是一个愚蠢的问题,但我无法得出一个合理的答案.

据说正则化可以帮助我们获得复杂的模型以避免过度拟合.但对于线性分类问题:

f(x) = Wx
Run Code Online (Sandbox Code Playgroud)

模型的复杂性有些明确:它是线性的,而不是二次的或更复杂的.那么为什么我们仍然需要对参数进行正则化?为什么在这种情况下我们更喜欢较小的重量?

statistics classification machine-learning mathematical-optimization regularized

7
推荐指数
1
解决办法
1738
查看次数

四元数(0,0,0,0)表示什么

执行四元数乘法后,我得到(0,0,0,0)。谁能让我知道它代表什么。

(1 0 0 0) - Identity quaternion, no rotation,
(0 1 0 0) - 180° turn around X axis,
(0 0 1 0) - 180° turn around Y axis,
(0 0 0 1) - 180° turn around Z axis,
Run Code Online (Sandbox Code Playgroud)

同样,可能是(0,0,0,0)的解释

math rotation quaternions

7
推荐指数
1
解决办法
6465
查看次数

如何在 Ubuntu 中使用 Visual Studio Code 编译 C++ 代码?

我一直在查看有关如何使用 Visual Studio Code 编译 C++ 项目的一些在线资源。我对 Visual Studio Code 很陌生,但我找不到一个教程来清楚地解释我如何编译一个大型 C++ 项目,该项目需要带有一些参数的 CMake 以在基于 Unix 的操作系统(如 Ubuntu)中启用调试。我发现的最接近的是this,它看起来非常简洁,对于更多的专家用户来说可能已经足够了。所以我想知道,有人可以就我应该如何设置 VSCode 和编译 C++ 代码以及启用 GDB 调试提供一些分步说明吗?

仅供参考,我已经安装了C++CMake扩展。

c++ gcc compilation visual-studio-code

7
推荐指数
1
解决办法
2万
查看次数

在VC++中调试模式下调用函数(立即窗口)

我想知道我可以在VC++的调试模式下调用函数吗?假设我有一个函数,我设置了一个断点,当在调试期间执行停止时,我可以调用其他函数并在继续下一行代码之前查看它们的结果吗?

immediate-window visual-studio visual-c++

6
推荐指数
2
解决办法
7133
查看次数

SIFT关键点位置

我目前在SIFT工作,我已经生成了高斯和极值图像层的差异.任何人都可以向我解释如何使用Hessian矩阵来消除低对比度关键点?

image-processing sift hessian-matrix

6
推荐指数
1
解决办法
834
查看次数