小编gan_ddy的帖子

在循环中填充R中的数据框

我试图从R中的for循环中填充数据帧.列的名称是在循环内动态生成的,并且一些循环变量的值在填充数据框时用作值.例如,当前列的名称可以是某个变量名称作为循环中的字符串,并且该列可以将当前迭代器的值作为其在数据框中的值.

我尝试在循环外创建一个空数据框,就像这样

d = data.frame()

Run Code Online (Sandbox Code Playgroud)

但是我无法对它做任何事情,当我试图填充它时,我遇到了一个错误

 d[1] = c(1,2)
Error in `[<-.data.frame`(`*tmp*`, 1, value = c(1, 2)) : 
  replacement has 2 rows, data has 0

Run Code Online (Sandbox Code Playgroud)

什么是实现我想做的好方法.如果我不清楚,请告诉我.

27
推荐指数

3
解决办法

13万
查看次数

从字符转换为数字数据框

我在R中有一个字符数据框,里面有NaNs.我需要删除任何行,NaN然后将其转换为数字数据框.

如果我只是在数据框上执行as.numeric,我会遇到以下情况

Error: (list) object cannot be coerced to type 'double'
 1:
 0:

Run Code Online (Sandbox Code Playgroud)

9
推荐指数

2
解决办法

4万
查看次数

R填充矢量

我有一个零向量,比如长度为10.所以

v = rep(0,10)

Run Code Online (Sandbox Code Playgroud)

我想根据v1中的一组索引和另一个实际上具有序列值的向量v2来填充向量的某些值.所以另一个向量v1有索引说

v1 = c(1,2,3,7,8,9)

Run Code Online (Sandbox Code Playgroud)

和

v2 = c(0.1,0.3,0.4,0.5,0.1,0.9)

Run Code Online (Sandbox Code Playgroud)

最后我想要

v = c(0.1,0.3,0.4,0,0,0,0.5,0.1,0.9,0)

Run Code Online (Sandbox Code Playgroud)

所以v1中的索引是从v2映射的,其余的都是0.我显然可以编写一个for循环,但由于实际矩阵的长度,这在R中占用太长时间.有什么简单的方法吗？

operations r vector

6
推荐指数

1
解决办法

1万
查看次数

使用自定义逻辑删除重复项

我有一个具有以下结构的 pandas 数据框：

df:
x      y      z1       z2        z3
1.01  2.01   11.415   12.345    100
1.009 2.009  11.415   12.345    100
1.01  2.05   11.415   12.345    100

Run Code Online (Sandbox Code Playgroud)

x 列和 y 列是用一些噪声测量的。我的工作是对列 z1、z2、z3 的数据帧进行“去重复”，以使 x 列和 y 列中的条目彼此距离不“远”。在上面设计的示例中，前两行（第 1 行和第 2 行）是重复的，z 列中具有相同的条目，并且 x 和 y 合理地“接近”。请注意，第 3 行（最后一行）也具有相同的条目，但其 y 值与其他两行“相距甚远”（2.05 与 2.01）。我有逻辑来确定 x 列和 y 列的什么算作“远”和“近”。

我正在寻找一种干净的方法来做到这一点。我尝试过窗口应用程序并使用分组依据等，但似乎没有什么效果很好。谢谢。

duplicates pandas

6
推荐指数

1
解决办法

2892
查看次数

使用TTR包计算指数移动平均线

好奇,如果有人使用它.我在一个时间序列上做了一个简单的EMA操作.但是不能很好地和解.

我读到更新常量的值= 2 /(N + 1).我定义了x = 1:20,并且做了EMA(x,5).然后我使用递归计算进行了EMA计算.这两个结果并没有真正对齐

该函数返回

EMA(x,5)
 [1] NA NA NA NA  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18

Run Code Online (Sandbox Code Playgroud)

我的小东西给了我,

EMA
 [1]  1.000000  1.333333  1.888889  2.592593  3.395062  4.263374  5.175583  6.117055  7.078037  8.052025  9.034683 10.023122 11.015415 12.010276 13.006851 14.004567
[17] 15.003045 16.002030 17.001353 18.000902

Run Code Online (Sandbox Code Playgroud)

5
推荐指数

1
解决办法

1万
查看次数

使用lm对象填充列表

我试图用R中的OLS结果填充一个命名列表.我试过了

li = list()
for (i in 1:10)
    li[["RunOne"]][i] = lm(y~x)

Run Code Online (Sandbox Code Playgroud)

这RunOne是一个随机名称,指定拟合运行一个,y并且x是一些预定义的向量.这打破并给我错误

Warning message:
In l[["RunOne"]][1] = lm(y ~ x) :
  number of items to replace is not a multiple of replacement length

Run Code Online (Sandbox Code Playgroud)

虽然我理解错误,但我不知道如何解决它.

for-loop r list

5
推荐指数

1
解决办法

7805
查看次数

HDF5库错误

我正在使用以下内容

1)VS 2010 C++ 2)Debug Win 32 3)来自这里的库

http://www.hdfgroup.org/HDF5/release/obtain5.html

基本上我下载了Windows(32位)编译器:CMake VS 2010 C,C++,IVF 12,RWDI并安装它.我试图在我的C++应用程序中包含示例代码并遇到以下问题

***HDF5 library version mismatched error***
The HDF5 header files used to compile this application do not match
the version used by the HDF5 library to which this application is linked.
Data corruption or segmentation faults may occur if the application continues.
This can happen when an application was compiled by one version of HDF5 but
linked with a different version of static or shared HDF5 library. …

Run Code Online (Sandbox Code Playgroud)

c++ runtime-error hdf5

5
推荐指数

1
解决办法

5647
查看次数

受约束的np.polyfit

我试图将二次方拟合到一些实验数据并在numpy中使用polyfit.我希望得到一个凹曲线,因此想要确保二次项的系数是负的,而且拟合本身也是加权的,因为在点上有一些权重.有一个简单的方法吗？谢谢.

numpy constraints

5
推荐指数

1
解决办法

2143
查看次数

熊猫从UTC到当地时间

我正在尝试将UTC时间转换为当地时间。这是我以前的经历

df_combined_features['timestamp'][1:10]
2013-01-24   2013-01-24 11:00:00
2013-04-25   2013-04-25 10:00:00
2013-07-25   2013-07-25 10:00:00
2013-10-24   2013-10-24 10:00:00
2014-01-30   2014-01-30 11:00:00
2014-04-24   2014-04-24 10:00:00
2014-07-24   2014-07-24 10:00:00
2014-10-23   2014-10-23 10:00:00
2015-01-27   2015-01-27 11:00:00

Run Code Online (Sandbox Code Playgroud)

这就是我所做的

df_combined_features['time_stamp'].tz_localize('US/Central')[1:10]
2013-01-24 00:00:00-06:00   2013-01-24 11:00:00
2013-04-25 00:00:00-05:00   2013-04-25 10:00:00
2013-07-25 00:00:00-05:00   2013-07-25 10:00:00
2013-10-24 00:00:00-05:00   2013-10-24 10:00:00
2014-01-30 00:00:00-06:00   2014-01-30 11:00:00
2014-04-24 00:00:00-05:00   2014-04-24 10:00:00
2014-07-24 00:00:00-05:00   2014-07-24 10:00:00
2014-10-23 00:00:00-05:00   2014-10-23 10:00:00
2015-01-27 00:00:00-06:00   2015-01-27 11:00:00

Run Code Online (Sandbox Code Playgroud)

我认为它做对了，但我不理解输出格式。特别是

1）为什么转换后的列显示为新索引？

2）我知道-06：00（在最后一行）是一个小时班，所以时间是6:00，我该如何检索该信息以及确切的当地时间？

所需的输出，我希望发布确切的时间，包括与utc的偏移量。世界标准时间

    2013-01-24 05:00:00   2013-01-24 11:00:00
    2013-04-25 05:00:00   2013-04-25 10:00:00
    2013-07-25 …

Run Code Online (Sandbox Code Playgroud)

timestamp utc pandas

5
推荐指数

1
解决办法

5337
查看次数

从csv文件中删除换行符

我试图在python中处理一个csv文件,在每行/每行的中间有一个^ M字符,这是一个换行符.我无法以'rU'以外的任何模式打开文件.

如果我在'rU'模式下打开文件,它会读取换行符并拆分文件(创建换行符)并给我两倍的行数.

我想完全删除换行符.怎么样？

4
推荐指数

1
解决办法

2万
查看次数

标签统计

r ×5

c++ ×1

computation ×1

constraints ×1

hdf5 ×1

list ×1

runtime-error ×1

utc ×1

«
1
2
»