标签: data-analysis

如何在R中添加新列和聚合值

我是gnuplot的新手,我只是尝试这个,因为我需要学习它.我有三列中的值,其中第一列表示文件名(日期和时间,一小时间隔),其余两列表示两个不同的实体Prop1和Prop2.

Datetime             Prop1        Prop2

20110101_0000.txt     2            5
20110101_0100.txt     2            5
20110101_0200.txt     2            5
...
20110101_2300.txt     2            5
20110201_0000.txt     2            5
20110101_0100.txt     2            5
...
20110201_2300.txt     2            5
...
Run Code Online (Sandbox Code Playgroud)

我需要按一天中的小时(**_ 0100)聚合数据,这是最后四位数字.所以,我想创建另一个名为hour的列,它告诉我当天的小时.这意味着0000 = 0h, 0100 = 1h, ...... 2200 = 22h

然后我想得到每小时Prop1和Prop2的总和,所以最后得到类似的东西.

Hour  Prop1   Prop2
0h     120     104
1h     230     160
...
10h    90      110
...
23h    100    200 
Run Code Online (Sandbox Code Playgroud)

并获得Prop1和Prop2的线图.

plot r data-analysis aggregation

1
推荐指数
1
解决办法
1567
查看次数

从元组列表中的python bar plot

非常新手的问题:

我需要从元组列表中绘制条形图.第一个元素是x轴的名称(分类),第二个元素是float类型(对于y轴).我还想按降序排列条形图,并添加趋势线.以下是一些示例代码:

In [20]: popularity_data
Out[20]: 
[('Unknown', 10.0),
 (u'Drew E.', 240.0),
 (u'Anthony P.', 240.0),
 (u'Thomas H.', 220.0),
 (u'Ranae J.', 150.0),
 (u'Robert T.', 120.0),
 (u'Li Yan M.', 80.0),
 (u'Raph D.', 210.0)]
Run Code Online (Sandbox Code Playgroud)

python matplotlib data-analysis

1
推荐指数
1
解决办法
8849
查看次数

查找平均值但忽略列表中的任何零[Python]

我有一个温度数据的文本文件,如下所示:

3438012868.0    0.0 21.7    22.6    22.5    22.5    21.2
3438012875.0    0.0 21.6    22.6    22.5    22.5    21.2
3438012881.9    0.0 21.7    22.5    22.5    22.5    21.2
3438012888.9    0.0 21.6    22.6    22.5    22.5    21.2
3438012895.8    0.0 21.6    22.5    22.6    22.5    21.3
3438012902.8    0.0 21.6    22.5    22.5    22.5    21.2
3438012909.7    0.0 21.6    22.5    22.5    22.5    21.2
3438012916.6    0.0 21.6    22.5    22.5    22.5    21.2
3438012923.6    0.0 21.6    22.6    22.5    22.5    21.2
3438012930.5    0.0 21.6    22.5    22.5    22.5    21.2
3438012937.5    0.0 21.7    22.5    22.5    22.5    21.2
3438012944.5    0.0 …
Run Code Online (Sandbox Code Playgroud)

python data-analysis

1
推荐指数
1
解决办法
1万
查看次数

如何从sklearn.feature_selection.SelectKBest获取每个功能的分数?

我试图得到我的数据集的所有功能的分数.

file_data = numpy.genfromtxt(input_file)
y = file_data[:,-1]
X = file_data[:,0:-1]

x_new = SelectKBest(chi2, k='all').fit_transform(X,y)
Run Code Online (Sandbox Code Playgroud)

在X的第一行之前有字符串格式的"功能名称",但我得到"输入包含NaN,无穷大或者对于dtype('float64')来说太大的值"错误.所以,现在X只包含数据,y包含目标值(1,-1).

如何从SelectKBest获取每个功能的分数(尝试使用单变量功能选择)?

谢谢

python data-analysis feature-selection scikit-learn

1
推荐指数
1
解决办法
1万
查看次数

如何在python中创建不同大小的两个样本之间的qq图?

我得到了原始样本数据及其模拟数据(不要问我是如何模拟的),我想检查直方图是否匹配.所以最好的方法是,qqplotstatsmodels库不允许不同大小的样本.

python matplotlib histogram data-analysis

1
推荐指数
1
解决办法
2647
查看次数

在pandas中的数据帧之间减去行

我有两个数据帧,

df1
Name   | std
kumar  | 8
Ravi   | 10
Sri    | 2
Ram    | 4


df2,
Name   | std
Sri    | 2
Ram    | 4
Run Code Online (Sandbox Code Playgroud)

我想从df1中减去df2行,我试过了,

df1.subtract(df2,fill_value=None)
Run Code Online (Sandbox Code Playgroud)

但是我收到了错误,

 TypeError: unsupported operand type(s) for -: 'str' and 'str' 
Run Code Online (Sandbox Code Playgroud)

我想要的输出,

df3
Name   | std
kumar  | 8
Ravi   | 10
Run Code Online (Sandbox Code Playgroud)

python data-analysis dataframe pandas

1
推荐指数
1
解决办法
986
查看次数

脾气暴躁的新轴

saleprice_scaled = /
StandardScaler().fit_transform(df_train['SalePrice'][:,np.newaxis]);
Run Code Online (Sandbox Code Playgroud)

为什么newaxis在这里使用?我知道newaxis,但是我不知道它在这种特殊情况下的用途。

numpy machine-learning data-analysis pandas scikit-learn

1
推荐指数
1
解决办法
1522
查看次数

从数据框的不同列中显示堆积条形图的每种颜色的值

这是我的数据框:

          6month  final-formula     Question Text  numPatients6month
286231       1       0.031730        CI_FINANCE                977
286270       1       0.147390            CI_MJO                977
286276       1       0.106448  CI_CONCENTRATING                977
286700       2       0.010323            CI_MJO                775
286323       2       0.018065        CI_FINANCE                775
286401       2       0.034839  CI_CONCENTRATING                775
286228       3       0.032020  CI_CONCENTRATING                812
286238       3       0.061576            CI_MJO                812
286292       3       0.008621        CI_FINANCE                812
286690       4       0.008097            CI_MJO                741
286342       4       0.005398        CI_FINANCE                741
286430       4       0.060729  CI_CONCENTRATING                741
286481       5       0.009840        CI_FINANCE                813
287441       5       0.008610            CI_MJO                813
286362       5       0.041820  CI_CONCENTRATING …
Run Code Online (Sandbox Code Playgroud)

python matplotlib data-analysis dataframe pandas

1
推荐指数
2
解决办法
3689
查看次数

当值为列表时获取字典中最大值的键

myDict = {'DISPLAY': [0.12, 0.0], 'BATTERY': [0.5, 0.0]}
Run Code Online (Sandbox Code Playgroud)

我想检查每个列表中的所有值并查看最大的值。在这种情况下,它是 0.5 对应于键“BATTERY”,所以我想返回“BATTERY”。我怎样才能做到这一点?我不想再次遍历所有内容/创建一个新的 dict,因为我已经在我的代码的前面步骤中这样做了。

result = max(myDict, key=myDict.get)
Run Code Online (Sandbox Code Playgroud)

在这种情况下将无法正常工作,因为这些值是一个列表。例如,当最大值不在列表值的第 0 个索引位置时,它在这种情况下不起作用。

{'DISPLAY': [0.16], 'BATTERY': [0.0, 0.77]}
Run Code Online (Sandbox Code Playgroud)

python dictionary list data-analysis python-3.x

1
推荐指数
1
解决办法
56
查看次数

WebDataRock 类型错误:无法读取 null 的属性元素

WebDataRock 类型错误:无法读取 nul 的属性“元素”和 WebDataRocks:无法绘制枢轴。

问候。

我尝试在我的 react-app 项目中实现 WebDataRocks,我可以实现 WebDataRock.Pivot 组件,但是自从开始渲染组件后,控制台会打印此消息

webdatarocks.js:180 未捕获的类型错误:无法在 webdatarocks.js:992 处的 b.setControls (webdatarocks.js:1006) 处读取 new e (webdatarocks.js:180) 处的 null 属性“元素”

几秒钟后,控制台打印:

index.js:1 WebDataRocks:无法绘制枢轴。

    import React from "react";
         import ReactDOM from "react-dom";
         import WebDataRocks from "webdatarocks";
     
         export class Pivot extends React.Component<WebDataRocks.Params, any> {
         webdatarocks: WebDataRocks.Pivot;
         
         componentDidMount() {
            const tempProps : any = this.props;
            const pivotData = tempProps.pivotData;
            const columnsData : any[] = tempProps.columnsData;
     
            const tempColums = [];
            const tempKeys = [];
     
            columnsData.forEach(cd => {
                const tempLabelColumn …
Run Code Online (Sandbox Code Playgroud)

javascript data-analysis reactjs webdatarocks

1
推荐指数
1
解决办法
130
查看次数