我是gnuplot的新手,我只是尝试这个,因为我需要学习它.我有三列中的值,其中第一列表示文件名(日期和时间,一小时间隔),其余两列表示两个不同的实体Prop1和Prop2.
Datetime Prop1 Prop2
20110101_0000.txt 2 5
20110101_0100.txt 2 5
20110101_0200.txt 2 5
...
20110101_2300.txt 2 5
20110201_0000.txt 2 5
20110101_0100.txt 2 5
...
20110201_2300.txt 2 5
...
Run Code Online (Sandbox Code Playgroud)
我需要按一天中的小时(**_ 0100)聚合数据,这是最后四位数字.所以,我想创建另一个名为hour的列,它告诉我当天的小时.这意味着0000 = 0h, 0100 = 1h, ...... 2200 = 22h等
然后我想得到每小时Prop1和Prop2的总和,所以最后得到类似的东西.
Hour Prop1 Prop2
0h 120 104
1h 230 160
...
10h 90 110
...
23h 100 200
Run Code Online (Sandbox Code Playgroud)
并获得Prop1和Prop2的线图.
非常新手的问题:
我需要从元组列表中绘制条形图.第一个元素是x轴的名称(分类),第二个元素是float类型(对于y轴).我还想按降序排列条形图,并添加趋势线.以下是一些示例代码:
In [20]: popularity_data
Out[20]:
[('Unknown', 10.0),
(u'Drew E.', 240.0),
(u'Anthony P.', 240.0),
(u'Thomas H.', 220.0),
(u'Ranae J.', 150.0),
(u'Robert T.', 120.0),
(u'Li Yan M.', 80.0),
(u'Raph D.', 210.0)]
Run Code Online (Sandbox Code Playgroud) 我有一个温度数据的文本文件,如下所示:
3438012868.0 0.0 21.7 22.6 22.5 22.5 21.2
3438012875.0 0.0 21.6 22.6 22.5 22.5 21.2
3438012881.9 0.0 21.7 22.5 22.5 22.5 21.2
3438012888.9 0.0 21.6 22.6 22.5 22.5 21.2
3438012895.8 0.0 21.6 22.5 22.6 22.5 21.3
3438012902.8 0.0 21.6 22.5 22.5 22.5 21.2
3438012909.7 0.0 21.6 22.5 22.5 22.5 21.2
3438012916.6 0.0 21.6 22.5 22.5 22.5 21.2
3438012923.6 0.0 21.6 22.6 22.5 22.5 21.2
3438012930.5 0.0 21.6 22.5 22.5 22.5 21.2
3438012937.5 0.0 21.7 22.5 22.5 22.5 21.2
3438012944.5 0.0 …Run Code Online (Sandbox Code Playgroud) 我试图得到我的数据集的所有功能的分数.
file_data = numpy.genfromtxt(input_file)
y = file_data[:,-1]
X = file_data[:,0:-1]
x_new = SelectKBest(chi2, k='all').fit_transform(X,y)
Run Code Online (Sandbox Code Playgroud)
在X的第一行之前有字符串格式的"功能名称",但我得到"输入包含NaN,无穷大或者对于dtype('float64')来说太大的值"错误.所以,现在X只包含数据,y包含目标值(1,-1).
如何从SelectKBest获取每个功能的分数(尝试使用单变量功能选择)?
谢谢
我得到了原始样本数据及其模拟数据(不要问我是如何模拟的),我想检查直方图是否匹配.所以最好的方法是,qqplot但statsmodels库不允许不同大小的样本.
我有两个数据帧,
df1
Name | std
kumar | 8
Ravi | 10
Sri | 2
Ram | 4
df2,
Name | std
Sri | 2
Ram | 4
Run Code Online (Sandbox Code Playgroud)
我想从df1中减去df2行,我试过了,
df1.subtract(df2,fill_value=None)
Run Code Online (Sandbox Code Playgroud)
但是我收到了错误,
TypeError: unsupported operand type(s) for -: 'str' and 'str'
Run Code Online (Sandbox Code Playgroud)
我想要的输出,
df3
Name | std
kumar | 8
Ravi | 10
Run Code Online (Sandbox Code Playgroud) saleprice_scaled = /
StandardScaler().fit_transform(df_train['SalePrice'][:,np.newaxis]);
Run Code Online (Sandbox Code Playgroud)
为什么newaxis在这里使用?我知道newaxis,但是我不知道它在这种特殊情况下的用途。
这是我的数据框:
6month final-formula Question Text numPatients6month
286231 1 0.031730 CI_FINANCE 977
286270 1 0.147390 CI_MJO 977
286276 1 0.106448 CI_CONCENTRATING 977
286700 2 0.010323 CI_MJO 775
286323 2 0.018065 CI_FINANCE 775
286401 2 0.034839 CI_CONCENTRATING 775
286228 3 0.032020 CI_CONCENTRATING 812
286238 3 0.061576 CI_MJO 812
286292 3 0.008621 CI_FINANCE 812
286690 4 0.008097 CI_MJO 741
286342 4 0.005398 CI_FINANCE 741
286430 4 0.060729 CI_CONCENTRATING 741
286481 5 0.009840 CI_FINANCE 813
287441 5 0.008610 CI_MJO 813
286362 5 0.041820 CI_CONCENTRATING …Run Code Online (Sandbox Code Playgroud) myDict = {'DISPLAY': [0.12, 0.0], 'BATTERY': [0.5, 0.0]}
Run Code Online (Sandbox Code Playgroud)
我想检查每个列表中的所有值并查看最大的值。在这种情况下,它是 0.5 对应于键“BATTERY”,所以我想返回“BATTERY”。我怎样才能做到这一点?我不想再次遍历所有内容/创建一个新的 dict,因为我已经在我的代码的前面步骤中这样做了。
result = max(myDict, key=myDict.get)
Run Code Online (Sandbox Code Playgroud)
在这种情况下将无法正常工作,因为这些值是一个列表。例如,当最大值不在列表值的第 0 个索引位置时,它在这种情况下不起作用。
{'DISPLAY': [0.16], 'BATTERY': [0.0, 0.77]}
Run Code Online (Sandbox Code Playgroud) WebDataRock 类型错误:无法读取 nul 的属性“元素”和 WebDataRocks:无法绘制枢轴。
问候。
我尝试在我的 react-app 项目中实现 WebDataRocks,我可以实现 WebDataRock.Pivot 组件,但是自从开始渲染组件后,控制台会打印此消息
webdatarocks.js:180 未捕获的类型错误:无法在 webdatarocks.js:992 处的 b.setControls (webdatarocks.js:1006) 处读取 new e (webdatarocks.js:180) 处的 null 属性“元素”
几秒钟后,控制台打印:
index.js:1 WebDataRocks:无法绘制枢轴。
import React from "react";
import ReactDOM from "react-dom";
import WebDataRocks from "webdatarocks";
export class Pivot extends React.Component<WebDataRocks.Params, any> {
webdatarocks: WebDataRocks.Pivot;
componentDidMount() {
const tempProps : any = this.props;
const pivotData = tempProps.pivotData;
const columnsData : any[] = tempProps.columnsData;
const tempColums = [];
const tempKeys = [];
columnsData.forEach(cd => {
const tempLabelColumn …Run Code Online (Sandbox Code Playgroud) data-analysis ×10
python ×7
matplotlib ×3
pandas ×3
dataframe ×2
scikit-learn ×2
aggregation ×1
dictionary ×1
histogram ×1
javascript ×1
list ×1
numpy ×1
plot ×1
python-3.x ×1
r ×1
reactjs ×1
webdatarocks ×1