小编ben*_*nsw的帖子

Python Pandas:如何只读取前n行的CSV文件？

我有一个非常大的数据集,我无法读取整个数据集.所以,我想只读一部分进行训练,但我不知道该怎么做.任何想法将不胜感激.

python csv file-io pandas

ben*_*nsw

2018 04-11

57
推荐指数

1
解决办法

6万
查看次数

Pandas-日期时间的累计总和并每天重新开始

假设我有这个数据框。

    import pandas as pd
    data = {"Date_Time": ["2018-08-14 02:00:00", "2018-08-14 01:00:00", "2018-08-14 00:00:00", "2018-08-13 23:00:00", "2018-08-13 22:00:00", "2018-08-13 21:00:00", "2018-08-13 20:00:00"], 
        "Date": ["2018-08-14", "2018-08-14", "2018-08-14", "2018-08-13", "2018-08-13", "2018-08-13", "2018-08-13"], 
        "Duration":[3, 0, 0, 10, 2, 20, 1], 
        "value":[4, 3, 2, 1, 0, 23, 22],
        "Remark":["e", "o", "k", "x", "c", "z", "a"]
       }
    df = pd.DataFrame.from_dict(data)
    df

    Date_Time                 Date    Duration  value   Remark
0   2018-08-14 02:00:00     2018-08-14    3       4     e
1   2018-08-14 01:00:00     2018-08-14    0       3     o
2   2018-08-14 00:00:00     2018-08-14    0 …

Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

ben*_*nsw

2019 02-18

7
推荐指数

1
解决办法

1万
查看次数

在Jupyter笔记本中调整Julia内核中的绘图大小

我想知道是否可以通过任何方式在Jupyter中指定内联图的大小。目前，我使用Vega库，宽度和高度不起作用。有任何解决方法。

julia vega ijulia-notebook jupyter-notebook

ben*_*nsw

2017 05-03

5
推荐指数

1
解决办法

594
查看次数

Python:选择最常用的group by

如何在Python中获取每个标记最常出现的类别(模式)？

+------------------+----------+
| tag              | category |
+------------------+----------+
| automotive       |        8 |
| ba               |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |       10 |
| bamboo           |        8 |
| bamboo           |        9 |
| bamboo           |        8 |
| bamboo           |       10 |
| bamboo           |        8 |
| bamboo           |        9 |
| bamboo …

Run Code Online (Sandbox Code Playgroud)

python pandas

ben*_*nsw

2017 05-23

4
推荐指数

1
解决办法

7269
查看次数

在Julia的DataFrame中将列类型从String转换为Int

我想将Julia中的列数据类型从字符串更改为int但到目前为止没有运气.既不工作convert()也不parse()工作.有没有办法做到这一点？

我尝试了这些但没有效果

df[:serial] = int.(collect(df[:strSerial])) df[:serial] = map(x->parse(Int,x),df[:strSerial]) df[:serial] = Int64(df[:strSerial])

dataframe julia

ben*_*nsw

2017 05-04

3
推荐指数

1
解决办法

1925
查看次数

如何使用 d3.csv() 检查 CSV 中的值类型？

我想知道在 D3 或纯 JavaScript 中是否有任何方法可以在我读入数据时即时检查数据类型。

例如，如果我想读“iris.csv”使用d3.csv（）做一个箱线图，有没有什么办法来检查sepal_length，sepal_width，petal_length和petal_width是数值变量，同时species是一个分类变量？

javascript csv d3.js

ben*_*nsw

2018 01-09

3
推荐指数

1
解决办法

1625
查看次数

如何将数据从Google存储云读取到Google云数据库

我在Google存储空间中存储了一些CSV文件,我想将这些文件读入Google datalab.到目前为止,我不知道该怎么做.我找到了这个,并按照第一个答案,但没有工作和提出

  File "<ipython-input-1-5e9607fa3f65>", line 5
    %%gcs read --object $data_csv --variable data
    ^
SyntaxError: invalid syntax

Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激.

python csv google-cloud-storage google-cloud-datalab

ben*_*nsw

lucky-day

3
推荐指数

1
解决办法

3707
查看次数

熊猫-从日期时间中提取日期，如果时间超过某个小时，则提取一天

假设我有这个数据框。

import pandas as pd
data = {"Date": ["2018-08-05", "2018-08-05", "2018-08-05", "2018-08-05", "2018-08-06"],  
        "Time_End":["2018-08-05 13:50:00", "2018-08-05 14:26:00", "2018-08-05 17:30:00", "2018-08-05 17:10:00", "2018-08-06 11:23:00"],
        "Reason":["blah1", "blah2", "blah3", "blah4", "blah5"]
       }
df = pd.DataFrame.from_dict(data)
df

        Date             Time_End          Reason
0   2018-08-05      2018-08-05 13:50:00     blah1
1   2018-08-05      2018-08-05 14:26:00     blah2
2   2018-08-05      2018-08-05 17:30:00     blah3
3   2018-08-05      2018-08-05 17:10:00     blah4
4   2018-08-06      2018-08-06 11:23:00     blah5

Run Code Online (Sandbox Code Playgroud)

我只想从“ Time_End”中提取日期到名为“ Birth_date”的新列中。但是，我也想检查时间是否过了17:00。如果是这样，提取的日期将加一成为第二天。下面显示了所需的输出。

    Date        Birth_date      Time_End            Reason
0   2018-08-05  2018-08-05  2018-08-05 13:50:00     blah1
1   2018-08-05  2018-08-05  2018-08-05 14:26:00     blah2 …

Run Code Online (Sandbox Code Playgroud)

python datetime pandas

ben*_*nsw

2018 08-09

2
推荐指数

1
解决办法

96
查看次数