小编ben*_*nsw的帖子

Python Pandas:如何只读取前n行的CSV文件?

我有一个非常大的数据集,我无法读取整个数据集.所以,我想只读一部分进行训练,但我不知道该怎么做.任何想法将不胜感激.

python csv file-io pandas

57
推荐指数
1
解决办法
6万
查看次数

Pandas-日期时间的累计总和并每天重新开始

假设我有这个数据框。

    import pandas as pd
    data = {"Date_Time": ["2018-08-14 02:00:00", "2018-08-14 01:00:00", "2018-08-14 00:00:00", "2018-08-13 23:00:00", "2018-08-13 22:00:00", "2018-08-13 21:00:00", "2018-08-13 20:00:00"], 
        "Date": ["2018-08-14", "2018-08-14", "2018-08-14", "2018-08-13", "2018-08-13", "2018-08-13", "2018-08-13"], 
        "Duration":[3, 0, 0, 10, 2, 20, 1], 
        "value":[4, 3, 2, 1, 0, 23, 22],
        "Remark":["e", "o", "k", "x", "c", "z", "a"]
       }
    df = pd.DataFrame.from_dict(data)
    df

    Date_Time                 Date    Duration  value   Remark
0   2018-08-14 02:00:00     2018-08-14    3       4     e
1   2018-08-14 01:00:00     2018-08-14    0       3     o
2   2018-08-14 00:00:00     2018-08-14    0 …
Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

7
推荐指数
1
解决办法
1万
查看次数

在Jupyter笔记本中调整Julia内核中的绘图大小

我想知道是否可以通过任何方式在Jupyter中指定内联图的大小。目前,我使用Vega库,宽度和高度不起作用。有任何解决方法。

julia vega ijulia-notebook jupyter-notebook

5
推荐指数
1
解决办法
594
查看次数

Python:选择最常用的group by

如何在Python中获取每个标记最常出现的类别(模式)?

+------------------+----------+
| tag              | category |
+------------------+----------+
| automotive       |        8 |
| ba               |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |        8 |
| bamboo           |       10 |
| bamboo           |        8 |
| bamboo           |        9 |
| bamboo           |        8 |
| bamboo           |       10 |
| bamboo           |        8 |
| bamboo           |        9 |
| bamboo …
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
1
解决办法
7269
查看次数

在Julia的DataFrame中将列类型从String转换为Int

我想将Julia中的列数据类型从字符串更改为int但到目前为止没有运气.既不工作convert()也不parse()工作.有没有办法做到这一点?

我尝试了这些但没有效果

df[:serial] = int.(collect(df[:strSerial])) df[:serial] = map(x->parse(Int,x),df[:strSerial]) df[:serial] = Int64(df[:strSerial])

dataframe julia

3
推荐指数
1
解决办法
1925
查看次数

如何使用 d3.csv() 检查 CSV 中的值类型?

我想知道在 D3 或纯 JavaScript 中是否有任何方法可以在我读入数据时即时检查数据类型。

例如,如果我想读“iris.csv”使用d3.csv()做一个箱线图,有没有什么办法来检查sepal_lengthsepal_widthpetal_lengthpetal_width是数值变量,同时species是一个分类变量?

javascript csv d3.js

3
推荐指数
1
解决办法
1625
查看次数

如何将数据从Google存储云读取到Google云数据库

我在Google存储空间中存储了一些CSV文件,我想将这些文件读入Google datalab.到目前为止,我不知道该怎么做.我找到了这个,并按照第一个答案,但没有工作和提出

  File "<ipython-input-1-5e9607fa3f65>", line 5
    %%gcs read --object $data_csv --variable data
    ^
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激.

python csv google-cloud-storage google-cloud-datalab

3
推荐指数
1
解决办法
3707
查看次数

熊猫-从日期时间中提取日期,如果时间超过某个小时,则提取一天

假设我有这个数据框。

import pandas as pd
data = {"Date": ["2018-08-05", "2018-08-05", "2018-08-05", "2018-08-05", "2018-08-06"],  
        "Time_End":["2018-08-05 13:50:00", "2018-08-05 14:26:00", "2018-08-05 17:30:00", "2018-08-05 17:10:00", "2018-08-06 11:23:00"],
        "Reason":["blah1", "blah2", "blah3", "blah4", "blah5"]
       }
df = pd.DataFrame.from_dict(data)
df

        Date             Time_End          Reason
0   2018-08-05      2018-08-05 13:50:00     blah1
1   2018-08-05      2018-08-05 14:26:00     blah2
2   2018-08-05      2018-08-05 17:30:00     blah3
3   2018-08-05      2018-08-05 17:10:00     blah4
4   2018-08-06      2018-08-06 11:23:00     blah5
Run Code Online (Sandbox Code Playgroud)

我只想从“ Time_End”中提取日期到名为“ Birth_date”的新列中。但是,我也想检查时间是否过了17:00。如果是这样,提取的日期将加一成为第二天。下面显示了所需的输出。

    Date        Birth_date      Time_End            Reason
0   2018-08-05  2018-08-05  2018-08-05 13:50:00     blah1
1   2018-08-05  2018-08-05  2018-08-05 14:26:00     blah2 …
Run Code Online (Sandbox Code Playgroud)

python datetime pandas

2
推荐指数
1
解决办法
96
查看次数

PostgreSQL 删除没有 id 或 unique_key 的重复项

我想知道如何删除表中完全重复的行并只保留一个。例如这张桌子。

在此处输入图片说明

在此处输入图片说明

我读过的大多数线程都已使用idunique_key在这种情况下我没有使用。

编辑:当我说remove我的意思delete是表中的那些记录时,我又没有 id 来引用以创建条件以保留一条记录。对困惑感到抱歉。

先感谢您。

这可能是与其他线程相同的问题。但是,他们未能解释 fa06 成功提供的 ctid 是什么。所以,我会说我问的是使用相同的词但不同的问题。请删除“标记重复”。谢谢。

postgresql duplicates sql-delete

1
推荐指数
1
解决办法
1963
查看次数