小编Vin*_*ent的帖子

如何从终端运行.ipynb Jupyter笔记本?

我在.ipynb文件中有一些代码,并且我不需要IPython Notebook的"交互"功能.我想直接从Mac终端命令行运行它.

基本上,如果这只是一个.py文件,我相信我可以从命令行执行python filename.py..ipynb文件有类似的东西吗?

python ipython jupyter-notebook nbconvert

130
推荐指数
11
解决办法
17万
查看次数

在Pandas中创建空数据框,指定列类型

我正在尝试使用索引创建一个空数据框并指定列类型.我这样做的方式如下:

df = pd.DataFrame(index=['pbp'],columns=['contract',
                                         'state_and_county_code',
                                         'state',
                                         'county',
                                         'starting_membership',
                                         'starting_raw_raf',
                                         'enrollment_trend',
                                         'projected_membership',
                                         'projected_raf'],
                                dtype=['str', 'str', 'str', 'str', 'int', 'float', 'float', 'int', 'float'])
Run Code Online (Sandbox Code Playgroud)

但是,我收到以下错误,

TypeError: data type not understood
Run Code Online (Sandbox Code Playgroud)

这是什么意思?

python pandas

46
推荐指数
8
解决办法
4万
查看次数

在R中读取pickle文件(PANDAS Python Data Frame)

有没有一种简单的方法可以将Pandas Dataframe中的pickle文件(.pkl)读入R?

一种可能性是导出到CSV并让R读取CSV,但这对我来说似乎非常麻烦,因为我的数据帧相当大.有更简单的方法吗?

谢谢!

python r dataframe pandas

20
推荐指数
3
解决办法
2万
查看次数

如何将日期转换为Google表格中的字符串

我试图弄清楚如何将日期转换为谷歌表中的字符串.

我有一个具有不同格式的日期字段.我想创建另一个列,它实际上只是相同但作为文本.例如,如果我有以下数据

date       date_as_string
12-05-2016 '12-05-2016
12/5/2016  '12/5/2016
2016-12-10 '2016-12-10
Run Code Online (Sandbox Code Playgroud)

'只是表示它是一个字符串注释日期.

google-sheets

19
推荐指数
5
解决办法
3万
查看次数

将图像作为Tensorflow数据集加载到目录中

我对ML相对较新,对TensorfFlow来说非常新.我花了很多时间在TensorFlow MINST教程以及https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/how_tos/reading_data上试着弄清楚如何阅读我自己的数据,但我有点困惑.

我在目录/ images/0_Non /中有一堆图像(.png).我正在尝试将它们变成TensorFlow数据集,这样我就可以基本上从MINST教程中运行它作为第一遍.

import tensorflow as tf

# Make a queue of file names including all the JPEG images files in the relative image directory.
filename_queue = tf.train.string_input_producer(tf.train.match_filenames_once("../images/0_Non/*.png"))

image_reader = tf.WholeFileReader()

# Read a whole file from the queue, the first returned value in the tuple is the filename which we are ignoring.
_, image_file = image_reader.read(filename_queue)

image = tf.image.decode_png(image_file)

# Start a new session to show example output.
with tf.Session() as sess:
    # Required to …
Run Code Online (Sandbox Code Playgroud)

python tensorflow

10
推荐指数
1
解决办法
5405
查看次数

10
推荐指数
2
解决办法
3697
查看次数

什么是字典和abc.Mapping从集合做什么?

我正在运行的代码是:

>>> from collections import abc
>>> mydict = {'test_key': 'test_value'}
>>> isinstance(mydict, abc.Mapping)
True
Run Code Online (Sandbox Code Playgroud)

我明白了什么isinstance呢,但我不知道是什么abc.Mapping的呢collections

好像这条线isinstance(mydict, abc.Mapping)被用来检查那mydict是一本字典?

这不是更容易 isinstance(mydict, dict)吗?

我做了一些搜索并在这个帖子中找到了相关的注释:检查Python变量类型的最佳(惯用)方法是什么?,但我仍然无法弄清楚为什么abc.Mapping在这里使用比使用更好dict.

python dictionary

8
推荐指数
3
解决办法
4774
查看次数

Pandas融合多指标列而无需手动指定级别(Python 3.5.1)

我有一个Pandas DataFrame看起来像:

df = pd.DataFrame({'col1': {0: 'a', 1: 'b', 2: 'c'},
                   'col2': {0: 1, 1: 3, 2: 5},
                   'col3': {0: 2, 1: 4, 2: 6},
                   'col4': {0: 3, 1: 6, 2: 2},
                   'col5': {0: 7, 1: 2, 2: 3},
                   'col6': {0: 2, 1: 9, 2: 5},
                  })
df.columns = [list('AAAAAA'), list('BBCCDD'), list('EFGHIJ')]


    A
    B       C       D
    E   F   G   H   I   J
0   a   1   2   3   7   2
1   b   3   4   6   2   9
2   c   5   6 …
Run Code Online (Sandbox Code Playgroud)

python pandas

7
推荐指数
1
解决办法
5164
查看次数

使用date_trunc(Postgres 9.5.1)以默认选项以外的单位截断日期

我想知道除了使用date_trunc使用默认选项之外是否可以截断日期.例如,如果我有一个看起来像这样的表

date            dollars
2016-10-03        1
2016-10-05        1
2016-10-10        1
2016-10-17        2
2016-10-24        2
Run Code Online (Sandbox Code Playgroud)

并说我想在每个"双周"期间截断和分组(所以在这个例子中,两个时间段,一个从2016-10-03开始,另一个从2016-10-17开始).

我希望结果如此

date            dollars
2016-10-03        3
2016-10-17        4
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?我知道,如果我想每两周做一次,date_trunc我可以做些什么date_trunc('week', date)呢?或者如果我想使用其他一些自定义日期范围怎么办?

postgresql

7
推荐指数
1
解决办法
418
查看次数

Pandas 中的块引导采样

我正在尝试在 Pandas 中实现块引导。

例如,假设我的 DataFrame 看起来像这样:

df = pd.DataFrame({
    'personid': [1, 1, 1, 2, 2, 3, 3, 3, 3],
    'month': ['Jan', 'Feb', 'Mar', 'Aug', 'Sep', 'Mar', 'Apr', 'May', 'Jun'],
    'values': [100, 200, 300, 400, 500, 600, 700, 800, 900],
})

df
     month  personid value
0    Jan    1        100
1    Feb    1        200
2    Mar    1        300
3    Aug    2        400
4    Sep    2        500
5    Mar    3        600
6    Apr    3        700
7    May    3        800
8    Jun    3        900 …
Run Code Online (Sandbox Code Playgroud)

python pandas

7
推荐指数
1
解决办法
3004
查看次数