小编use*_*204的帖子

如何将列转换为pandas中的一个日期时间列?

我有一个数据框,前3列是'MONTH','DAY','YEAR'

在每列中都有一个整数.在数据帧中有没有Pythonic方法将所有三列转换为日期时间?

从:

M    D    Y    Apples   Oranges
5    6  1990      12        3
5    7  1990      14        4
5    8  1990      15       34
5    9  1990      23       21
Run Code Online (Sandbox Code Playgroud)

成:

Datetimes    Apples   Oranges
1990-6-5        12        3
1990-7-5        14        4
1990-8-5        15       34
1990-9-5        23       21
Run Code Online (Sandbox Code Playgroud)

datetime python-2.7 pandas

45
推荐指数
4
解决办法
6万
查看次数

为什么conda创建尝试安装奇怪的包?

我正在尝试安装一个与我的其他环境完全分离的新conda环境,所以我运行:

conda create --name foot35 python=3.5
Run Code Online (Sandbox Code Playgroud)

然后Anaconda要求我批准安装这些新包:

asn1crypto:      0.22.0-py35he3634b9_1
ca-certificates: 2017.08.26-h94faf87_0
cachecontrol:    0.12.3-py35h3f82863_0
certifi:         2017.7.27.1-py35hbab57cd_0
cffi:            1.10.0-py35h4132a7f_1
chardet:         3.0.4-py35h177e1b7_1
colorama:        0.3.9-py35h32a752f_0
cryptography:    2.0.3-py35h67a4558_1
distlib:         0.2.5-py35h12c42d7_0
html5lib:        0.999999999-py35h79d4e7f_0
idna:            2.6-py35h8dcb9ae_1
lockfile:        0.12.2-py35h667c6d9_0
msgpack-python:  0.4.8-py35hdef45cb_0
openssl:         1.0.2l-vc14hcac20b0_2      [vc14]
packaging:       16.8-py35h5fb721f_1
pip:             9.0.1-py35h69293b5_3
progress:        1.3-py35ha84af61_0
pycparser:       2.18-py35h15a15da_1
pyopenssl:       17.2.0-py35hea705d1_0
pyparsing:       2.2.0-py35hcabcaab_1
pysocks:         1.6.7-py35hb30ac0d_1
python:          3.5.4-hedc2606_15
requests:        2.18.4-py35h54a615f_1
setuptools:      36.5.0-py35h21a22e4_0
six:             1.10.0-py35h06cf344_1
urllib3:         1.22-py35h8cc84eb_0
vc:              14-h2379b0c_1
vs2015_runtime:  14.0.25123-hd4c4e62_1
webencodings:    0.5.1-py35h5d527fb_1
wheel:           0.29.0-py35hdbcb6e6_1
win_inet_pton:   1.0.1-py35hbef1270_1
wincertstore:    0.2-py35hfebbdb8_0
Run Code Online (Sandbox Code Playgroud)

我不知道为什么它会暗示这些特定的.我了一下lockfile,它的网站说:

注意:不推荐使用此包.

以下是我的命令提示符的屏幕截图作为附加信息. …

python pip virtualenv anaconda conda

18
推荐指数
2
解决办法
1248
查看次数

Pandas Dataframe ValueError:传递值的形状是(X,),索引暗示(X,Y)

我收到错误,我不知道如何解决它.

以下似乎有效:

def random(row):
   return [1,2,3,4]

df = pandas.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))

df.apply(func = random, axis = 1)
Run Code Online (Sandbox Code Playgroud)

我的输出是:

[1,2,3,4]
[1,2,3,4]
[1,2,3,4]
[1,2,3,4]
Run Code Online (Sandbox Code Playgroud)

但是,当我将其中一列更改为1或None之类的值时:

def random(row):
   return [1,2,3,4]

df = pandas.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))
df['E'] = 1

df.apply(func = random, axis = 1)
Run Code Online (Sandbox Code Playgroud)

我得到了错误:

ValueError: Shape of passed values is (5,), indices imply (5, 5)
Run Code Online (Sandbox Code Playgroud)

我已经在这几天摔跤了,似乎什么都没有用.有趣的是,当我改变时

def random(row):
   return [1,2,3,4]
Run Code Online (Sandbox Code Playgroud)

def random(row):
   print [1,2,3,4]
Run Code Online (Sandbox Code Playgroud)

一切似乎都正常.

这个问题是一个更清楚的方式来提出这个问题,我觉得这个问题可能令人困惑.

我的目标是为每一行计算一个列表,然后创建一个列.

编辑:我最初从一个拥有一列的数据框开始.我在4个不同的应用步骤中添加4列,然后当我尝试添加另一列时,我收到此错误.

ipython dataframe python-2.7 pandas

17
推荐指数
1
解决办法
4万
查看次数

如何将.sql文件的内容读入R脚本以运行查询?

我已经尝试了readLinesread.csv功能,但后来没有工作.

这是my_script.sql文件的内容:

SELECT EmployeeID, FirstName, LastName, HireDate, City FROM Employees
WHERE HireDate >= '1-july-1993'
Run Code Online (Sandbox Code Playgroud)

它保存在我的桌面上.

现在我想从我的R脚本运行此查询.这是我有的:

conn = connectDb()

fileName <- "C:\\Users\\me\\Desktop\\my_script.sql"
query <- readChar(fileName, file.info(fileName)$size)

query <- gsub("\r", " ", query)
query <- gsub("\n", " ", query)
query <- gsub("", " ", query)

recordSet <- dbSendQuery(conn, query)
rate <- fetch(recordSet, n = -1)

print(rate)
disconnectDb(conn)
Run Code Online (Sandbox Code Playgroud)

在这种情况下,我没有得到任何回报.我该怎么办?

sql postgresql r

16
推荐指数
4
解决办法
2万
查看次数

Pandas DataFrame:如何在行和列的范围内本地获得最小值

我有一个类似于此的Pandas DataFrame,但有10,000行和500列.

我的数据帧

对于每一行,我想找到3天前15:00和今天13:30之间的最小值.

是否有一些本地的numpy方式快速做到这一点?我的目标是能够通过说出"3天前15:00到0天前(又名今天)13:30的最小值是什么来获得每行的最小值?"

对于这个特定的例子,最后两行的答案是:

2011-01-09 2481.22
2011-01-10 2481.22
Run Code Online (Sandbox Code Playgroud)

我目前的方式是这样的:

1. Get the earliest row (only the values after the start time)
2. Get the middle rows 
3. Get the last row (only the values before the end time)
4. Concat (1), (2), and (3)
5. Get the minimum of (4)
Run Code Online (Sandbox Code Playgroud)

但是在大型DataFrame上需要很长时间


以下代码将生成类似的DF:

import numpy
import pandas
import datetime

numpy.random.seed(0)

random_numbers = (numpy.random.rand(10, 8)*100 + 2000)
columns        = [datetime.time(13,0) , datetime.time(13,30), datetime.time(14,0), datetime.time(14,30) , datetime.time(15,0), datetime.time(15,30) ,datetime.time(16,0), datetime.time(16,30)] 
index          = …
Run Code Online (Sandbox Code Playgroud)

python arrays numpy dataframe pandas

14
推荐指数
4
解决办法
1937
查看次数

有没有办法让Keras变得重要?

我正在寻找一种在使用Keras创建的神经网络中获得变量重要性的正确或最佳方法.我目前这样做的方式是我只考虑第一层中变量的权重(而不是偏差),假设更重要的变量在第一层中具有更高的权重.有没有其他/更好的方法呢?

deep-learning keras tensorflow keras-layer keras-2

11
推荐指数
4
解决办法
1万
查看次数

Python:如何使用shutil.make_archive?

我不知道如何使用shutil.make_archive将文件夹压缩为 zip 文件,然后将该saved_20170721.zip文件放入名为的文件夹中past_data

我有代码:

from shutil   import make_archive
from datetime import datetime

folderpath_to_zip_up = 'c:\my_work\todays_data'                    # I wanna zip up this folder
folderpath_archive   = 'c:\past_data'                              # And put it into here as file
filename             = 'saved_{:%Y-%m-%d}'.format(datetime.now())    

make_archive(filename, 'zip', folderpath_archive, folderpath_to_zip_up)
Run Code Online (Sandbox Code Playgroud)

我的目标是'c:\past_data'看起来像:

past_data---+ saved_20170721.zip
            + saved_20170722.zip
            + saved_20170723.zip
            + saved_20170724.zip
Run Code Online (Sandbox Code Playgroud)

但我无法理解文档,并且不断得到奇怪的结果。

python zip shutil

9
推荐指数
1
解决办法
2万
查看次数

What should I do about this gsutil "parallel composite upload" warning?

I am running a python script and using the os library to execute a gsutil command, which is typically executed in the command prompt on Windows. I have some file on my local computer and I want to put it into a Google Bucket so I do:

import os

command = 'gsutil -m cp myfile.csv  gs://my/bucket/myfile.csv'
os.system(command)
Run Code Online (Sandbox Code Playgroud)

I get a message like:

==> NOTE: You are uploading one or more large file(s), which would run significantly faster if you enable …

python gsutil

8
推荐指数
2
解决办法
8723
查看次数

如何摆脱"设置"JAVA_HOME_CONDA_BACKUP =""消息?

每次我在Windows上启动命令提示符然后激活我的conda环境时,我收到两条消息:

C:\Users\texas_cactus>set "JAVA_HOME_CONDA_BACKUP="
Run Code Online (Sandbox Code Playgroud)

C:\Users\texas_cactus>set "JAVA_HOME=C:\Users\texas_cactus\AppData\Local\Continuum\anaconda3\envs\tc35\Library"
Run Code Online (Sandbox Code Playgroud)

这些消息来自何处以及如何摆脱它们?谷歌不是我的朋友.

anaconda conda jupyter jupyter-notebook

8
推荐指数
1
解决办法
691
查看次数

如何保持前导零并在openoffice calc公式中添加逗号?

我在开放式办公室连续6个字段,第1个是单词,第2个,第3个和第4个是前导零的数字,第5个和第6个是常规数字.我如何将它们加在一起,并在它们之间用逗号连接,以便保持领先的零点?

openoffice-calc openoffice-basic

6
推荐指数
1
解决办法
9905
查看次数