小编Ale*_*xis的帖子

如何避免Python/Pandas在保存的csv中创建索引?

我在对文件进行一些编辑后尝试将csv保存到文件夹中.

每次我使用pd.to_csv('C:/Path of file.csv')csv文件都有一个单独的索引列.我想避免将索引打印到csv.

我试过了:

pd.read_csv('C:/Path to file to edit.csv', index_col = False)
Run Code Online (Sandbox Code Playgroud)

并保存文件...

pd.to_csv('C:/Path to save edited file.csv', index_col = False)
Run Code Online (Sandbox Code Playgroud)

但是,我仍然得到了不需要的索引列.保存文件时如何避免这种情况?

python csv indexing pandas

339
推荐指数
6
解决办法
24万
查看次数

如何在Python/Pandas中将变量设置为"今天"日期

我试图将变量设置为等于今天的日期.

我查了一下,发现了一篇相关的文章:

将今天日期设置为模型中的默认值

但是,这并没有特别回答我的问题.

我使用了建议:

dt.date.today
Run Code Online (Sandbox Code Playgroud)

但是之后

import datetime as dt     
date = dt.date.today
print date
 <built-in method today of type object at 0x000000001E2658B0>

 Df['Date'] = date
Run Code Online (Sandbox Code Playgroud)

我没有得到我真正想要的东西作为今天日期的干净日期格式......月/日/年.

如何创建今天的变量以便我在DataFrame中输入该变量?

python formatting datetime date pandas

32
推荐指数
5
解决办法
10万
查看次数

如何使用Pandas/Python删除括号和所有数据?

我有一个数据框,我想删除其中的所有括号和内容.

我检查了: 如何使用正则表达式删除括号内的文本?

删除数据的答案是

re.sub(r'\([^)]*\)', '', filename)
Run Code Online (Sandbox Code Playgroud)

我试过这个以及

re.sub(r'\(.*?\)', '', filename)
Run Code Online (Sandbox Code Playgroud)

但是,我收到了一个错误: expected a string or buffer

当我尝试使用df['Column Name']我得到的列no item named 'Column Name'

我检查了数据框使用df.head(),它显示为一个干净的表,列名称是我想要的...但是当我使用re表达式删除(东西)时,它不识别我的列名称有.

我通常使用

df['name'].str.replace(" ()","") 
Run Code Online (Sandbox Code Playgroud)

但是,我想删除括号和内部的内容....如何使用正则表达式或pandas执行此操作?

谢谢!

这是我用过的解决方案......感谢您的帮助!

All['Manufacturer Standard Name'] = All['Manufacturer Standard Name'].str.replace(r"\(.*\)","")
Run Code Online (Sandbox Code Playgroud)

python regex removeall pandas

26
推荐指数
3
解决办法
4万
查看次数

如何用 Pandas,Python 中的几个指定单词替换系列中的所有单词?

我想基本上使用python查找和替换。

但是,我想说如果一个单元格包含某些内容,则替换为我想要的内容。

我知道

str.replace('safsd','something else')
Run Code Online (Sandbox Code Playgroud)

但是,我不确定如何指定如何摆脱该单元格中的所有内容。我用*吗?我对 python 不太熟悉,但我知道在 bash shell*中对所有内容的引用......

我有

df['Description'] 
Run Code Online (Sandbox Code Playgroud)

可以包含'optiplex 9010 for classes and research'我只想替换为'optiplex 9010'. 或者'macbook air 11 with configurations...etc.'我只想'macbook air 11'

我的目标是...

if  Df['Description'].str.contains('macbook air 11')
  then Df['Description'].str.replace(' (not sure what I put in here) , 'mabook air 11')
Run Code Online (Sandbox Code Playgroud)

任何帮助/想法?

谢谢!

**可能有用的其他信息...

我正在处理数千种不同的用户输入。因此,某人购买的“描述”在上下文、措辞、结构等方面完全不同。我可以手动进入 excel 并按包含“optiplex 9010”的内容进行过滤,然后替换所有内容用简单的描述,对 macbook 等做同样的事情。

我认为使用 pandas/python .str.contains 和 .str.replace 可能有一些更简单的方法。

希望额外的信息有帮助!让我知道

python string replace pandas

4
推荐指数
1
解决办法
7202
查看次数

将日期时间列拆分为日期和时间 Python

嘿所以我已经看到了几个关于这个的问题,但是,我还没有成功解决我的问题。

我有一个格式的单列时间:

2014-07-17 00:59:27.400189+00

我想把它分成两列,日期和小时。

我用了

 posts['Date']=pd.to_datetime(posts['Time'],format='%Y-%m-%d %H:%M:%S')
Run Code Online (Sandbox Code Playgroud)

但是,我收到一个错误

 ValueError: unconverted data remains: 400189+00
Run Code Online (Sandbox Code Playgroud)

我不确定最后一点信息要标记什么。我尝试添加 %o 但收到另一个错误

 ValueError: 'o' is a bad directive in format '%Y-%m-%d %H:%M:%S.%o'
Run Code Online (Sandbox Code Playgroud)

关于如何将这两个值分成两列的任何想法?

谢谢!

python datetime split pandas

3
推荐指数
1
解决办法
2万
查看次数

标签 统计

pandas ×5

python ×5

datetime ×2

csv ×1

date ×1

formatting ×1

indexing ×1

regex ×1

removeall ×1

replace ×1

split ×1

string ×1