我在对文件进行一些编辑后尝试将csv保存到文件夹中.
每次我使用pd.to_csv('C:/Path of file.csv')csv文件都有一个单独的索引列.我想避免将索引打印到csv.
我试过了:
pd.read_csv('C:/Path to file to edit.csv', index_col = False)
Run Code Online (Sandbox Code Playgroud)
并保存文件...
pd.to_csv('C:/Path to save edited file.csv', index_col = False)
Run Code Online (Sandbox Code Playgroud)
但是,我仍然得到了不需要的索引列.保存文件时如何避免这种情况?
我试图将变量设置为等于今天的日期.
我查了一下,发现了一篇相关的文章:
但是,这并没有特别回答我的问题.
我使用了建议:
dt.date.today
Run Code Online (Sandbox Code Playgroud)
但是之后
import datetime as dt
date = dt.date.today
print date
<built-in method today of type object at 0x000000001E2658B0>
Df['Date'] = date
Run Code Online (Sandbox Code Playgroud)
我没有得到我真正想要的东西作为今天日期的干净日期格式......月/日/年.
如何创建今天的变量以便我在DataFrame中输入该变量?
我有一个数据框,我想删除其中的所有括号和内容.
我检查了: 如何使用正则表达式删除括号内的文本?
删除数据的答案是
re.sub(r'\([^)]*\)', '', filename)
Run Code Online (Sandbox Code Playgroud)
我试过这个以及
re.sub(r'\(.*?\)', '', filename)
Run Code Online (Sandbox Code Playgroud)
但是,我收到了一个错误: expected a string or buffer
当我尝试使用df['Column Name']我得到的列no item named 'Column Name'
我检查了数据框使用df.head(),它显示为一个干净的表,列名称是我想要的...但是当我使用re表达式删除(东西)时,它不识别我的列名称有.
我通常使用
df['name'].str.replace(" ()","")
Run Code Online (Sandbox Code Playgroud)
但是,我想删除括号和内部的内容....如何使用正则表达式或pandas执行此操作?
谢谢!
这是我用过的解决方案......感谢您的帮助!
All['Manufacturer Standard Name'] = All['Manufacturer Standard Name'].str.replace(r"\(.*\)","")
Run Code Online (Sandbox Code Playgroud) 我想基本上使用python查找和替换。
但是,我想说如果一个单元格包含某些内容,则替换为我想要的内容。
我知道
str.replace('safsd','something else')
Run Code Online (Sandbox Code Playgroud)
但是,我不确定如何指定如何摆脱该单元格中的所有内容。我用*吗?我对 python 不太熟悉,但我知道在 bash shell*中对所有内容的引用......
我有
df['Description']
Run Code Online (Sandbox Code Playgroud)
可以包含'optiplex 9010 for classes and research'我只想替换为'optiplex 9010'. 或者'macbook air 11 with configurations...etc.'我只想'macbook air 11'
我的目标是...
if Df['Description'].str.contains('macbook air 11')
then Df['Description'].str.replace(' (not sure what I put in here) , 'mabook air 11')
Run Code Online (Sandbox Code Playgroud)
任何帮助/想法?
谢谢!
**可能有用的其他信息...
我正在处理数千种不同的用户输入。因此,某人购买的“描述”在上下文、措辞、结构等方面完全不同。我可以手动进入 excel 并按包含“optiplex 9010”的内容进行过滤,然后替换所有内容用简单的描述,对 macbook 等做同样的事情。
我认为使用 pandas/python .str.contains 和 .str.replace 可能有一些更简单的方法。
希望额外的信息有帮助!让我知道
嘿所以我已经看到了几个关于这个的问题,但是,我还没有成功解决我的问题。
我有一个格式的单列时间:
2014-07-17 00:59:27.400189+00
我想把它分成两列,日期和小时。
我用了
posts['Date']=pd.to_datetime(posts['Time'],format='%Y-%m-%d %H:%M:%S')
Run Code Online (Sandbox Code Playgroud)
但是,我收到一个错误
ValueError: unconverted data remains: 400189+00
Run Code Online (Sandbox Code Playgroud)
我不确定最后一点信息要标记什么。我尝试添加 %o 但收到另一个错误
ValueError: 'o' is a bad directive in format '%Y-%m-%d %H:%M:%S.%o'
Run Code Online (Sandbox Code Playgroud)
关于如何将这两个值分成两列的任何想法?
谢谢!