我想在Jupyter(Ipython Notebook)中注释掉多行的块,但是在当前版本中无法找到如何做到这一点.
它曾经是一个下拉菜单,但不再存在.
你如何一次注释多行代码块?
这不是重复的,因为以下链接中给出的解决方案似乎不再起作用:
如何在IPython笔记本中阻止注释代码?
Ctrl+ /什么都不做.
我试图在Ipython Notebook中使用pandas绘制一些数据,虽然它给了我对象,但它实际上并没有绘制图形本身.所以它看起来像这样:
In [7]:
pledge.Amount.plot()
Out[7]:
<matplotlib.axes.AxesSubplot at 0x9397c6c>
Run Code Online (Sandbox Code Playgroud)
之后图表应该遵循,但它根本不会出现.我已经导入了matplotlib,所以这不是问题所在.我需要导入任何其他模块吗?
我有一个csv文件,有几百行和26列,但最后几列只有几行的值,它们朝向文件的中间或末尾.当我尝试使用read_csv()读取它时,我收到以下错误."ValueError:期待23列,第64行得26"
我看不到在哪里明确说明文件中的列数,或者它如何确定它认为文件应该有多少列.转储如下
In [3]:
infile =open(easygui.fileopenbox(),"r")
pledge = read_csv(infile,parse_dates='true')
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-3-b35e7a16b389> in <module>()
1 infile =open(easygui.fileopenbox(),"r")
2
----> 3 pledge = read_csv(infile,parse_dates='true')
C:\Python27\lib\site-packages\pandas-0.8.1-py2.7-win32.egg\pandas\io\parsers.pyc in read_csv(filepath_or_buffer, sep, dialect, header, index_col, names, skiprows, na_values, thousands, comment, parse_dates, keep_date_col, dayfirst, date_parser, nrows, iterator, chunksize, skip_footer, converters, verbose, delimiter, encoding, squeeze)
234 kwds['delimiter'] = sep
235
--> 236 return _read(TextParser, filepath_or_buffer, kwds)
237
238 @Appender(_read_table_doc)
C:\Python27\lib\site-packages\pandas-0.8.1-py2.7-win32.egg\pandas\io\parsers.pyc in _read(cls, filepath_or_buffer, kwds)
189 return parser
190
--> 191 return parser.get_chunk() …Run Code Online (Sandbox Code Playgroud) 可能重复:
如何读取带有"?"的CSV行?
我已经看到了一些相关的问题,但没有一个直接解决了我想要做的事情.我正在阅读CSV文件中的文本行.
所有项目都在引号中,有些在引号内有逗号.我想用逗号分隔该行,但忽略引号内的逗号.有没有办法在Python中执行此操作,不需要许多正则表达式语句.
一个例子是:
"114111","Planes,Trains,and Automobiles","50","BOOK"
Run Code Online (Sandbox Code Playgroud)
我想解析为4个独立的值变量:
"114111" "Planes,Trains,and Automobiles" "50" "Book"
Run Code Online (Sandbox Code Playgroud)
line.split()我错过了一个简单的选择吗?
我试图使用dask而不是pandas,因为我有2.6gb的csv文件.我加载它,我想删除一列.但似乎drop方法df.drop('column')或切片df [:,: - 1]
已实施.是这种情况还是我错过了什么?
这可能很简单,但我无法弄清楚出了什么问题.我在列出DataFrame的元素时遇到问题.有时会列出DataFrame的元素,有时它只是对数据列的数量和类型的描述.我知道行数是一个因素,但即使我只有几行,我也只能得到描述.例如:如果我有一个名为'allpledges'的DataFrame,它会给我一个描述
In [5]:
allpledges
Out[5]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 305384 entries, 0 to 305383
Data columns:
Pledge# 305384 non-null values
Source 305384 non-null values
Date 305384 non-null values
Break 305384 non-null values
Progcode 237002 non-null values
Run Code Online (Sandbox Code Playgroud)
这是可以理解的,因为要显示的行太多.但是当我试着看一些时,它仍然给了我同样的东西
In [13]:
allpledges[:5]
Out[13]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns:
Pledge# 5 non-null values
Source 5 non-null values
Date 5 non-null values
Break 5 non-null values
Progcode 0 non-null values
Run Code Online (Sandbox Code Playgroud)
当我想要的是列出的前五行.我已经在教程中看到了这一点,但无法弄清楚我在这里做错了什么.
使用Ipython笔记本和pandas模块,我有一些代码可以遍历一系列并制作一些条形图(或者应该是).它只生成它应该的最后一个图表.数据是按日和广播节目筹集的资金,我想要每天的图表.我怀疑这可能是一个组合pandas/ipython问题,但我不知道如何处理它.
代码是这样的:
print pledge[pledge.Date==k[0]].groupby('Break')['Amount'].sum().plot(kind='bar')
kcount =0;••••••••••••••••••••
for k, v in grouped.Amount.iteritems():
if k[0] <> kcount:
kcount=k[0]
print k[0];
print pledge[pledge.Date==k[0]].groupby('Break')['Amount'].sum().plot(kind='bar')
Run Code Online (Sandbox Code Playgroud)
我得到的输出是
05/02/2012
Axes(0.125,0.125;0.775x0.775)
05/03/2012
Axes(0.125,0.125;0.775x0.775)
05/04/2012
Axes(0.125,0.125;0.775x0.775)
05/05/2012
Axes(0.125,0.125;0.775x0.775)
05/06/2012
Axes(0.125,0.125;0.775x0.775)
Run Code Online (Sandbox Code Playgroud)

在最后一次迭代的最后只有一个图表.
我有一个捐赠金额和日期的数据框。我想看看需要多长时间才能收到一定比例的捐款(我们什么时候有 25% 的捐款?,75%?)。看起来 Pandas 分位数函数会做我想要的。然而,它似乎只想要数字,而不是日期。是否有一个函数可以对日期做同样的事情?
我有一个案例,相同的键可能有不同的字符串与之关联.
例如flow和wolf => bot有相同的字符,如果我对它们进行排序并将它们用作字典中的键,我想将原始字符串作为值.
我在python dict中尝试过:
d = {}
d["flow"] = flow
d["flow"] = wolf
Run Code Online (Sandbox Code Playgroud)
但是只有一个值与密钥相关联.
我试过d["flow"].append("wolf")但是也行不通.
如何让这个场景与Python dicts一起使用?
我试图在邮件列表(CSV格式)中查找具有特定邮政编码的条目.我认为这应该有用,但它永远找不到任何东西,尽管我知道所寻求的邮政编码就在那里.
text = open("during1.txt","r")
a = list(range(93201,93399))
b = list(range(93529,93535))
c = list(range(93601,93899))
d = list(range(95301,95399))
KFCFzip = a+b+c+d
output = open("output.txt","w")
for line in text:
array= line.strip().split(",")
print(array[6][0:5])
if array[6][0:5] in KFCFzip:
#output.write(array)
print("yes")
text.close()
output.close()
Run Code Online (Sandbox Code Playgroud)
当我运行代码时,它找不到匹配项,但IF语句上方的print语句打印出看起来应该匹配的值,当我转到Shell并键入类似的内容时
93701 in KFCFzip
Run Code Online (Sandbox Code Playgroud)
它给了我"真的:,所以它的工作就是这么大.文件只是用逗号分隔的文本,所以我无法弄清楚为什么它可以看到它们.数据文件有实时数据,所以我不得不改变在发布之前,我有点想知道是否有人有任何不涉及发布数据的想法.
python ×8
pandas ×5
csv ×2
ipython ×2
dask ×1
defaultdict ×1
dictionary ×1
jupyter ×1
ragged ×1