小编dar*_*dog的帖子

使用Pandas在IPython笔记本中显示多个输出表

我现在知道我可以通过将它们嵌入到一个绘图空间中来输出来自IPython pandas的多个图表,这些绘图空间将出现在笔记本中的单个输出单元格中.

我可以用Pandas HTML Tables做类似的事情吗?

我从电子表格中的多个选项卡(大约15-20)获取数据,并通过一组回归运行它们,我想一起显示结果,也许是2个..但是因为显示表的功能只显示一,最后一个,不知道如何接近.想法?

我甚至乐意在连续的输出单元格中显示..也不确定如何做到这一点但是我想我可以做一些非常脏的事情在一个单独的单元格中调用每个(电子表格)选项卡..呃......我...我在IPython 2.0 dev和Pandas 13上

ipython pandas ipython-notebook

6
推荐指数
1
解决办法
3989
查看次数

如何在IPython Notebook中嵌入数据?

在我看来,应该有一种方法从文件中读取数据,理想情况下是Pandas DataFrame,并以这样的方式创建结果,使其成为笔记本的一部分,因此,例如,您可以将数据存储在笔记本中不需要外部文件?

这样你就可以发送整个例子(显然主要用于较小的数据集).它也可以让这方面的例子更简单.

有任何想法吗?即使通过剪切和粘贴即输出数据帧显示?

python pandas ipython-notebook

6
推荐指数
2
解决办法
1271
查看次数

通过Javascript访问Google-apps公共电子表格

花了很多时间看这个..似乎关于访问谷歌应用程序电子表格的信息很少得到很好的维护.今年谷歌IO有一个增强的谷歌应用程序脚本的公告.包括UI元素..

这让我想到了基于Google电子表格中的数据创建一个小部件,没有数据只是简单的阅读/查找和显示计算..然后我意识到UI功能只适用于Premier帐户..不是很大的交易只需50美元/年,并提前一些免费试用时间.似乎ui功能可能有点限制性.

但后来我开始思考我可能要做的所有小事情,所以我开始研究如何从Javascript访问电子表格,在这种情况下我认为它们可能是一个简单的I-Google小工具..我-Google小工具功能非常强大且灵活.这可以提供更大的灵活性.简而言之,我已经做得很短......其他人在那里?这看起来像是一个线索http://almaer.com/blog/gspreadsheet-javascript-helper-for-google-spreadsheets,这个我无法获取当前的电子表格http://code.google.com/apis /gdata/samples/spreadsheet_sample.html但是很长一段时间没有触摸过,我无法在当前的电子表格中使用它.

这是当前的"公开"只读电子表格.http://spreadsheets1.google.com/ccc?key=tzbvU7NnAnWkabYmGo4VeXQ&hl=en 这是谷歌现在提到的,因为它的旧格式,我已经尝试了(旧的和新的)...不知道是否有任何区别..

javascript spreadsheet google-apps

5
推荐指数
2
解决办法
9746
查看次数

Python中的模数和操作顺序

在Zed Shaw的"艰难学习Python"(第15-16页)中,他有一个示例练习

 100 - 25 * 3 % 4
Run Code Online (Sandbox Code Playgroud)

结果是97(试试吧!)

我看不到可以做到这一点的操作顺序..

100 - 25 = 75
3%4 = 0
或(100-25*3)= 225%4 = ??? 但无论如何不是97我不认为......

一个类似的例子是3 + 2 + 1 - 5 + 4 % 2 - 1 / 4 + 6收益率7

操作的顺序是什么?

python modulo operator-precedence

5
推荐指数
1
解决办法
2万
查看次数

Python 在内存表数据结构中进行分析(dict、list、combo)

我试图模仿一些代码,我有一个SQL工作,但使用所有的Python代替。随着这里一些帮助 CSV到Python解释所有的列名?

我现在可以将我的压缩 csv 文件读入 dict 只有一行,最后一行。(如何获取行样本或整个数据文件?)

我希望有一个内存常驻表,当我完成时,我可以像 sql 一样操作它,例如通过将坏数据匹配到另一个具有坏数据和正确条目的表来清理数据..然后按时间段和平均类型求和像.. 总数据文件大约有 500,000 行.. 我对将所有内容都放在内存中并不大惊小怪,但我想尽我所能解决一般情况,所以我知道不求助于 SQL 可以做什么

import csv, sys, zipfile
sys.argv[0] = "/home/tom/Documents/REdata/AllListing1RES.zip"
zip_file    = zipfile.ZipFile(sys.argv[0])
items_file  = zip_file.open('AllListing1RES.txt', 'rU')
for row in csv.DictReader(items_file, dialect='excel', delimiter='\t'):
    pass 
# Then is my result is
>>> for key in row:
print 'key=%s, value=%s' % (key, row[key])  
key=YEAR_BUILT_DESC, value=EXIST
key=SUBDIVISION, value=KNOLLWOOD
key=DOM, value=2
key=STREET_NAME, value=ORLEANS RD
key=BEDROOMS, value=3
key=SOLD_PRICE, value=
key=PROP_TYPE, value=SFR
key=BATHS_FULL, value=2
key=PENDING_DATE, value=
key=STREET_NUM, value=3828
key=SOLD_DATE, value=
key=LIST_PRICE, value=324900
key=AREA, …
Run Code Online (Sandbox Code Playgroud)

python csv dictionary list data-structures

5
推荐指数
1
解决办法
5150
查看次数

使用Pandas从Cloud DataLab访问Big Query

我有一个Jypyter Notebook使用Pandas作为车辆访问Big Query:

df = pd.io.gbq.read_gbq( query, project_id = 'xxxxxxx-xxxx' )
Run Code Online (Sandbox Code Playgroud)

这可以从我的本地机器正常工作!(很棒,事实上!)但是当我将相同的笔记本加载到Cloud DataLab时,我得到:

DistributionNotFound: google-api-python-client
Run Code Online (Sandbox Code Playgroud)

这似乎相当令人失望!我相信该模块应该与Pandas一起安装..但不知何故谷歌不包括它?出于一系列原因,最好不要将代码从我们在本地机器上开发的代码更改为Cloud DataLab中所需的代码,在这种情况下,我们会大量参数化数据访问...

好的我跑了:

!pip install --upgrade google-api-python-client
Run Code Online (Sandbox Code Playgroud)

现在,当我运行笔记本时,我得到一个auth提示,由于DataLab在远程计算机上,我无法解决:

Your browser has been opened to visit:
 >>> Browser string>>>>
If your browser is on a different machine then exit and re-run this
application with the command-line parameter 

 --noauth_local_webserver
Run Code Online (Sandbox Code Playgroud)

没有看到明显的答案吗?

在更新了笔记本中的google-api-python-client之后,我在同一个笔记本中使用@Anthonios Partheniou建议的代码(在单元块中执行),我得到了以下回溯:

TypeError                                 Traceback (most recent call last)
<ipython-input-3-038366843e56> in <module>()
  5                            scope='https://www.googleapis.com/auth/bigquery',
  6                            redirect_uri='urn:ietf:wg:oauth:2.0:oob')
----> 7 storage = Storage('bigquery_credentials.dat')
  8 authorize_url = flow.step1_get_authorize_url()
  9 print 'Go …
Run Code Online (Sandbox Code Playgroud)

python pandas google-bigquery google-cloud-datalab

5
推荐指数
1
解决办法
2408
查看次数

TensorFlow 1.0教程中的Cuda问题看起来TF无法找到CUPTI/lib64?

这个问题与SSE AVX等警告无关.我已经将输出包括在内为完整性.问题是一些cuda libs的失败,我认为,最后,机器有一个NVIDA 1070卡,并且有一个Cuda libs,在这个过程的早期使用但是最后还缺少什么?我点了TensorFlow的1.0版本,我还单独下载了repo,以获得最新的教程.本教程专门用于获取所有Tensorboard功能的实例.尝试从repo中的tensorFlow教程运行Minst_with_summaries.py(我将文件从repo复制到工作目录中),我正在使用Anaconda和Python 3.6我得到以下内容:

(py36) tom@tomServal:~/Documents/LearningRepos/Working$ python Minst_with_summaries.py
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcublas.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcudnn.so.5 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcufft.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcurand.so.8.0 locally
Extracting /tmp/tensorflow/mnist/input_data/train-images-idx3-ubyte.gz
Extracting /tmp/tensorflow/mnist/input_data/train-labels-idx1-ubyte.gz
Extracting /tmp/tensorflow/mnist/input_data/t10k-images-idx3-ubyte.gz
Extracting /tmp/tensorflow/mnist/input_data/t10k-labels-idx1-ubyte.gz
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE3 instructions, but these are available on your machine and could speed up …
Run Code Online (Sandbox Code Playgroud)

python tensorflow tensorboard

5
推荐指数
1
解决办法
527
查看次数

创建一个Pandas数据框,其中包含跨越日期范围的项目数

我有一个DF有两个感兴趣的日期,看起来有点像:

LIST_DATE     END_DATE
2000-04-18    2000-05-17 00:00:00
2000-05-18    2000-09-18 00:00:00
2000-04-18    2001-06-07 00:00:00
Run Code Online (Sandbox Code Playgroud)

我按月创建了一个Period索引表"montot",目前只有月份和年份索引

<class 'pandas.tseries.period.PeriodIndex'>
freq: M
[1999-01, ..., 2013-07]
Run Code Online (Sandbox Code Playgroud)

我想要做的是在第二个表中的每个月"montot"计算第一个表中属于时间段的项目(恰好是按月活动列表)并将该字段添加到表中...所以例如,第一个表中的第一个项目将在第4个月中计数1个,在第5个月中计算一次,而第二个项目将在第5个月到第9个月等计算一次.每月总计将记录在新表/字段中.所以我会有一张桌子

Month    active
1/1999     5
2/1999     8
Run Code Online (Sandbox Code Playgroud)

等等.还没有弄清楚如何使用Pandas/Python来处理它...

python pandas

4
推荐指数
1
解决办法
1262
查看次数

在循环中在Matplotlib中创建子图?

我正在使用这个代码,它提供了一个接一个的好图(使用IPython-notebook&Pandas)

for subsm in subsl:
    H7, subsm = sumsubdesc2(table, subsm)   
    ax1=H7.plot()
    plt.title('Rolling 4q mean %s'%(subsm))
    ax1.set_title('Rolling 4q mean %s'%(subsm))
    ax1.set_ylim(100000,600000)
Run Code Online (Sandbox Code Playgroud)

我想让下一个旁边共有3个"2up",总共3行(5个子图)无法弄清楚如何处理,因为所有的子图示例似乎都是用于对数据或特定图表进行子绘图以及特定网格布局.

所以我不知道如何创建主要情节,然后将一些图表(在这种情况下为5)分别绘制为标题为二次?

编辑第二行代码,因为我省略了函数调用;-(

python matplotlib pandas ipython-notebook

4
推荐指数
1
解决办法
1万
查看次数

如何让这个输出在 Pandas 中按日期排序

我有一个日期字段 Datetime 并且我想要一个简单的项目计数,但我喜欢它的日期顺序......我现在拥有的......

plot_data.Quradate.value_counts() # of respondents by survey date
2011-07-15    702
2011-04-15    696
2011-10-15    661
2010-01-15    636
2011-01-15    587
2010-10-15    570
2012-01-15    534
2010-07-15    525
2010-04-15    384
dtype: int64
Run Code Online (Sandbox Code Playgroud)

应该很简单,但对我来说还不是......

python pandas

4
推荐指数
1
解决办法
3264
查看次数