我已经下载了几个ipython笔记本,我想在浏览器选项卡中打开它们,而不导航到我已下载并运行的目录ipython notebook notebook_name.ipynb.
我意识到这可能意味着我很懒,但对我来说这似乎是一个常见的用例.我错过了一些明显的东西吗
我是原始新手中最新的.我刚刚按照http://ipython.org/install.html上 anaconda的说明在Mac(MacOS 10.7.5)上安装了IPython ,没有明显的错误.我现在想通过示例笔记本工作.在笔记本"第1部分 - 运行代码"中,一切正常,直到我到达
%matplotlib内联
然后我收到错误消息
错误:%matplotlib未找到线条魔术功能.
之后的所有工作,除了绘图,而不是显示内联,弹出一个新窗口.
我是Spark的新手,我正在尝试通过参考以下网站来安装PySpark.
http://ramhiser.com/2015/02/01/configuring-ipython-notebook-support-for-pyspark/
我试图安装两个预构建的包,也通过SBT构建Spark包.
当我尝试在IPython Notebook中运行python代码时,我得到以下错误.
NameError Traceback (most recent call last)
<ipython-input-1-f7aa330f6984> in <module>()
1 # Check that Spark is working
----> 2 largeRange = sc.parallelize(xrange(100000))
3 reduceTest = largeRange.reduce(lambda a, b: a + b)
4 filterReduceTest = largeRange.filter(lambda x: x % 7 == 0).sum()
5
NameError: name 'sc' is not defined
Run Code Online (Sandbox Code Playgroud)
在命令窗口中,我可以看到以下错误.
<strong>Failed to find Spark assembly JAR.</strong>
<strong>You need to build Spark before running this program.</strong>
Run Code Online (Sandbox Code Playgroud)
请注意,当我执行spark-shell命令时,我得到了一个scala提示符
更新:
在朋友的帮助下,我能够通过更正.ipython/profile_pyspark/startup/00-pyspark-setup.py文件的内容来解决与Spark程序集JAR相关的问题.
我现在只有Spark Context变量的问题.更改标题以适当反映我当前的问题.
我希望打印语句的输出与图表交错,按照它们的打印顺序和在Ipython笔记本单元格中绘制.例如,请考虑以下代码:
(启动ipython ipython notebook --no-browser --no-mathjax)
%matplotlib inline
import matplotlib.pyplot as plt
i = 0
for data in manydata:
fig, ax = plt.subplots()
print "data number i =", i
ax.hist(data)
i = i + 1
Run Code Online (Sandbox Code Playgroud)
理想情况下,输出看起来像:
data number i = 0
(histogram plot)
data number i = 1
(histogram plot)
...
Run Code Online (Sandbox Code Playgroud)
但是,Ipython中的实际输出将如下所示:
data number i = 0
data number i = 1
...
(histogram plot)
(histogram plot)
...
Run Code Online (Sandbox Code Playgroud)
在Ipython中有直接的解决方案,还是解决方案或替代解决方案来获得隔行输出?
我写了一个ipython笔记本,分析数据集.现在我想使用此代码循环遍历不同的数据集.
代码分为大约50个单元格(包括注释,降价解释,......).有没有办法在循环中运行部分笔记本电脑或运行具有不同输入参数的整个笔记本?
我不想将所有单元格合并到一个函数中或者将代码下载为python脚本,因为我真的想通过仅执行某些单元格来运行(并试验)部分分析.
基本上它将脚本的重构部分转换为函数并在循环中调用函数,只是"脚本的部分"是笔记本单元格.
我已经开始将R用法集成到Notebook中,从我的角度来看,两者都是最好的(python中的数据管理,同时利用R的比较分析/图形优势).不幸的是,我挂了一个看似简单的元素,调整ggplot2图形的绘图大小.使用pandas调整绘图大小非常简单,在纯R环境(如RStudio)中,我可以使用dev.new()或PNG()等调整绘图.但是,尝试这样做是因为笔记本让我的计算机变得疯狂(我在华硕U46E上运行Ubuntu 13.04).此外,这是至关重要的,我想保持图形内联,以便我可以将脚本完整地传递给我的同事.
尝试dev.new()时,我的计算机已锁定,我不得不切换到另一个虚拟终端重启.我试图调整x11()选项,我的浏览器暂时没有响应,而图形有点乱.最终,我再次被授予控制权,但我不知道为什么会这样.
有谁知道为什么会发生这种情况?另外,有没有人知道如何调整从IPython Notebook中渲染的ggplot2对象的绘图大小?我恐怕无法分享数据,但我可以告诉你,我试图绘制基金中心(分类变量)所面对的三个数字变量.这些图确实按照书面执行...直到我试图调整大小.这是我的示例代码:
%%R
#x11(width=500,height=300) << didn't work
#dev.new() << tried before setting size parameters, and it locked up my laptop
#Plot total expenses by unit
print('*****Expenses by Unit*****')
print(smu)
print(ggplot(smu,aes(x=fy,y=as.numeric(as.character(totexp)),group=fund,colour=fund))+geom_line(size=2)+
ggtitle('Total Expenses'))
#Plot expense components
print(ggplot(smu,aes(fy))+
geom_line(aes(y=as.numeric(as.character(fixed)),colour='fixed',group=fund,colour=fund))+
geom_line(aes(y=as.numeric(as.character(var)),colour='variable',group=fund,colour=fund))+
geom_bar(aes(y=as.numeric(as.character(incadj)),group=1),stat='identity')+
facet_grid(.~fund)+
ggtitle('Components of Expenditure'))
Run Code Online (Sandbox Code Playgroud) 我刚开始使用ipython,我正在创建如下数字:
fig, axes = plt.subplots()
xs = range(0,100)
axes.plot(xs, [x*x for x in xs], 'r')
Run Code Online (Sandbox Code Playgroud)
我知道这些数字可以呈现为svgs,请参见此处.不幸的是,这些数字总是呈现为光栅化图像.当我使用笔记本的缩放功能时,光栅化的图像变得非常难看.有没有办法改变这种行为,这样数字默认显示为svg?
当我调用pyplot.title('some string')它时抛出异常,'str' object is not callable'.我从matplotlib在线文档中复制了以下内容:
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
# the histogram of the data
n, bins, patches = plt.hist(x, 50, normed=1, facecolor='g', alpha=0.75)
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()
Run Code Online (Sandbox Code Playgroud)
得到
TypeError Traceback (most recent call last)
<ipython-input-158-40fe7a831b06> in <module>()
8 plt.xlabel('Smarts')
9 plt.ylabel('Probability')
---> 10 plt.title('Histogram of IQ')
11 plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
12 plt.axis([40, 160, 0, …Run Code Online (Sandbox Code Playgroud) 显示pandas数据帧时是否可以隐藏索引,以便只有列名出现在表的顶部?
这需要适用于ipython notebook中的html表示和to_latex()函数(我正在使用nbconvert).
助教.
本地计算机(PC)上UI右上角的下拉菜单:
Kernel->
Change kernel->
Python 2 (on a local PC)
Python 3 (on a local PC)
My new kernel (on a remote PC)
Run Code Online (Sandbox Code Playgroud) ipython-notebook ×10
ipython ×4
python ×4
matplotlib ×3
ggplot2 ×1
jupyter ×1
macos ×1
pandas ×1
pyspark ×1
r ×1