如何figures
在 Markdown 单元格中内联显示 google colab 中文件夹中的图片?
我的本地驱动器上有以下笔记本结构。
figures
- pic1.png
- pic2.png
- ...
Notebook1.ipynb
Notebook2.ipynb
etc.
Run Code Online (Sandbox Code Playgroud)
在谷歌colab中打开笔记本并上传figures文件夹后,我检查了包含图片的文件夹实际上已上传。这是。
然后我在降价单元中尝试了以下操作:

Run Code Online (Sandbox Code Playgroud)
这显然在 google colab 中不起作用。
Jake VanderPlas 是如何做到这一点的?显然他甚至没有将图片上传到“figures”文件夹中,但仍然在 markdown 中使用以下行

在上面的链接中(向下滚动查看 numpy 数组的图片)。
任何帮助表示赞赏!
谢谢!
我正在使用 Jupyter Notebook 来构建幻灯片。直到昨天,CellToolBar 按钮上还有两个按钮可以启动幻灯片放映(其中一个按钮是 RISE.js)。突然间这些按钮就消失了。现在CellToolBar 按钮的右侧根本没有任何按钮。
我尝试conda update jupyter
并conda update -c damianavila82 rise
使用终端。但我收到消息了# All requested packages already installed
。所以问题似乎出在其他地方。
有谁知道我可以做什么来恢复按钮?
谢谢!
我正在使用 pandoc 并用 markdown 编写我的文本。为了创建我自己的风格,我使用自定义乳胶模板。
我想用颜色来设置所有粗体单词的样式。所以当我输入**a word**
这个词时不仅应该是粗体,而且还应该是蓝色的。
在我的乳胶模板文件中使用以下内容
\newcommand\boldblue[1]{\textcolor{blue}{\textbf{#1}}}
\renewcommand{\textbf}{\boldblue}
Run Code Online (Sandbox Code Playgroud)
使用转换为 pdf 时出现错误
pandoc myfile -f markdown -t latex --template==mytemplate -o myfile.pdf
其中说
超出 TeX 容量,抱歉(分组级别 = 255)
但是:当我只设置 newcommand 时
\newcommand\boldblue[1]{\textcolor{blue}{\textbf{#1}}}
Run Code Online (Sandbox Code Playgroud)
$\boldblue{some text}$
我可以在我的 Markdown 文件中写入并且它可以工作。
问题:如何设置新命令**<word>**
?
谢谢!
我正在尝试使用 BeautifulSoup 以编程方式从网站下载(打开)数据。
该网站使用 php 表单,您需要提交输入数据,然后在该表单中明显输出结果链接。
我的方法如下
第1步:通过请求发布表单数据
第 2 步:通过 BeautifulSoup 解析生成的链接
然而,这似乎不起作用/我做错了,因为 post 方法似乎不起作用,并且步骤 2 甚至不可能,因为没有可用的结果。
这是我的代码:
from bs4 import BeautifulSoup
import requests
def get_text_link(soup):
'Returns list of links to individual legal texts'
ergebnisse = soup.findAll(attrs={"class":"einErgebnis"})
if ergebnisse:
links = [el.find("a",href=True).get("href") for el in ergebnisse]
else:
links = []
return links
url = "https://www.justiz.nrw.de/BS/nrwe2/index.php#solrNrwe"
# Post specific day to get one day of data
params ={'von':'01.01.2018',
'bis': '31.12.2018',
"absenden":"Suchen"}
response = requests.post(url,data=params)
content = response.content
soup = BeautifulSoup(content,"lxml") …
Run Code Online (Sandbox Code Playgroud) 是否可以在 pandas 中进行方法链接
示例:这里的数据框可以通过变量名称引用。
df = pd.DataFrame({"a":[1,2,3], "b":list("abc")})
df = (df
.drop(df.tail(1).index)
#.other_methods
#...
)
df
Run Code Online (Sandbox Code Playgroud)
是否可以在不将数据帧分配给变量名的情况下执行此操作?
df = (pd.DataFrame({"a":[1,2,3], "b":list("abc")})
.drop(??.tail(1).index)
#.other_methods
#...
)
df
Run Code Online (Sandbox Code Playgroud)
谢谢!
我很难理解究竟df.apply()
是如何运作的.
我的问题如下:我有一个数据帧df
.现在我想在几列中搜索某些字符串.如果在我要为找到字符串的每一行添加的任何列中找到该字符串,则为"标签"(在新列中).
我能够与解决问题map
和applymap
(见下文).
但是,我希望更好的解决方案是使用, apply
因为它将函数应用于整个列.
apply
吗?我的错误在哪里?以下是我使用map
和的解决方案applymap
.
df = pd.DataFrame([list("ABCDZ"),list("EAGHY"), list("IJKLA")], columns = ["h1","h2","h3","h4", "h5"])
Run Code Online (Sandbox Code Playgroud)
map
def setlabel_func(column):
return df[column].str.contains("A")
mask = sum(map(setlabel_func, ["h1","h5"]))
df.ix[mask==1,"New Column"] = "Label"
Run Code Online (Sandbox Code Playgroud)
applymap
mask = df[["h1","h5"]].applymap(lambda el: True if re.match("A",el) else False).T.any()
df.ix[mask == True, "New Column"] = "Label"
Run Code Online (Sandbox Code Playgroud)
因为apply
我不知道如何将两列传递给函数/或者根本不理解机制;-)
def setlabel_func(column):
return df[column].str.contains("A")
df.apply(setlabel_func(["h1","h5"]),axis = 1)
Run Code Online (Sandbox Code Playgroud)
上面给了我警觉.
'DataFrame'对象没有属性'str'
有什么建议?请注意,我的实际应用程序中的搜索功能更复杂,需要正则表达式功能,这就是我.str.contain
首先使用的原因.
我有一个parquet
文件(~1.5 GB),我想用polars
. 生成的数据帧有 250k 行和 10 列。一栏里有大块的文本。
我刚刚开始使用极坐标,因为我听到了很多关于它的好消息。其中之一是它比 pandas 快得多。
这是我的问题:
数据帧的预处理相当慢,所以我开始与pandas
. 我是否做错了什么,或者这个特定用例的极坐标只是速度较慢?如果是这样:有没有办法加快速度?
这是我的代码polars
import polars as pl
df = (pl.scan_parquet("folder/myfile.parquet")
.filter((pl.col("type")=="Urteil") | (pl.col("type")=="Beschluss"))
.collect()
)
df.head()
Run Code Online (Sandbox Code Playgroud)
整个代码大约需要1 分钟,而仅过滤部分大约需要13 秒。
我的代码在pandas
:
import pandas as pd
df = (pd.read_parquet("folder/myfile.parquet")
.query("type == 'Urteil' | type == 'Beschluss'") )
df.head()
Run Code Online (Sandbox Code Playgroud)
整个代码也大约需要1 分钟,而仅查询部分就需要<1 秒。
数据框的 10 列具有以下类型:
如前所述:“ content
”列存储大文本(1 到 20 页文本),我需要对其进行预处理,并且我猜存储方式不同。 …
我有一个包含列的 numpy 数组x
,想要按多列排序(其中一些可能是 类型np.str_
。我知道我可以使用np.lexsort
.
有没有办法指定每个排序列是否按升序/降序排列?
示例:我知道我可以按如下方式对多个列进行排序:(编辑以指示字符串列!
import numpy as np
arr = np.array([list("aaabbb"),[1,2,3,1,4,3],[1,2,3,4,6,6]]).T # Define arr
idx = np.lexsort([arr[:,1], arr[:,2]]) # sort by column 2 and then by column 1 (i.e. reversed order)
arr = arr[idx]
Run Code Online (Sandbox Code Playgroud)
我还明白我可以按降序排序,如下所示:
arr = arr[idx[::-1]]
Run Code Online (Sandbox Code Playgroud)
这会导致第一个列(第 2 列)按降序排列,后续列按升序排列。
但是我如何指定我希望首先按降序排序(第 2 列),然后按降序排序(第 1 列),以便得到以下结果。
所需输出:
array([['b', 4, 6],
['b', 3, 6],
['b', 1, 4],
['a', 3, 3],
['a', 2, 2],
['a', 1, 1]]
Run Code Online (Sandbox Code Playgroud)
所以基本上对于我的例子来说,我正在寻找相当于:
df = pd.DataFrame(arr, columns=list("abc")) …
Run Code Online (Sandbox Code Playgroud) 我现在正在玩Bokeh
一段时间,我真的很惊讶创造美丽是多么容易charts
.
然而,有一个我无法解决的视觉事物.
如果我转向背景和边框,我的所有图表仍然具有某种边框/边框.你也可以关掉它吗?
例如,如果我使用下面的代码来关闭我的背景,边框和轴我仍然会在绘图周围形成一个框架.
p.xaxis.visible = False
p.yaxis.visible = False
p.xgrid.visible = False
p.ygrid.visible = False
p.background_fill_color = None
p.border_fill_color = None
Run Code Online (Sandbox Code Playgroud)
这是我的情节例子.
任何想法如何摆脱grey frame
?
谢谢你的帮助!
我有两个清单:
allwords
(~100,000个元素)stopwords
(~2.000元素)我想selectedwords
从列表中生成一个新列表,allwords
其中包含所有不在的单词stopwords
.
我通过以下列表理解实现了这一点
selectedwords = [word.lower() for word in allwords if word.lower() not in stopwords]
Run Code Online (Sandbox Code Playgroud)
问题:有没有更聪明的方法来加速计算(使用python).我对python很新,我很感激任何建议.
谢谢!
我有一个问题,更多的是关于OOP,而不是特定于python.
是否可以在没有特定方法的情况下,在ClassB的实例中存储ClassA的实例,即通过某种继承.
例如:假设我有一个Model class
和一个Variable class
class Model():
def __init__(self):
self.vars = []
def _update_vars(self,Variable):
self.vars.append(Variable)
class Variable(Model):
def __init__(self,**kwargs):
self.__dict__.update(kwargs)
Run Code Online (Sandbox Code Playgroud)
现在可以_update_vars
在创建变量实例时调用.
所以,如果我做这样的事情:
mdl = Model()
varA = Variable(...)
varB = Variable(...)
Run Code Online (Sandbox Code Playgroud)
那mdl.vars
现在将包括varA
和varB
.
我知道通过将变量作为参数传递给Model的"公共"方法,我可以很容易地做到这一点.所以我不是在寻找
mdl.update_vars(varA)
所以我的两个问题是:
谢谢你的帮助!
我是 Go 新手,刚刚偶然发现了present
我通过 导入的 Go 包go get golang.org/x/tools/present
。
有什么方法可以自定义演示文稿的外观吗?例如通过调整默认的css文件?
如果是这样,用于样式的文件在哪里?我在 Go 路径中的任何位置都找不到该包...
这可能是一个相当愚蠢的问题:
如果我使用pd.read_excel(somefile)
函数,python pandas
这个函数是否需要在执行python代码的机器上安装Excel?