小编Fre*_*ter的帖子

如何显示谷歌colab文件夹中的图像

如何figures在 Markdown 单元格中内联显示 google colab 中文件夹中的图片?

我的本地驱动器上有以下笔记本结构。

figures
    - pic1.png
    - pic2.png
    - ...
Notebook1.ipynb
Notebook2.ipynb
etc.
Run Code Online (Sandbox Code Playgroud)

在谷歌colab中打开笔记本并上传figures文件夹后,我检查了包含图片的文件夹实际上已上传。这是。

然后我在降价单元中尝试了以下操作:

![Pic1](figures/pic1.png)
Run Code Online (Sandbox Code Playgroud)

这显然在 google colab 中不起作用。

Jake VanderPlas 是如何做到这一点的?显然他甚至没有将图片上传到“figures”文件夹中,但仍然在 markdown 中使用以下行

![Broadcasting Visual](figures/02.05-broadcasting.png)在上面的链接中(向下滚动查看 numpy 数组的图片)。

任何帮助表示赞赏!

谢谢!

markdown jupyter-notebook google-colaboratory

6
推荐指数
1
解决办法
7078
查看次数

Python / Jupyter 笔记本滑动按钮不见了?

我正在使用 Jupyter Notebook 来构建幻灯片。直到昨天,CellToolBar 按钮上还有两个按钮可以启动幻灯片放映(其中一个按钮是 RISE.js)。突然间这些按钮就消失了。现在CellToolBar 按钮的右侧根本没有任何按钮。

我尝试conda update jupyterconda update -c damianavila82 rise使用终端。但我收到消息了# All requested packages already installed。所以问题似乎出在其他地方。

有谁知道我可以做什么来恢复按钮?

  • 我在 Mac 上
  • jupyter笔记本服务器的版本是4.3.1
  • RISE版本是4.0.0b1
  • 蟒蛇是 4.3.0
  • Python 3.5.2

谢谢!

python jupyter rise

5
推荐指数
1
解决办法
3041
查看次数

Pandoc Markdown 粗体和颜色

我正在使用 pandoc 并用 markdown 编写我的文本。为了创建我自己的风格,我使用自定义乳胶模板。

我想用颜色来设置所有粗体单词的样式。所以当我输入**a word**这个词时不仅应该是粗体,而且还应该是蓝色的。

在我的乳胶模板文件中使用以下内容

\newcommand\boldblue[1]{\textcolor{blue}{\textbf{#1}}}
\renewcommand{\textbf}{\boldblue}
Run Code Online (Sandbox Code Playgroud)

使用转换为 pdf 时出现错误

pandoc myfile -f markdown -t latex --template==mytemplate -o myfile.pdf

其中说

超出 TeX 容量,抱歉(分组级别 = 255)

但是:当我只设置 newcommand 时

\newcommand\boldblue[1]{\textcolor{blue}{\textbf{#1}}}
Run Code Online (Sandbox Code Playgroud)

$\boldblue{some text}$我可以在我的 Markdown 文件中写入并且它可以工作。

问题:如何设置新命令**<word>**

谢谢!

markdown latex renewcommand pandoc

5
推荐指数
1
解决办法
3742
查看次数

Beautifulsoup - 提交表单数据

我正在尝试使用 BeautifulSoup 以编程方式从网站下载(打开)数据。

该网站使用 php 表单,您需要提交输入数据,然后在该表单中明显输出结果链接。

我的方法如下

第1步:通过请求发布表单数据

第 2 步:通过 BeautifulSoup 解析生成的链接

然而,这似乎不起作用/我做错了,因为 post 方法似乎不起作用,并且步骤 2 甚至不可能,因为没有可用的结果。

这是我的代码:

from bs4 import BeautifulSoup
import requests

def get_text_link(soup):
    'Returns list of links to individual legal texts'
    ergebnisse = soup.findAll(attrs={"class":"einErgebnis"})
    if ergebnisse:
        links = [el.find("a",href=True).get("href") for el in ergebnisse]
    else:
        links = []
    return links

url = "https://www.justiz.nrw.de/BS/nrwe2/index.php#solrNrwe"

# Post specific day to get one day of data
params ={'von':'01.01.2018', 
     'bis': '31.12.2018',
     "absenden":"Suchen"} 
response = requests.post(url,data=params)
content = response.content
soup = BeautifulSoup(content,"lxml") …
Run Code Online (Sandbox Code Playgroud)

python post beautifulsoup request

5
推荐指数
1
解决办法
1万
查看次数

当 df 尚未分配时 Pandas 方法链接

是否可以在 pandas 中进行方法链接

  • 尚未分配引用数据帧的变量
  • 并且该方法需要引用数据框?

示例:这里的数据框可以通过变量名称引用。

df = pd.DataFrame({"a":[1,2,3], "b":list("abc")})
df = (df
      .drop(df.tail(1).index)
      #.other_methods
      #...
      )
df
Run Code Online (Sandbox Code Playgroud)

是否可以在不将数据帧分配给变量名的情况下执行此操作?

df = (pd.DataFrame({"a":[1,2,3], "b":list("abc")})
      .drop(??.tail(1).index)
      #.other_methods
      #...
      )
df
Run Code Online (Sandbox Code Playgroud)

谢谢!

python dataframe pandas

5
推荐指数
1
解决办法
528
查看次数

Python:pandas适用于地图

我很难理解究竟df.apply()是如何运作的.

我的问题如下:我有一个数据帧df.现在我想在几列中搜索某些字符串.如果在我要为找到字符串的每一行添加的任何列中找到该字符串,则为"标签"(在新列中).

我能够与解决问题mapapplymap(见下文).

但是,我希望更好的解决方案是使用, apply因为它将函数应用于整个列.

问题:这不可能使用apply吗?我的错误在哪里?

以下是我使用map和的解决方案applymap.

df = pd.DataFrame([list("ABCDZ"),list("EAGHY"), list("IJKLA")], columns = ["h1","h2","h3","h4", "h5"])
Run Code Online (Sandbox Code Playgroud)

解决方案使用 map

def setlabel_func(column):
    return df[column].str.contains("A")

mask = sum(map(setlabel_func, ["h1","h5"]))
df.ix[mask==1,"New Column"] = "Label"
Run Code Online (Sandbox Code Playgroud)

解决方案使用 applymap

mask = df[["h1","h5"]].applymap(lambda el: True if re.match("A",el) else False).T.any()
df.ix[mask == True, "New Column"] = "Label"
Run Code Online (Sandbox Code Playgroud)

因为apply我不知道如何将两列传递给函数/或者根本不理解机制;-)

def setlabel_func(column):
    return df[column].str.contains("A")

df.apply(setlabel_func(["h1","h5"]),axis = 1)
Run Code Online (Sandbox Code Playgroud)

上面给了我警觉.

'DataFrame'对象没有属性'str'

有什么建议?请注意,我的实际应用程序中的搜索功能更复杂,需要正则表达式功能,这就是我.str.contain首先使用的原因.

python apply pandas

4
推荐指数
2
解决办法
5387
查看次数

北极熊与熊猫:体型和速度的差异

我有一个parquet文件(~1.5 GB),我想用polars. 生成的数据帧有 250k 行和 10 列。一栏里有大块的文本。

我刚刚开始使用极坐标,因为我听到了很多关于它的好消息。其中之一是它比 pandas 快得多。

这是我的问题:
数据帧的预处理相当慢,所以我开始与pandas. 我是否做错了什么,或者这个特定用例的极坐标只是速度较慢?如果是这样:有没有办法加快速度?

这是我的代码polars

import polars as pl

df = (pl.scan_parquet("folder/myfile.parquet")
      .filter((pl.col("type")=="Urteil") | (pl.col("type")=="Beschluss"))
      .collect()
     )
df.head()
Run Code Online (Sandbox Code Playgroud)

整个代码大约需要1 分钟,而仅过滤部分大约需要13 秒

我的代码在pandas

import pandas as pd 

df = (pd.read_parquet("folder/myfile.parquet")
    .query("type == 'Urteil' | type == 'Beschluss'") )
df.head()
Run Code Online (Sandbox Code Playgroud)

整个代码也大约需要1 分钟,而仅查询部分就需要<1 秒

数据框的 10 列具有以下类型:

  • i64
  • 斯特
  • 结构[7]
  • str(对于所有剩余的)

如前所述:“ content”列存储大文本(1 到 20 页文本),我需要对其进行预处理,并且我猜存储方式不同。 …

python dataframe pandas python-polars

4
推荐指数
1
解决办法
3554
查看次数

np.lexsort 在升序和降序之间切换

我有一个包含列的 numpy 数组x,想要按多列排序(其中一些可能是 类型np.str_。我知道我可以使用np.lexsort.

有没有办法指定每个排序列是否按升序/降序排列?

示例:我知道我可以按如下方式对多个列进行排序:(编辑以指示字符串列!

import numpy as np
arr = np.array([list("aaabbb"),[1,2,3,1,4,3],[1,2,3,4,6,6]]).T # Define arr
idx = np.lexsort([arr[:,1], arr[:,2]]) # sort by column 2 and then by column 1 (i.e. reversed order)
arr = arr[idx]

Run Code Online (Sandbox Code Playgroud)

我还明白我可以按降序排序,如下所示:

arr = arr[idx[::-1]]
Run Code Online (Sandbox Code Playgroud)

这会导致第一个列(第 2 列)按降序排列,后续列按升序排列。

但是我如何指定我希望首先按降序排序(第 2 列),然后按降序排序(第 1 列),以便得到以下结果。

所需输出

array([['b', 4, 6],
       ['b', 3, 6],
       ['b', 1, 4],
       ['a', 3, 3],
       ['a', 2, 2],
       ['a', 1, 1]]
Run Code Online (Sandbox Code Playgroud)

所以基本上对于我的例子来说,我正在寻找相当于:

df = pd.DataFrame(arr, columns=list("abc")) …
Run Code Online (Sandbox Code Playgroud)

python sorting numpy

3
推荐指数
1
解决办法
1244
查看次数

Python:Bokeh:使框架不可见

我现在正在玩Bokeh一段时间,我真的很惊讶创造美丽是多么容易charts.

然而,有一个我无法解决的视觉事物.

如果我转向背景和边框,我的所有图表仍然具有某种边框/边框.你也可以关掉它吗?

例如,如果我使用下面的代码来关闭我的背景,边框和轴我仍然会在绘图周围形成一个框架.

p.xaxis.visible = False
p.yaxis.visible = False 
p.xgrid.visible = False
p.ygrid.visible = False
p.background_fill_color = None
p.border_fill_color = None
Run Code Online (Sandbox Code Playgroud)

这是我的情节例子.

任何想法如何摆脱grey frame

谢谢你的帮助!

python bokeh

2
推荐指数
1
解决办法
2155
查看次数

Python:列表理解 - 更快的替代方案?

我有两个清单:

  1. 单词列表allwords(~100,000个元素)
  2. 停用词列表stopwords(~2.000元素)

我想selectedwords从列表中生成一个新列表,allwords其中包含所有不在的单词stopwords.

我通过以下列表理解实现了这一点

selectedwords = [word.lower() for word in allwords  if word.lower() not in stopwords]
Run Code Online (Sandbox Code Playgroud)

问题:有没有更聪明的方法来加速计算(使用python).我对python很新,我很感激任何建议.

谢谢!

python list-comprehension list

1
推荐指数
1
解决办法
628
查看次数

在类B的实例中存储类A的实例

我有一个问题,更多的是关于OOP,而不是特定于python.

是否可以在没有特定方法的情况下,在ClassB的实例中存储ClassA的实例,即通过某种继承.

例如:假设我有一个Model class和一个Variable class

class Model():
    def __init__(self):
        self.vars = []

    def _update_vars(self,Variable):
        self.vars.append(Variable)

class Variable(Model):
    def __init__(self,**kwargs):
        self.__dict__.update(kwargs)
Run Code Online (Sandbox Code Playgroud)

现在可以_update_vars在创建变量实例时调用.

所以,如果我做这样的事情:

mdl = Model()
varA = Variable(...)
varB = Variable(...)
Run Code Online (Sandbox Code Playgroud)

mdl.vars现在将包括varAvarB.

我知道通过将变量作为参数传递给Model的"公共"方法,我可以很容易地做到这一点.所以我不是在寻找

mdl.update_vars(varA)

所以我的两个问题是:

  1. 这可能吗?
  2. 如果是的话:这是非常非标准的OOP编程吗?

谢谢你的帮助!

python oop

1
推荐指数
1
解决办法
72
查看次数

如何自定义Go-Present模板?

我是 Go 新手,刚刚偶然发现了present我通过 导入的 Go 包go get golang.org/x/tools/present

有什么方法可以自定义演示文稿的外观吗?例如通过调整默认的css文件?

如果是这样,用于样式的文件在哪里?我在 Go 路径中的任何位置都找不到该包...

go go-present

1
推荐指数
1
解决办法
508
查看次数

没有安装excel的Pandas read_excel

这可能是一个相当愚蠢的问题:

如果我使用pd.read_excel(somefile)函数,python pandas这个函数是否需要在执行python代码的机器上安装Excel?

python excel pandas

0
推荐指数
1
解决办法
104
查看次数