小编ero*_*oar的帖子

分裂音箱和RStudio中的对话

我有以下文件:

总统诺伯特·拉姆特博士:我宣布会议开幕.

我现在请Bundesminister Alexander Dobrindt发言.

(CDU/CSU的掌声和社民党的代表)

运输和数字基础设施部长Alexander Dobrindt:

女士们,先生们.我们今天将开始对有史以来最大的基础设施投资,超过2700亿欧元,超过1000个项目和明确的融资视角.

(Volker Kauder [CDU/CSU]:Genau!)

(CDU/CSU和SPD的掌声)

当我阅读那些.txt文档时,我想创建一个第二列,指示说话者姓名.

所以我尝试的是首先创建一个包含所有可能名称的列表并替换它们.

library(qdap)

members <- c("Alexander Dobrindt, Minister for Transport and Digital Infrastructure:","President Dr. Norbert Lammert:")
members_r <- c("@Alexander Dobrindt, Minister for Transport and Digital Infrastructure:","@President Dr. Norbert Lammert:")

prok <- scan(".txt", what = "character", sep = "\n")
prok <- mgsub(members,members_r,prok)

prok <- as.data.frame(prok)
prok$speaker <- grepl("@[^\\@:]*:",prok$prok, ignore.case = T)
Run Code Online (Sandbox Code Playgroud)

我的计划是获取@和之间的名称:通过正则表达式,如果说话者==真并向下应用它,直到有一个不同的名称(并明显删除所有的掌声/喊叫括号),但这也是我不知道如何我可以做到.

r text-mining

6
推荐指数
1
解决办法
217
查看次数

无法在 VSCode 中打开 jupyter notebook

我最近切换到 Visual Studio Code 并想使用 Jupyter Notebooks。我已经安装了ms-python扩展,并且还jupyter包,描述在这里

但是,重新加载后,我没有 command Python: Create Blank New Jupyter Notebook,如果我打开现有笔记本,将显示 HTML/CSS 而不是实际的笔记本视图。我还没有在网上找到与此问题相关的任何内容。

python visual-studio-code jupyter-notebook vscode-settings

5
推荐指数
1
解决办法
1万
查看次数

将字符串列表转换为int

我有一个字符串列表,我想转换为int,或从一开始就在int中.

任务是从文本中提取数字(并得到总和).我做的是这样的:

for line in handle:
    line = line.rstrip()
    z = re.findall("\d+",line)
    if len(z)>0:
        lst.append(z)
print (z)
Run Code Online (Sandbox Code Playgroud)

这给了我一个像这样的清单[['5382', '1399', '3534'], ['1908', '8123', '2857'].我尝试map(int,...了另一件事,但我得到的错误如下:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'list'
Run Code Online (Sandbox Code Playgroud)

python string list type-conversion

4
推荐指数
1
解决办法
328
查看次数

Matplotlib图变成空白

我正在尝试在matplotlib中绘制圆,但是结果始终是空图。

例如

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
import matplotlib.collections as mcollections

fig = plt.figure()
fig.set_size_inches(18.5, 10.5, forward=True)
ax = fig.add_subplot(111, aspect='equal')

x = np.array([17., 29., 41.,  3., 15.])
y = np.array([21., 41., 30., 19., 5.])
r = np.array([22.8035085, 46.04345773, 46.61544808, 16.,  12.16552506])

patches = [mpatches.Circle((xx, yy), rr) for xx, yy, rr in zip(x, y, r)]
collection = mcollections.PatchCollection(patches)
ax.add_collection(collection) 

fig.savefig("test.png")
Run Code Online (Sandbox Code Playgroud)

这将产生一个空图,与尝试add_artist时相同。希望有人可以指出我要去哪里了!谢谢

python plot matplotlib

4
推荐指数
2
解决办法
9166
查看次数

Rvest:抓取多个网址

我试图通过URL列表来搜索一些IMDB数据.不幸的是,我的输出并不是我所希望的,更不用说将它存储在数据帧中了.

我得到了网址

library(rvest)
topmovies <- read_html("http://www.imdb.com/chart/top")
links <- top250 %>%
  html_nodes(".titleColumn") %>%
  html_nodes("a") %>%
  html_attr("href")
links_full <- paste("http://imdb.com",links,sep="")
links_full_test <- links_full[1:10]
Run Code Online (Sandbox Code Playgroud)

然后我可以得到满意的内容

lapply(links_full_test, . %>% read_html() %>% html_nodes("h1") %>% html_text())
Run Code Online (Sandbox Code Playgroud)

但它是一个嵌套列表,我不知道如何将它放入R中的正确data.frame中.同样,如果我想获得另一个属性,请说

%>% read_html() %>% html_nodes("strong span") %>% html_text()
Run Code Online (Sandbox Code Playgroud)

要检索IMDB评级,我得到相同的嵌套列表输出,最重要的是我必须做两次read_html()...这需要花费很多时间.有一个更好的方法吗?我想for循环,但我无法让它以这种方式工作:(

r web-scraping rvest

3
推荐指数
2
解决办法
3463
查看次数

Arc SVG参数

我一直试图了解arc svg,因为似乎我需要用圆弧-我的目标是绘制圆交点。

我最初的想法是这样的:

在此处输入图片说明

对于每个交叉路口,都要找到起点和终点坐标以及高度-但是我不太确定从这里到哪里。看来我缺少旋转和“大弧形标志/扫掠”参数,而且我不确定如何去检索它们。如果有人可以在这里为我指明正确的方向,那就太好了!

javascript python svg trigonometry plotly

1
推荐指数
1
解决办法
588
查看次数