我有以下文件:
总统诺伯特·拉姆特博士:我宣布会议开幕.
我现在请Bundesminister Alexander Dobrindt发言.
(CDU/CSU的掌声和社民党的代表)
运输和数字基础设施部长Alexander Dobrindt:
女士们,先生们.我们今天将开始对有史以来最大的基础设施投资,超过2700亿欧元,超过1000个项目和明确的融资视角.
(Volker Kauder [CDU/CSU]:Genau!)
(CDU/CSU和SPD的掌声)
当我阅读那些.txt文档时,我想创建一个第二列,指示说话者姓名.
所以我尝试的是首先创建一个包含所有可能名称的列表并替换它们.
library(qdap)
members <- c("Alexander Dobrindt, Minister for Transport and Digital Infrastructure:","President Dr. Norbert Lammert:")
members_r <- c("@Alexander Dobrindt, Minister for Transport and Digital Infrastructure:","@President Dr. Norbert Lammert:")
prok <- scan(".txt", what = "character", sep = "\n")
prok <- mgsub(members,members_r,prok)
prok <- as.data.frame(prok)
prok$speaker <- grepl("@[^\\@:]*:",prok$prok, ignore.case = T)
Run Code Online (Sandbox Code Playgroud)
我的计划是获取@和之间的名称:通过正则表达式,如果说话者==真并向下应用它,直到有一个不同的名称(并明显删除所有的掌声/喊叫括号),但这也是我不知道如何我可以做到.
我最近切换到 Visual Studio Code 并想使用 Jupyter Notebooks。我已经安装了ms-python扩展,并且还jupyter包,描述在这里。
但是,重新加载后,我没有 command Python: Create Blank New Jupyter Notebook,如果我打开现有笔记本,将显示 HTML/CSS 而不是实际的笔记本视图。我还没有在网上找到与此问题相关的任何内容。
我有一个字符串列表,我想转换为int,或从一开始就在int中.
任务是从文本中提取数字(并得到总和).我做的是这样的:
for line in handle:
line = line.rstrip()
z = re.findall("\d+",line)
if len(z)>0:
lst.append(z)
print (z)
Run Code Online (Sandbox Code Playgroud)
这给了我一个像这样的清单[['5382', '1399', '3534'], ['1908', '8123', '2857'].我尝试map(int,...了另一件事,但我得到的错误如下:
TypeError: int() argument must be a string, a bytes-like object or a number, not 'list'
Run Code Online (Sandbox Code Playgroud) 我正在尝试在matplotlib中绘制圆,但是结果始终是空图。
例如
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
import matplotlib.collections as mcollections
fig = plt.figure()
fig.set_size_inches(18.5, 10.5, forward=True)
ax = fig.add_subplot(111, aspect='equal')
x = np.array([17., 29., 41., 3., 15.])
y = np.array([21., 41., 30., 19., 5.])
r = np.array([22.8035085, 46.04345773, 46.61544808, 16., 12.16552506])
patches = [mpatches.Circle((xx, yy), rr) for xx, yy, rr in zip(x, y, r)]
collection = mcollections.PatchCollection(patches)
ax.add_collection(collection)
fig.savefig("test.png")
Run Code Online (Sandbox Code Playgroud)
这将产生一个空图,与尝试add_artist时相同。希望有人可以指出我要去哪里了!谢谢
我试图通过URL列表来搜索一些IMDB数据.不幸的是,我的输出并不是我所希望的,更不用说将它存储在数据帧中了.
我得到了网址
library(rvest)
topmovies <- read_html("http://www.imdb.com/chart/top")
links <- top250 %>%
html_nodes(".titleColumn") %>%
html_nodes("a") %>%
html_attr("href")
links_full <- paste("http://imdb.com",links,sep="")
links_full_test <- links_full[1:10]
Run Code Online (Sandbox Code Playgroud)
然后我可以得到满意的内容
lapply(links_full_test, . %>% read_html() %>% html_nodes("h1") %>% html_text())
Run Code Online (Sandbox Code Playgroud)
但它是一个嵌套列表,我不知道如何将它放入R中的正确data.frame中.同样,如果我想获得另一个属性,请说
%>% read_html() %>% html_nodes("strong span") %>% html_text()
Run Code Online (Sandbox Code Playgroud)
要检索IMDB评级,我得到相同的嵌套列表输出,最重要的是我必须做两次read_html()...这需要花费很多时间.有一个更好的方法吗?我想for循环,但我无法让它以这种方式工作:(
我一直试图了解arc svg,因为似乎我需要用圆弧-我的目标是绘制圆交点。
我最初的想法是这样的:
对于每个交叉路口,都要找到起点和终点坐标以及高度-但是我不太确定从这里到哪里。看来我缺少旋转和“大弧形标志/扫掠”参数,而且我不确定如何去检索它们。如果有人可以在这里为我指明正确的方向,那就太好了!
python ×4
r ×2
javascript ×1
list ×1
matplotlib ×1
plot ×1
plotly ×1
rvest ×1
string ×1
svg ×1
text-mining ×1
trigonometry ×1
web-scraping ×1