这个周末我参加了 Python 训练营,但由于这个问题,我什至无法在我的计算机上使用 Python。我所有的导师也都被难住了。
问题是我ModuleNotFoundError在 Jupyter 上得到了多个不同的包,包括 Pandas 和 Requests(但奇怪的是,BeautifulSoup并且CSV工作正常。)
以下是我启动新 Jupyter 文件的方法:
import pandas as pd并取回ModuleNotFoundError.我使用的是Python 3.6.5版本。
尝试修复此问题但失败了:
创建了全新的目录
pipenv install jupyter pandas --skip-lock
使用以下命令卸载系统范围内的所有内容:
pip freeze > requirements.txt
pip uninstall -r requirements.txt -y
Run Code Online (Sandbox Code Playgroud)
virtualenv first-python-notebook
cd first-python-notebook
cd Scripts
activate
cd .. …Run Code Online (Sandbox Code Playgroud) 每当我使用 ggsave 和 scale 保存绘图时,绘图的大小都会增加,但文本的大小不会增加。
ggplot(economics, aes(date, unemploy)) +
geom_line(color="#2fb2ab") +
theme_ipsum() +
theme(
text = element_text(family="Georgia"),
axis.title.x = element_text(hjust=0.5, size=13, family="Georgia"),
axis.title.y = element_text(hjust=0.5, size=13, family="Georgia"),
panel.border = element_rect(colour = "black", fill=NA))+
ylab("Unemployment") +
xlab("Date")
ggsave("sample_graph.png", scale = 2)
ggsave("sample_graph2.png", scale = 3)
Run Code Online (Sandbox Code Playgroud)
这是图1:
这是图2:
如何让它同时缩放图形大小和字体?我不想手动设置高度和宽度。
我正在创建一个函数来创建哑铃图,图例位于底部。但是,它距离 x 轴标题太远。我想将其稍微向上移动,使其位于 x 轴下方 10 像素处。
这是代码:
vertical_theme = theme_bw(base_family = "Georgia") +
theme(
panel.border = element_rect(color = "black", fill=NA),
axis.title.x = element_text(hjust=0.5, size = 10, margin=margin(t=10, b=10)),
axis.text.y = element_text(size=10, margin=margin(r=10), color="black", hjust=0),
axis.text.x = element_text(size=10, margin=margin(t=10), color="black"),
axis.title.y = element_blank(),
legend.title = element_blank(),
legend.position= "bottom",
legend.text = element_text(size = 10, margin = margin(r = 10)),
panel.grid.major.y = element_blank() ,
panel.grid.minor.y = element_blank(),
panel.grid.major.x = element_line(size=1),
panel.grid.minor.x = element_blank(),
plot.margin = margin(10, 30, 10, 10, "pt"))
dumbbell = …Run Code Online (Sandbox Code Playgroud) 我下载了 42 个 PDF,每个 PDF 的格式都相似。每个都有不同的表格,其中一张标有“校园报告事件”。该特定表格位于每个 PDF 的不同页面上。我想编写一个函数来搜索具有“校园报告事件”的页面并抓取该表,以便我可以将其放入数据框中。
我想我可以使用 PDFPlumber 搜索字符串“Campus Reported Incidents”并返回页码。然后我会写一个函数,使用页码来抓取我想要的表格,我会在每个 PDF 中循环这个函数。但是,我不断收到错误“参数不可迭代”或“类型对象不可下标”。我查看了 PDFPlumber 文档,但对我的问题没有帮助。
这是我尝试过的一个代码示例:
url = "pdfs/example.pdf"
import pdfplumber
pdf = pdfplumber.open(url)
for page in range[0:len(pdf.pages)]:
if 'Total number of physical restraints' in pdf.pages[page]:
print(pdf.page_number)
Run Code Online (Sandbox Code Playgroud)