小编Ale*_*der的帖子

如何使用正则表达式删除python pandas DataFrame中的行?

我有一个模式:

patternDel = "( \\((MoM|QoQ)\\))";
Run Code Online (Sandbox Code Playgroud)

我想删除pandas dataframe中列df['Event Name']匹配此模式的所有行.这是最好的方法吗?数据帧中有超过100k行.

python regex pandas

11
推荐指数
1
解决办法
7650
查看次数

如何使用Python从pdf文件中删除页面?

我有一些超过500页的.pdf文件,但每个文件只需要几页.有必要保留文档的标题页.我确切地知道程序应删除的页面数量.我如何使用安装在MS Visual Studio上的Python 2.7环境来做到这一点?

python pdf

10
推荐指数
1
解决办法
6799
查看次数

如何在Python Selenium中获取WebElement的类名?

我使用Selenium webdriver来废弃从网页中获取的表格,用JavaScript编写.我正在迭代表行列表.每行可以是不同的类.我想得到这个类的名称,以便我可以为每一行选择适当的操作.

table_body=table.find_element_by_tag_name('tbody')
rows=table_body.find_elements_by_tag_name('tr')
for row in rows:
    if(row.GetClassName()=="date"):
        Action1()
    else:
        Action2()
Run Code Online (Sandbox Code Playgroud)

这可能与Selenium有关吗?或建议另一种方法.

python selenium-webdriver

8
推荐指数
1
解决办法
2万
查看次数

如何以高分辨率捕获网站截图?

我想以高分辨率捕获网站的屏幕截图以识别文本或只是为了保存高质量的图像。我在 Python 2.7 中尝试了这段代码。网站http://www.flaticon.com/仅作为示例。

from selenium import webdriver
import time
driver = webdriver.PhantomJS()
#Setting large window size doesn`t resolve the problem
driver.set_window_size(16000, 12000)
driver.get('http://www.flaticon.com/')
time.sleep(3)
#set resolution 640 dots per inch for this image 
#???
driver.save_screenshot('./downloaded/img/welcome_icons.png') # save a screenshot to disk
driver.close()
Run Code Online (Sandbox Code Playgroud)

它捕获屏幕截图,但分辨率对我来说还不够。扩大窗口大小并不能解决问题。来自webside的图片仅存在于图像的一部分。似乎图像分辨率不受影响。有没有办法在保存之前明确设置图像分辨率?

python selenium-webdriver

7
推荐指数
3
解决办法
1万
查看次数

在Docker容器中自定义RStudio环境

我在Windows 10 Pro的Docker容器中使用RStudio。我使用rocker/rstudiohttps://hub.docker.com/u/rocker/提取的RStudio 图像。

要启动容器,我执行了命令:

docker run -d -p 8787:8787 -v //c/Users/<My name>/Documents/R/Rprojects:/home/rstudio/ rocker/rstudio
Run Code Online (Sandbox Code Playgroud)

然后,我可以通过以下链接从浏览器访问服务器: http:// localhost:8787 /。一切正常。

我想要做的是对RStudio环境的一些自定义。特别是,我将“工具” /“全局选项” /“编辑器”主题更改为“暗色上的粉彩”。我应用了此选项,但是只有在容器还活着的时候它才会持续存在。当我重新启动容器时,自定义选项全部消失了。

我的项目保存在运行容器时指示的文件夹中,但全局选项未保存。

因此,如何将全局选项也保存在硬盘上。也许我需要在驱动器上公开另一个文件夹,该文件夹将连接到RStudio保存全局选项的容器文件夹?

是否可以dockerfile在docker image中将全局选项预定义为新层?

r rstudio docker

6
推荐指数
1
解决办法
411
查看次数

如何使用`openpyxl`库在Excel中的合并单元格中写入?

我正在使用openpyxl库在单独的单元格中写入现有的 Excel 文件。

如何在 Excel 合并单元格中写入一些文本?

错误 AttributeError: 'MergedCell' object attribute 'value' is read-only

合并单元格时:

代码:

        wb = openpyxl.load_workbook(filename=src)
        for row in df_short.itertuples():
            ws = wb[row.sheet]
            try:
                cell = 'N'+str(row.id)
                ws[cell] = '=HYPERLINK("%s","#%s")' % (row.txt_path, row.txt)

Run Code Online (Sandbox Code Playgroud)

python excel for-loop pandas openpyxl

6
推荐指数
1
解决办法
4569
查看次数

如何排序BindingList &lt;T&gt;?

我在中存储了数千个MyClass对象BindingList<MyClass>。我想按日期属性对它们进行排序MyClass.dt

BindingList类不支持直接排序。如何BindingList<T>不对所有对象进行重复复制?我需要按升序或降序对它们进行排序。

我不需要BindingList.Sort()中SortableBindingList描述的特殊类来表现像List.Sort()。我正在寻找一两行代码的简短解决方案。

c# winforms

5
推荐指数
2
解决办法
1万
查看次数

将 pandas 数据框导出到 Excel 并设置列宽和文本换行

我必须将此数据框导出到 Excel

    import pandas as pd
    import xlsxwriter
    df1 = pd.DataFrame([['a', 'b'], ['c', 'd']],
                    index=['row 1', 'row 2'],
                    columns=['col 1', 'col 2'])

    df1.to_excel(os.path.join('tmp', "output1.xlsx"))  # doctest: +SKIP
    df2 = df1.copy()
    with pd.ExcelWriter(os.path.join('tmp', "output2.xlsx"), engine='xlsxwriter') as writer:  # doctest: +SKIP
        df1.to_excel(writer, sheet_name='Sheet_name_1')
        df2.to_excel(writer, sheet_name='Sheet_name_2')
Run Code Online (Sandbox Code Playgroud)

我知道“xlsxwriter”允许多种自定义。以上述代码为草稿,如何设置列宽和文字换行?

python-3.x pandas xlsxwriter

3
推荐指数
1
解决办法
6661
查看次数