是否可以使用Python Pandas构建报告?

Sco*_*tEU 6 python pandas

我目前正在使用MS Access生成报告,但我需要做的一些计算有些限制.

我正在考虑使用Python来运行报告,即每行数据一个报告,它接受列字段并将它们放在文本框中,如下所示:

报告模板

如何通过Python实现这一目标?

tuo*_*tik 10

这远远超出了Pandas,但您可以借助jinja2(模板引擎)和xhtml2pdf(将HTML转换为PDF)库轻松地从Pandas DataFrame的每一行创建PDF报告.

首先,在以下位置定义报告的结构和外观report_template.html:

<html>


<head>
    <style type="text/css">
        html, body {
            width: 500px;
            font-size: 12px;
            background: #fff;
            padding: 0px;
        }
        #my-custom-table {
            width: 500px;
            border: 0;
            margin-top: 20px;
        }
        #my-custom-table td {
            padding: 5px 0px 1px 5px;
            text-align: left;
        }
    </style>
</head>
<body>


<table cellspacing="0" border="0" style="width:500px; border:0; font-size: 14px;">
    <tr>
        <td style="text-align:left;">
            <b><span>Title of the PDF report - Row {{ row_ix + 1 }}</span></b>
        </td>
        <td style="text-align:right;">
            <b><span>{{ date }}</span></b>
        </td>
    </tr>
</table>


<table cellspacing="0" border="0" id="my-custom-table">
    {% for variable_name, variable_value in df.iteritems() %}
    {% if loop.index0 == 0 %}
    <tr style="border-top: 1px solid black;
               border-bottom: 1px solid black;
               font-weight: bold;">
        <td>Variable name</td>
        <td>Variable value</td>
    </tr>
    {% else %}
    <tr>
        <td>{{ variable_name }}</td>
        <td>{{ variable_value }}</td>
    </tr>
    {% endif %}
    {% endfor %}
</table>


</body>
</html>
Run Code Online (Sandbox Code Playgroud)

然后,运行此Python 3代码,将每行DataFrame转换为HTML字符串jinja2,然后通过xhtml2pdf以下方式将HTML转换为PDF :

from datetime import date

import jinja2
import pandas as pd
from xhtml2pdf import pisa

df = pd.DataFrame({
    "Average Introducer Score": [9, 9.1, 9.2],
    "Reviewer Scores": ["Academic: 6, 6, 6", "Something", "Content"],
    "Average Academic Score": [5.7, 5.8, 5.9],
    "Average User Score": [1.2, 1.3, 1.4],
    "Applied for (RC)": [9.2, 9.3, 9.4],
    "Applied for (FEC)": [5.5, 5.6, 5.7],
    "Duration (Months)": [36, 37, 38]})

for row_ix, row in df.iterrows():

    html = jinja2.Environment(  # Pandas DataFrame to HTML
        loader=jinja2.FileSystemLoader(searchpath='')).get_template(
        'report_template.html').render(date=date.today().strftime('%d, %b %Y'),
                                       row_ix=row_ix, df=row)

    # Convert HTML to PDF
    with open('report_row_%s.pdf' % (row_ix+1), "w+b") as out_pdf_file_handle:
        pisa.CreatePDF(
            src=html,  # HTML to convert
            dest=out_pdf_file_handle)  # File handle to receive result
Run Code Online (Sandbox Code Playgroud)

对于Python代码中指定的DataFrame,将输出3个PDF.第一个PDF看起来像这样(转换为PNG,以便能够在这里显示):通过使用Jinja2和xhtml2pdf将一行Pandas DataFrame通过HTML转换为PDF

  • Tuomastik,非常感谢你花时间帮我解决这个问题.我周一正在努力解决这个问题,并试图让我的头脑绕乳胶,并且正在询问一些人在工作(无济于事),他们在做博士期间可能有过这方面的经验......你的回答是如此更简单,我完全理解它在做什么.如果我可以给你买啤酒,我会的!:).... 谢谢!我会将你的答案标记为正确答案 (2认同)