使用to_html将CSS类应用于Pandas DataFrame

spa*_*row 31 python dataframe pandas

我在使用Pandas"to_html"方法应用"classes"参数来设置DataFrame样式时遇到了麻烦.

"classes:str或list或tuple,默认无CSS类(es)应用于生成的html表"来自:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_html. HTML

我可以像这样呈现样式化的DataFrame(例如):

df = pd.DataFrame([[1, 2], [1, 3], [4, 6]], columns=['A', 'B'])

myhtml = df.style.set_properties(**{'font-size': '11pt', 'font-family': 'Calibri','border-collapse': 'collapse','border': '1px solid black'}).render()

with open('myhtml.html','w') as f:
    f.write(myhtml)        
Run Code Online (Sandbox Code Playgroud)

如何使用带有"to_html"的"classes"来设置数据框架的html输出,如下所示:

df.to_html('myhtml.html',classes=<something here>)
Run Code Online (Sandbox Code Playgroud)

Par*_*ait 42

Pandas' to_html只输出一个包含HTML表格标记的大字符串.classes参数是一个便利处理程序,用于提供将在先前创建的 CSS文档中引用<table>属性.因此,合并到更广泛的HTML文档构建中,引用外部CSS.to_html

有趣的是,to_html添加了<table class="dataframe mystyle">可以在CSS中单独.dataframe {...} .mystyle{...}或一起引用的双类.dataframe.mystyle {...}.下面用随机数据进行演示.

数据

import pandas as pd
import numpy as np

pd.set_option('display.width', 1000)
pd.set_option('colheader_justify', 'center')

np.random.seed(6182018)
demo_df = pd.DataFrame({'date': np.random.choice(pd.date_range('2018-01-01', '2018-06-18', freq='D'), 50),
                        'analysis_tool': np.random.choice(['pandas', 'r', 'julia', 'sas', 'stata', 'spss'],50),              
                        'database': np.random.choice(['postgres', 'mysql', 'sqlite', 'oracle', 'sql server', 'db2'],50), 
                        'os': np.random.choice(['windows 10', 'ubuntu', 'mac os', 'android', 'ios', 'windows 7', 'debian'],50), 
                        'num1': np.random.randn(50)*100,
                        'num2': np.random.uniform(0,1,50),                   
                        'num3': np.random.randint(100, size=50),
                        'bool': np.random.choice([True, False], 50)
                       },
                        columns=['date', 'analysis_tool', 'num1', 'database', 'num2', 'os', 'num3', 'bool']
          )


print(demo_df.head(10))
#      date    analysis_tool     num1      database     num2        os      num3  bool 
# 0 2018-04-21     pandas     153.474246       mysql  0.658533         ios   74    True
# 1 2018-04-13        sas     199.461669      sqlite  0.656985   windows 7   11   False
# 2 2018-06-09      stata      12.918608      oracle  0.495707     android   25   False
# 3 2018-04-24       spss      88.562111  sql server  0.113580   windows 7   42   False
# 4 2018-05-05       spss     110.231277      oracle  0.660977  windows 10   76    True
# 5 2018-04-05        sas     -68.140295  sql server  0.346894  windows 10    0    True
# 6 2018-05-07      julia      12.874660    postgres  0.195217         ios   79    True
# 7 2018-01-22          r     189.410928       mysql  0.234815  windows 10   56   False
# 8 2018-01-12     pandas    -111.412564  sql server  0.580253      debian   30   False
# 9 2018-04-12          r      38.963967    postgres  0.266604   windows 7   46   False
Run Code Online (Sandbox Code Playgroud)

CSS (另存为df_style.css)

/* includes alternating gray and white with on-hover color */

.mystyle {
    font-size: 11pt; 
    font-family: Arial;
    border-collapse: collapse; 
    border: 1px solid silver;

}

.mystyle td, th {
    padding: 5px;
}

.mystyle tr:nth-child(even) {
    background: #E0E0E0;
}

.mystyle tr:hover {
    background: silver;
    cursor: pointer;
}
Run Code Online (Sandbox Code Playgroud)

熊猫

pd.set_option('colheader_justify', 'center')   # FOR TABLE <th>

html_string = '''
<html>
  <head><title>HTML Pandas Dataframe with CSS</title></head>
  <link rel="stylesheet" type="text/css" href="df_style.css"/>
  <body>
    {table}
  </body>
</html>.
'''

# OUTPUT AN HTML FILE
with open('myhtml.html', 'w') as f:
    f.write(html_string.format(table=demo_df.to_html(classes='mystyle')))
Run Code Online (Sandbox Code Playgroud)

OUTPUT

HTML (引用df_style.css,假设在同一目录中;请参阅表中的类参数)

<html>
  <head><title>HTML Pandas Dataframe with CSS</title></head>
  <link rel="stylesheet" type="text/css" href="df_style.css"/>
  <body>
    <table border="1" class="dataframe mystyle">
  <thead>
    <tr style="text-align: center;">
      <th></th>
      <th>date</th>
      <th>analysis_tool</th>
      <th>num1</th>
      <th>database</th>
      <th>num2</th>
      <th>os</th>
      <th>num3</th>
      <th>bool</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>2018-04-21</td>
      <td>pandas</td>
      <td>153.474246</td>
      <td>mysql</td>
      <td>0.658533</td>
      <td>ios</td>
      <td>74</td>
      <td>True</td>
    </tr>
    <tr>
      <th>1</th>
      <td>2018-04-13</td>
      <td>sas</td>
      <td>199.461669</td>
      <td>sqlite</td>
      <td>0.656985</td>
      <td>windows 7</td>
      <td>11</td>
      <td>False</td>
    </tr>
    <tr>
      <th>2</th>
      <td>2018-06-09</td>
      <td>stata</td>
      <td>12.918608</td>
      <td>oracle</td>
      <td>0.495707</td>
      <td>android</td>
      <td>25</td>
      <td>False</td>
    </tr>
    <tr>
      <th>3</th>
      <td>2018-04-24</td>
      <td>spss</td>
      <td>88.562111</td>
      <td>sql server</td>
      <td>0.113580</td>
      <td>windows 7</td>
      <td>42</td>
      <td>False</td>
    </tr>
    <tr>
      <th>4</th>
      <td>2018-05-05</td>
      <td>spss</td>
      <td>110.231277</td>
      <td>oracle</td>
      <td>0.660977</td>
      <td>windows 10</td>
      <td>76</td>
      <td>True</td>
    </tr>
    ...
  </tbody>
</table>
  </body>
</html>
Run Code Online (Sandbox Code Playgroud)

HTML输出

  • 不是它不是。检查页面源代码,即使您的浏览器呈现表格,您也会看到`&lt;html&gt;`、`&lt;body&gt;` 和其他标签丢失。 (3认同)
  • 谢谢,这很令人困惑,因为在将其类与“to_html”一起使用之前,需要在“html_string”中引用 .css 文件。似乎应该有一种方法可以直接从参数指定 .css 文件。 (2认同)
  • 我认为大熊猫作者将方法标记为to_html()时确实感到困惑,而实际上是to_html_table_string()。用这种方法不能产生完整的HTML文档,而* class *是在&lt;table&gt;输出中创建的特殊属性。另外,* class *不仅保留用于CSS,还可以在Javascript / JQuery和其他语言中使用。 (2认同)

hui*_*hen 8

本质上,pandas.to_html() 只是导出一个普通的 HTML 表格。您可以在正文中的任何位置插入表格,并通过样式部分中的 CSS 控制样式。

<html>
<head>
<style> 
  table, th, td {{font-size:10pt; border:1px solid black; border-collapse:collapse; text-align:left;}}
  th, td {{padding: 5px;}}
</style>
</head>
<body>
{
  pandas.to_html()
}
</body>
</html>
Run Code Online (Sandbox Code Playgroud)


Ku *_*Pan 8

我发现最精确、坦率地说最简单的方法是跳过样式、 to_html() 等,并使用 df.to_dict() 方法将 DF 转换为字典。

具体来说,给我带来麻烦的是在 Outlook 电子邮件中显示样式化的 pandas html,因为它无法正确呈现 pandas 产生的 css 混乱。

迭代字典并生成 html,只需将键/值包装在您需要的标签中,添加类等,然后将所有这些连接到一个字符串中。然后将此 str 粘贴到带有预定义 css 的准备好的模板中。

为了方便起见,我发现导出相同的 df 两次很有用,使用 .to_dict() 和 to_dict('index') 首先填充列,然后逐行向下工作。或者只拥有相关列名称的列表。

dict_data = [df.to_dict(), df.to_dict('index')]

return_str = '<table><tr>'

for key in dict_data[0].keys():
    return_str = return_str + '<th class="header">' + key + '</th>'

return_str = return_str + '</tr>'

for key in dict_data[1].keys():
    return_str = return_str + '<tr><th class="index">' + key + '</th>'
    for subkey in dict_data[1][key]:
        return_str = return_str + '<td>' + dict_data[1][key][subkey] + '</td>'

return_str = return_str + '</tr></table>'
Run Code Online (Sandbox Code Playgroud)

然后 return_str 进入模板。