我有一个具有两个值的数据框:
df = pd.DataFrame({'Col1': ['Table_A112', 'Table_A_112']})
Run Code Online (Sandbox Code Playgroud)
我想要做的是在 split('_') 只有数字的情况下删除数字。所需的输出是:
Table_A112
Table_A_
Run Code Online (Sandbox Code Playgroud)
为此,我使用以下代码:
import pandas as pd
import difflib
from tabulate import tabulate
import string
df = pd.DataFrame({'Col1': ['Table_A112', 'Table_A_112']})
print(tabulate(df, headers='keys', tablefmt='psql'))
df['Col2'] = df['Col1'].str.rstrip(string.digits)
print(tabulate(df, headers='keys', tablefmt='psql'))
Run Code Online (Sandbox Code Playgroud)
但它给了我以下输出:
Table_A
Table_A_
Run Code Online (Sandbox Code Playgroud)
怎样才能做我想做的事?
谢谢!
如何使用Java执行hadoop put文件到hdfs中?这可能吗?
使用这个语句:
public abstract boolean rename(Path src, Path dst) throws IOException
Run Code Online (Sandbox Code Playgroud)
?
谢谢!
我正在尝试发送带有一些 CSS 配置的表格作为正文的电子邮件。为此,我有以下代码:
import csv
from tabulate import tabulate
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
import smtplib
text = """Hello, Friend.Here is your data:{table}Regards,Me"""
html = """"\
<html>
<head>
<style type="text/css">
.tg {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-0lax{text-align:left;vertical-align:top}
</style>
</head>
<body>
<table class="tg">
<tr>
<th class="tg-0lax">Environment</th>
<th class="tg-0lax">Date</th>
<th class="tg-0lax">Error_Type</th>
<th class="tg-0lax">Error_Object</th>
<th class="tg-0lax">Description</th>
</tr>
<tr>
<td class="tg-0lax">DEV</td>
<td class="tg-0lax">15/03/2019</td>
<td class="tg-0lax">ERROR</td>
<td class="tg-0lax">Table</td>
<td class="tg-0lax">More columns than expected</td>
</tr>
</table>
</body>
</html>""" …Run Code Online (Sandbox Code Playgroud) 我有一个包含以下数据的CSV:
Customer Age
A 10
B 53
C 20
D 2
E 55
F 12
Run Code Online (Sandbox Code Playgroud)
为此,我正在使用Pandas库来阅读csv.我的问题是如何对Ages值进行分组以获得具有以下间隔的新列:
Customer Age Age_Interval
A 10 [0-10]
B 53 [50-60]
C 20 [10-20]
D 2 [0-10]
E 55 [50-60]
F 12 [10-20]
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?
谢谢!