我有一个问题,它似乎与 pandas 库有关。我已经安装了pandas 1.5.0。使用 pandas 系列调试代码时会出现问题/错误。由于 pandas 已弃用 iteritems,因此会多次显示 FutureWarning,并在调试过程中导致一些错误。我之前尝试安装过某一版本的 pandas,但问题仍然存在。
Error:
PyCharm Community Edition 2022.2.2\plugins\python-ce\helpers\pydev\_pydevd_bundle\pydevd_utils.py:606: FutureWarning: iteritems is deprecated and will be removed in a future version. Use .items instead.
for item in s.iteritems():
Run Code Online (Sandbox Code Playgroud)
有谁知道如何解决这个问题吗?我感谢您的支持。
我有一个 NewUser 模型,它是最终用户输入的内容,我想将该对象更新为 UserInDB,以便我可以将其传递给我的数据库引擎(DynamoDB,需要一个字典)
目前我打了.dict
两次电话,这感觉不是正确的方法
from pydantic import BaseModel, Field
from datetime import datetime
from typing import Optional
from uuid import uuid4
class NewUser(BaseModel):
name: str
email: str
company_name: Optional[str]
class UserInDB(NewUser):
hash: str = Field(default_factory=uuid4)
range = 'DATA'
created_at: datetime = Field(default_factory=datetime.now)
#...
#Emulating what an end user would send
user = NewUser(name='Example', company_name='example', email='example@example.com')
#Is calling dict twice way to do it?
user_in_db = UserInDB(**user.dict()).dict()
db.create_user(user_in_db)
Run Code Online (Sandbox Code Playgroud) 我有一个巨大的数据框,有很多列和行。我按 3 列 (['color', 'category','level_1']) 对其进行排序,并且我有一列用于检查 ('check_control') 我的问题是:如何为 (['颜色'、'类别'、'level_1']) ?
import pandas as pd
data = {'Name_1': ['dshgfj', 'krihgfjsh', 'dfgfd', 'dff','gcgt','hjgjh','et','asd','hhj','hg','jh','jhk'],
'Name_2': ['dsf', 'dsfs', 'bilsdfl', 'sfsd', 'tcbcvbo','hghjg','bvnbhj','hga','kjk','kjh','hjjh','jkh'],
'color': ['black', 'red', 'white', 'yellow', 'blue','green','orange','black','green','black','green','black'],
'category': ['a', 'b', 'a', 'b', 'b','c','c','a','c','a','c','a'],
'level_1': [1, 1, 1, 1, 1,1,1,2,2,3,3,4],
'check_control':['','check','','check','','check','check','','','check','check','check']
}
df = pd.DataFrame(data)
print(df)
df_fix = df.sort_values(['color', 'category','level_1'], ascending=[True, True,True])
print(df_fix)
Run Code Online (Sandbox Code Playgroud)
Name_1 Name_2 color category level_1 check_control
0 dshgfj dsf black a 1
1 krihgfjsh dsfs red b 1 check
2 dfgfd bilsdfl …
Run Code Online (Sandbox Code Playgroud) 我有数据帧 Df 的输出,我可以将其作为附件在邮件中发送,但无法在消息正文中打印 Df 值。请建议在电子邮件正文中打印我的 Df 值,这样我就不必添加附件。
import win32com.client as win32
outlook = win32.Dispatch('outlook.application')
mail = outlook.CreateItem(0)
mail.To = 'abc@xyg.com'
mail.Subject = 'Madsaage Subject'
mail.Body = 'print(Df)'
mail.HTMLBody = 'Please Find Attached' # This field is optional
# To attach a file to the email (optional):
mail.Attachments.Add('C:/XYZ/transport.csv')
mail.Send()
Run Code Online (Sandbox Code Playgroud) 我有一个包含重复项的 DataFrame。我想删除带有groupby
和 条件的重复项。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'id': [0, 1, 2, 3, 4, 5],
'nm': ['A','A','A','B','B','B'],
'Rev': ['$10','$20','$30','$40','$50','$60'],
'Exp': ['$2','$4','$6','$8','$10','$12'],
'Dt': ['2019-03-01', '2020-09-30', np.nan, '2021-09-30', '2022-04-01', ' ']
})
Run Code Online (Sandbox Code Playgroud)
重复数据删除后,我想保留最近日期的行。
因此,对于每个组nm
,保留具有最近日期的行。请注意,日期可能是空白' '
字符串或np.nan
.
预期输出:
id nm Rev Exp Dt
1 A $20 $4 2020-09-30
4 B $50 $10 2022-04-01
Run Code Online (Sandbox Code Playgroud)