我正在使用pdb模块来调试程序.我想了解如何退出pdb并允许程序继续完成.该程序运行起来计算成本很高,因此我不希望在没有脚本尝试完成的情况下退出.continue似乎不起作用.如何退出pdb并继续我的程序?
如果使用 Polars-python 构建如下 DataFrame:
\nimport polars as pl\nfrom polars import col\nfrom datetime import datetime\n\ndf = pl.DataFrame({\n "dates": ["2016-07-02", "2016-08-10", "2016-08-31", "2016-09-10"],\n "values": [1, 2, 3, 4]\n})\nRun Code Online (Sandbox Code Playgroud)\n如何选择特定日期范围之间的行,即 和 之间的行"2016-08-10","2016-08-31"以便期望的结果是:
\xe2\x94\x8c\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xac\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x90\n\xe2\x94\x82 dates \xe2\x94\x86 values \xe2\x94\x82\n\xe2\x94\x82 --- \xe2\x94\x86 --- \xe2\x94\x82\n\xe2\x94\x82 date \xe2\x94\x86 i64 \xe2\x94\x82\n\xe2\x95\x9e\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xaa\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xa1\n\xe2\x94\x82 2016-08-10 \xe2\x94\x86 2 \xe2\x94\x82\n\xe2\x94\x9c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x94\xbc\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x95\x8c\xe2\x94\xa4\n\xe2\x94\x82 2016-08-31 \xe2\x94\x86 3 \xe2\x94\x82\n\xe2\x94\x94\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xb4\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x98\nRun Code Online (Sandbox Code Playgroud)\n 我需要按体重分组
Name weight(kg)
Person1 4.44
Person2 37.3
Person3 36.38
Person4 39.52
Person5 81.57
Person6 43.55
Person7 91.11
Person8 5
Person9 36.48
Person10 38.25
Run Code Online (Sandbox Code Playgroud)
我的代码如下。需要根据条件分组。我的代码如下。但是我所有行都得到0到20。
if 0 <= data_file['weight(kg)'].all() < 20:
data_file['target'] = "0 to 20%"
if 20 < data_file['weight(kg)'].all() < 40:
data_file['target'] = "20 to 40%"
if 40 < data_file['weight(kg)'].all() < 60:
data_file['target'] = "40 to 60%"
if 60 < data_file['weight(kg)'].all() < 80:
data_file['target'] = "60 to 80%"
if 80 < data_file['weight(kg)'].all() <= 100:
data_file['target'] = "80 to 100%"
Run Code Online (Sandbox Code Playgroud)
预期中 …
我对 scikit 和 numpy/pandas 都很陌生,但我总体上熟悉 Python 和数据处理。我对 sk-learn 分类器的输入应该是什么格式感到困惑。我尝试使用调试器来检查 sk-learn 教程示例中使用的示例矩阵,但它们有大量成员,我无法弄清楚哪些是数据,哪些是派生的。
是否有参考规范解释数组必须是什么样子以及如何构造它才能使其成为 sk-learn 分类器的有效输入?