小编Rav*_*i G的帖子

阻止 pandas read_excel() 将所有百分比值除以一百?

我正在使用 pandas (1.0.5) 加载 xlsx 文件,并注意到带有百分号的值(例如 0.3%)会自动除以 100。

我知道如何将该列作为字符串加载,但不明白为什么它将值除以 100。理想情况下,我希望只包含没有百分号的浮点值。现在我剥离了 % 并转换了列,但必须有更好的方法。将数据加载为 CSV 时不会发生这种情况。

df = pd.read_excel("testfile.xlsx")
Run Code Online (Sandbox Code Playgroud)

输入.xlsx:

|alpha|beta|
|:-|:-|
|0.3%|0.34%|
Run Code Online (Sandbox Code Playgroud)

结果数据框:

|alpha|beta|
|:-|:-|
|0.003|0.0034|
Run Code Online (Sandbox Code Playgroud)

python xlsx dataframe pandas

5
推荐指数
0
解决办法
524
查看次数

熊猫 sort_values 函数中轴 = 1 的含义是什么?

我有以下代码片段。

df = pd.DataFrame({'col1' : ['A', 'A', 'B', np.nan, 'D', 'C'],
                   'col2' : [2, 1, 9, 8, 7, 4],
                   'col3': [0, 1, 9, 4, 2, 3]})
print(df)
sorted=df.sort_values(by=1,axis=1)
print(sorted)
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

以上数据为原始数据框。

在此处输入图片说明

以上是 df.sort_values() 函数的输出。

谁能解释这里发生了什么?

python pandas

4
推荐指数
1
解决办法
9039
查看次数

AttributeError:模块“ boto”没有属性“ plugin”

我正在使用Jupyter Notebook和word2vec模型在Google Cloud Platform上运行VM。我有以下代码片段:

from gensim.models import Word2Vec
amazon_word2vec = Word2Vec(model, min_count=1, size=100)
Run Code Online (Sandbox Code Playgroud)

并导致错误:

AttributeError: module 'boto' has no attribute 'plugin'
Run Code Online (Sandbox Code Playgroud)

以上问题的解决方法是什么?

python google-compute-engine google-cloud-platform word2vec jupyter-notebook

2
推荐指数
1
解决办法
1420
查看次数

获取名称为 mlflow 实验的运行 ID?

我目前在 mlflow 中创建了一个实验,并在实验中创建了多次运行。

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
import mlflow

experiment_name="experiment-1"
mlflow.set_experiment(experiment_name)

no_of_trees=[100,200,300]
depths=[2,3,4]
for trees in no_of_trees:
    for depth in depths:
        with mlflow.start_run() as run:
            model=RandomForestRegressor(n_estimators=trees, criterion='mse',max_depth=depth)
            model.fit(x_train, y_train)
            predictions=model.predict(x_cv)
            mlflow.log_metric('rmse',mean_squared_error(y_cv, predictions))
Run Code Online (Sandbox Code Playgroud)

创建运行后,我想获得此实验的最佳 run_id。现在,我可以通过查看 mlflow 的 UI 来获得最佳运行效果,但是我们如何才能正确地执行程序?

python mlflow

2
推荐指数
2
解决办法
1054
查看次数