小编Gav*_*vin的帖子

如何抑制CatBoost迭代结果？

我正在尝试使用CatBoost来拟合二进制模型。当我使用以下代码时，我认为verbose=False可以帮助抑制迭代日志。但事实并非如此。有没有办法避免打印迭代？

model=CatBoostClassifier(iterations=300, depth=6, learning_rate=0.1, 
loss_function='Logloss',
         rsm = 0.95, 
         border_count = 64, 
         eval_metric =  'AUC', 
         l2_leaf_reg= 3.5, 
         one_hot_max_size=30, 
         use_best_model = True,
         verbose=False,
         random_seed = 502)

model.fit(X_train, y_train,
     eval_set=(X_test_filtered, y_test_num),   
     verbose = False,
     plot=True)

Run Code Online (Sandbox Code Playgroud)

python catboost

Gav*_*vin

2019 01-22

7
推荐指数

2
解决办法

2750
查看次数

如何使用python选择前X列和最后Y列

我正在尝试从数据框中选择第 1 到 8 列和最后一列。我有一些愚蠢的方法来做到这一点

第 1 步：选择前 8 列

df1 = df[df.columns[range(9)]]

Run Code Online (Sandbox Code Playgroud)

第 2 步：选择最后一列

df2 = df[df.columns[-1]]

Run Code Online (Sandbox Code Playgroud)

步骤3：结合步骤1和步骤2

df1.join(df2)

Run Code Online (Sandbox Code Playgroud)

有没有更好的方法可以一步而不是 3 步做到这一点？

python pandas

Gav*_*vin

2017 03-07

6
推荐指数

1
解决办法

2万
查看次数

Python错误加载谷歌API的JSON代码

我正在使用谷歌地理编码API来使用Python 3.5测试以下Python代码.但是收到以下错误.代码是从Coursera的示例代码中复制的.我们假设能够测试任何位置.例如:密歇根州安娜堡

在加载JSON代码时有任何关于我为什么会遇到错误的想法:

从None> JSONDecodeError中提出JSONDecodeError("期望值",s,err.value):期望值

这是代码:

import urllib
import json

serviceurl = 'http://maps.googleapis.com/maps/api/geocode/json?'

while True:
    address = input('Enter location: ')
    if len(address) < 1 : break

    url = serviceurl + urllib.parse.urlencode({'sensor':'false',
       'address': address})
    print ('Retrieving', url)
    uh = urllib.request.urlopen(url)
    data = uh.read()
    print ('Retrieved',len(data),'characters')

    js = json.loads(str(data))

Run Code Online (Sandbox Code Playgroud)

python json google-geocoding-api

Gav*_*vin

2016 01-04

5
推荐指数

3
解决办法

4万
查看次数

更改seaborn水平条形图的颜色

我正在尝试绘制水平条形图。它有效，但颜色是彩虹风格的。如何将每个条形的颜色更改为相同的颜色？

%pyspark
import seaborn as sns
import matplotlib
matplotlib.use('agg')
import matplotlib.pyplot as plt
plt.clf()

sns.set_context("notebook", font_scale=0.5)

# plot barchart by x axis and use different color for day
sns.barplot(x = "scaled_importance", 
        y = "variable", 
        data = best_gbm_varimp[:10],
        orient = "h")

show(plt)

Run Code Online (Sandbox Code Playgroud)

python

Gav*_*vin

lucky-day

5
推荐指数

1
解决办法

1万
查看次数

如何采取下限和上限来消除异常值

如何计算 99% 和 1% 百分位数作为每列的上限和下限，如果值 >= 99% 百分位数，则将该值重新定义为 99% 百分位数的值；类似地，如果 value <= 1% 百分位数，则将 value 重新定义为 1% 百分位数的值

np.random.seed(2)
df = pd.DataFrame({'value1': np.random.randn(100), 'value2': np.random.randn(100)})
df['lrnval'] = np.where(np.random.random(df.shape[0])>=0.7, 'learning', 'validation')

Run Code Online (Sandbox Code Playgroud)

如果我们有数百列，我们可以使用 apply 函数代替 do 循环吗？

python pandas

Gav*_*vin

2017 02-16

4
推荐指数

1
解决办法

2万
查看次数