小编Mr.*_*ply的帖子

替换pandas数据框中的部分字符串

我有pandas数据框,我需要用另一个值替换vale的一部分

例如.我有

HF - Antartica
HF - America
HF - Asia
Run Code Online (Sandbox Code Playgroud)

其中我想替换HF -部分因此结果将是

Hi Funny Antartica
Hi Funny America
Hi Funny Asia
Run Code Online (Sandbox Code Playgroud)

我已经尝试过pd.replace()但它不起作用,因为我只需要替换一部分字符串,而不是整个字符串

python pandas

9
推荐指数
2
解决办法
2万
查看次数

如何将数据类型更改为 float64,以便 sklearn 可以处理数据大于 np.float32 的数据帧

在我的数据集中,很少有数据(即1.4619664882428694e+258)大于float32最大值(3.4028235e+38)。现在在拟合模型期间,我收到以下错误:

Input contains NaN, infinity or a value too large for dtype('float32').
Run Code Online (Sandbox Code Playgroud)

我试过下面的代码:

df_features = pd.read_csv('data\df_features.csv')
df_target = pd.read_csv('data\df_target.csv')

X_train, X_test, y_train, y_test = train_test_split(df_features, df_target, test_size=.25, random_state=0)

model = AdaBoostRegressor()

try:
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    acc = r2_score(y_test, y_pred)
    print(acc)

except Exception as error:
    print(error)
Run Code Online (Sandbox Code Playgroud)

如果我想使用真实数据而不进行规范化,我该如何解决这个问题?是否有任何选项,以便我可以将 sklearn 的默认数据类型设置为 float64。如果是,那么如何?

floating-point machine-learning python-3.x pandas scikit-learn

6
推荐指数
1
解决办法
624
查看次数

打印关键字后面的5个字符

我想创建一个简单的代码,它接受一个文本,扫描关键字并打印关键字以及接下来的5个字符.请注意,关键字可以在文本中出现多次.

  string = 'my name is luka 90/91, I live on the second floor'
    keyword = 'luka'

    if key in string:
        print (key + key[0:5])
Run Code Online (Sandbox Code Playgroud)

输出应该是luka 90\91

python string

3
推荐指数
1
解决办法
55
查看次数

使用urllib进行网络抓取

我试图做一些简单的网页抓取,我不断得到这个错误,我不知道什么是错的,因为我是相当新的python

例外:需要一个类似字节的对象,而不是'str'

import time
import urllib.request
import urllib.parse


stock = 'a'


def finvizKeyStats(stock):
    try:
        sourceCode = urllib.request.urlopen('http://finviz.com/quote.ashx?t='+stock).read()
        pbr = sourceCode.split('P/B</td><td width="8%" class="snapshot-td2" align="left"><b>')[1].split('</b></td>')[0]
        print(pbr)
    except Exception as e:
        print('Exception:', e)

finvizKeyStats('a')
Run Code Online (Sandbox Code Playgroud)

python urllib

0
推荐指数
1
解决办法
1154
查看次数

使用基于应用的过滤器的数据计算行/单元的数量

如何根据应用的过滤器计算包含数据的行数?

我所能找到的只是xlUp, xlDown我不能应用的方法,因为它会给我最后一行而不是带有过滤数据的行数.

1    animal age
2    dog    10
3    cat    15
Run Code Online (Sandbox Code Playgroud)

我在cat上应用过滤器并获得下表:

1    animal age
3    cat    15
Run Code Online (Sandbox Code Playgroud)

使用xlUp或者它会告诉我最后一行数是3,但显然只有1行有过滤数据

excel vba excel-vba

-1
推荐指数
1
解决办法
650
查看次数