小编Mr.*_*ply的帖子

替换pandas数据框中的部分字符串

我有pandas数据框,我需要用另一个值替换vale的一部分

例如.我有

HF - Antartica
HF - America
HF - Asia

Run Code Online (Sandbox Code Playgroud)

其中我想替换HF -部分因此结果将是

Hi Funny Antartica
Hi Funny America
Hi Funny Asia

Run Code Online (Sandbox Code Playgroud)

我已经尝试过pd.replace()但它不起作用,因为我只需要替换一部分字符串,而不是整个字符串

python pandas

Mr.*_*ply

lucky-day

9
推荐指数

2
解决办法

2万
查看次数

如何将数据类型更改为 float64，以便 sklearn 可以处理数据大于 np.float32 的数据帧

在我的数据集中，很少有数据（即1.4619664882428694e+258）大于float32最大值（3.4028235e+38）。现在在拟合模型期间，我收到以下错误：

Input contains NaN, infinity or a value too large for dtype('float32').

Run Code Online (Sandbox Code Playgroud)

我试过下面的代码：

df_features = pd.read_csv('data\df_features.csv')
df_target = pd.read_csv('data\df_target.csv')

X_train, X_test, y_train, y_test = train_test_split(df_features, df_target, test_size=.25, random_state=0)

model = AdaBoostRegressor()

try:
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    acc = r2_score(y_test, y_pred)
    print(acc)

except Exception as error:
    print(error)

Run Code Online (Sandbox Code Playgroud)

如果我想使用真实数据而不进行规范化，我该如何解决这个问题？是否有任何选项，以便我可以将 sklearn 的默认数据类型设置为 float64。如果是，那么如何？

floating-point machine-learning python-3.x pandas scikit-learn

BC *_*ith

2019 11-14

6
推荐指数

1
解决办法

624
查看次数

打印关键字后面的5个字符

我想创建一个简单的代码,它接受一个文本,扫描关键字并打印关键字以及接下来的5个字符.请注意,关键字可以在文本中出现多次.

  string = 'my name is luka 90/91, I live on the second floor'
    keyword = 'luka'

    if key in string:
        print (key + key[0:5])

Run Code Online (Sandbox Code Playgroud)

输出应该是luka 90\91

python string

Mr.*_*ply

2017 02-19

3
推荐指数

1
解决办法

55
查看次数

使用urllib进行网络抓取

我试图做一些简单的网页抓取,我不断得到这个错误,我不知道什么是错的,因为我是相当新的python

例外:需要一个类似字节的对象,而不是'str'

import time
import urllib.request
import urllib.parse


stock = 'a'


def finvizKeyStats(stock):
    try:
        sourceCode = urllib.request.urlopen('http://finviz.com/quote.ashx?t='+stock).read()
        pbr = sourceCode.split('P/B</td><td width="8%" class="snapshot-td2" align="left"><b>')[1].split('</b></td>')[0]
        print(pbr)
    except Exception as e:
        print('Exception:', e)

finvizKeyStats('a')

Run Code Online (Sandbox Code Playgroud)

python urllib

Mr.*_*ply

lucky-day

0
推荐指数

1
解决办法

1154
查看次数

使用基于应用的过滤器的数据计算行/单元的数量

如何根据应用的过滤器计算包含数据的行数？

我所能找到的只是xlUp, xlDown我不能应用的方法,因为它会给我最后一行而不是带有过滤数据的行数.

例

1    animal age
2    dog    10
3    cat    15

Run Code Online (Sandbox Code Playgroud)

我在cat上应用过滤器并获得下表:

1    animal age
3    cat    15

Run Code Online (Sandbox Code Playgroud)

使用xlUp或者它会告诉我最后一行数是3,但显然只有1行有过滤数据

excel vba excel-vba

Mr.*_*ply

2018 07-10

-1
推荐指数

1
解决办法

650
查看次数

标签统计

python ×3

pandas ×2

excel ×1

excel-vba ×1

floating-point ×1

machine-learning ×1

python-3.x ×1

scikit-learn ×1

string ×1

urllib ×1

vba ×1

替换pandas数据框中的部分字符串

如何将数据类型更改为 float64，以便 sklearn 可以处理数据大于 np.float32 的数据帧

打印关键字后面的5个字符

使用urllib进行网络抓取

使用基于应用的过滤器的数据计算行/单元的数量

标签 统计

小编Mr._ply的帖子

标签统计