小编Mih*_*iha的帖子

pyspark 数据帧的联合列表

假设我有一个 pyspark 数据帧列表：[df1, df2, ...]，我想要的是将它们联合起来（所以实际上是这样做的df1.union(df2).union(df3)...。实现这一目标的最佳实践是什么？

pyspark

Mih*_*iha

lucky-day

7
推荐指数

1
解决办法

8860
查看次数

当使用scipy.optimize.fmin_bfgs时,我得到了TypeError:f()缺少1个必需的位置参数:

我正在尝试使用scipy.optimize.fmin_bfgs()函数计算六驼峰驼峰函数的最小值.这是我的代码:

import numpy as np
import matplotlib.pyplot as plt
from scipy import optimize

def f(x,y):
    return (4 - 2.1*x**2 + x**4/3)*x**2 + x*y + (4*y**2 - 4)*y**2

x0 = [0,0]

optimize.fmin_bfgs(f, x0)

Run Code Online (Sandbox Code Playgroud)

输出:

TypeError: f() missing 1 required positional argument: 'y'

Run Code Online (Sandbox Code Playgroud)

我猜我传递x0的方式有问题吗？

python numpy scipy

Mih*_*iha

lucky-day

4
推荐指数

1
解决办法

2999
查看次数

np.genfromtxt 多个分隔符？

我的文件如下所示：

1497484825;34425;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14
1497484837;34476;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14

Run Code Online (Sandbox Code Playgroud)

我想使用 np.genfromtxt 将其导入 numpy 数组。最大的问题是它有“;” 和 ',' 作为分隔符。我的尝试：

import numpy as np
import io

s = io.StringIO(open('2e70dfa1.csv').read().replace(';',','))

data = np.genfromtxt(s,dtype=int,delimiter=',')

Run Code Online (Sandbox Code Playgroud)

我收到错误：

类型错误：无法将“bytes”对象隐式转换为 str

怎么解决呢？我也愿意接受全新（更好）的想法。

python arrays numpy typeerror genfromtxt

Mih*_*iha

2017 06-26

3
推荐指数

1
解决办法

7154
查看次数

使用Pandas中的窗口进行动态异常值检测

我想实现异常值检测,它将使用一个窗口来检查下一个元素是否是异常值.假设我们在pd上使用长度为3的窗口.这样的系列:[0,1,2,3,4].我会在[0,1,2]上计算中位数和疯狂(或平均值和标准值)并检查3是否是异常值.
我实现了一个for循环解决方案,但它确实很慢.

python series pandas

Mih*_*iha

lucky-day

2
推荐指数

1
解决办法

315
查看次数

R：根据值自动转换列类型

我有很多专栏文章。我不想一一更改。比方说，tible看起来像这样：

df <- tibble(
  x = c(1,0,1,1,'a'), 
  y = c('A', 'B', 1, 'D', 'A'), 
  z = c(1/3, 4, 5/7, 100, 3)
)

Run Code Online (Sandbox Code Playgroud)

我想根据其他标题中的值转换其列类型：

df_map <- tibble(
  col = c('x','y','z'), 
  col_type = c('integer', 'string', 'float')
)

Run Code Online (Sandbox Code Playgroud)

什么是最合适的解决方案？

r type-conversion dataframe tibble

Mih*_*iha

2019 08-18

1
推荐指数

1
解决办法

70
查看次数

反转转换配方步骤的优雅方法（规范化和记录）？

转换回由配方转换的列outcome（在本例中为）的最优雅的方法是什么？mpg该解决方案可以是通用的（如果存在或仅适用于log和normalize步骤（如下编码）。

可能有用的链接：此处
讨论了一般解决方案，但我认为它尚未实施。这里提供了 R 函数的解决方案，但我不确定在这种情况下是否可以提供帮助。
scale

library(recipes)

data <- tibble(mtcars) %>% 
    select(cyl, mpg)

rec <- recipe(mpg ~ ., data = data) %>%
    step_log(all_numeric()) %>%
    step_normalize(all_numeric()) %>%
    prep()

data_baked <- bake(rec, new_data = data)

# model fitting, predictions, etc...

# how to invert/transform back predictions (estimates) and true outcomes

Run Code Online (Sandbox Code Playgroud)

r r-recipes tidymodels

Mih*_*iha

2021 01-27

1
推荐指数

1
解决办法

668
查看次数