小编kil*_*les的帖子

何时在熊猫中使用多索引与xarray

该大熊猫透视表的文件似乎建议更换使用multiindexing数据超过两个维度进行处理:

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: import pandas.util.testing as tm; tm.N = 3

In [4]: def unpivot(frame):
   ...:         N, K = frame.shape
   ...:         data = {'value' : frame.values.ravel('F'),
   ...:                 'variable' : np.asarray(frame.columns).repeat(N),
   ...:                 'date' : np.tile(np.asarray(frame.index), K)}
   ...:         return pd.DataFrame(data, columns=['date', 'variable', 'value'])
   ...: 

In [5]: df = unpivot(tm.makeTimeDataFrame())

In [6]: df
Out[6]: 
         date variable     value    value2
0  2000-01-03        A  0.462461  0.924921
1  2000-01-04        A -0.517911 -1.035823
2  2000-01-05 …

Run Code Online (Sandbox Code Playgroud)

python multi-index data-structures pandas xarray

kil*_*les

lucky-day

9
推荐指数

1
解决办法

2838
查看次数

numpy - 如何选择除一系列索引之外的数组中的所有元素？

说我有一些长数组和一系列指数.如何选择除那些指数以外的所有内容？我找到了一个解决方案,但它并不优雅:

import numpy as np
x = np.array([0,10,20,30,40,50,60])
exclude = [1, 3, 5]
print x[list(set(range(len(x))) - set(exclude))]

Run Code Online (Sandbox Code Playgroud)

python arrays numpy

kil*_*les

lucky-day

8
推荐指数

3
解决办法

1万
查看次数

从时间戳%j%Y%H:%M中删除前导零

我的时间戳在表格中

0992006 09:00

Run Code Online (Sandbox Code Playgroud)

我需要删除前导零以获取此表单:

992006 9:00

Run Code Online (Sandbox Code Playgroud)

这是我现在使用的代码,它不会删除前导零:

prediction$TIMESTAMP <- as.character(format(prediction$TIMESTAMP, '%j%Y %H:%M'))

Run Code Online (Sandbox Code Playgroud)

regex r date

kil*_*les

2014 09-13

7
推荐指数

3
解决办法

706
查看次数

给定建筑物高度的水累积算法

我正在练习算法,我已经坚持了几天这个问题.当我测试我的解决方案时,我仍然是错误的.这是问题陈述:

纽约华尔街以其令人叹为观止的摩天大楼而闻名.但是下雨的季节即将到来,今年将落在建筑物上的水量将会很大.由于每栋建筑物都被固定在左侧和右侧的建筑物上(除了第一个和最后一个),只有当建筑物的高度高于建筑物的高度时,水才会从建筑物中泄漏出来.向左或向右(华尔街边缘的高度为0).所有建筑物的宽度均为1米.从左到右给出华尔街建筑物的高度(以米为单位),您的任务是打印到华尔街建筑物上的总水量(立方米)标准输出(标准输出) .

输入示例:

heights: [9 8 7 8 9 5 6]

Run Code Online (Sandbox Code Playgroud)

示例输出:

Run Code Online (Sandbox Code Playgroud)

说明: 在这个例子中,在第一个和第五个建筑物之间有4立方米的水(第二个是1个,第三个是2个,第四个是1个),第五个和第七个建筑之间有1个立方米水(在第六栋楼).

我解决这个问题的方法是找到全局最大值,并使用这些最大值的差异来计算积水量.我考虑到最后使用local_water变量可能遗漏的水.任何人都可以帮我找到算法或代码中的错误吗？

注意:我正在寻找一种只能通过每个元素一次的解决方案

这是我输入错误的输入:

heights: [8,8,4,5]

Run Code Online (Sandbox Code Playgroud)

这个输入应该产生1,而不是我的答案0.

这是我的代码:

def skyscrapers(heights):
    heights.insert(0,0)
    heights.append(0)
    local_max = 0
    global_max = 0
    total_water = 0
    local_water = 0
    end_water = []
        # end_water records water heights to be used for finding 
                # water between the final global maximum and 
                # subsequent local maximums. These potential values are
                # stored in local_water.
    for i in range(1, …

Run Code Online (Sandbox Code Playgroud)

python algorithm

kil*_*les

2014 12-26

7
推荐指数

2
解决办法

2493
查看次数

混乱创建brew公式 - cmake缓存规范,depends_on布局选项

我正在尝试创建一个brew公式,以简化在osx上安装DAKOTA的过程.为了安装DAKOTA,我需要运行一个cmake文件配置文件.这是我尝试创建一个propper brew配方,虽然我不确定如何实现cmake步骤.我也不确定如何在"依赖"步骤中设置自制程序标志.我是否正确实施了安装选项？如何将公式布局更改为"系统"？

这是我现在的尝试,虽然我不确定layout=system在depends_on实现中指定,但我找不到关于如何cmake在brew公式中使用的文档.

class DAKOTA < Formula
  desc "Sandia Lab's DAKOTA"
  homepage "https://dakota.sandia.gov"
  url "https://dakota.sandia.gov/sites/default/files/distributions/public/dakota-6.2-public.src.tar.gz"
  sha256 "53953e477a37d2e870e3be4b22f519474c24537b0e6eb1633e3402273a684a98"

  depends_on "gcc" => ["without-multilib"]
  depends_on "gcc-4.9" => ["without-multilib"]
  depends_on "open-mpi" => ["--C++11"] 
  system "export", "HOMEBREW_CC=gcc-4.9"
  system "export", "HOMEBREW_CXX=gcc-4.9"
  depends_on "boost" => ["C++11", "with-mpi", "without-single"] # can't have layout=tagged, need layout=system

  def install
    system "cmake", "-C", "Buildak.cmake" # not sure how to implement this
    system "make", "install"
    system 'echo', 'echo "export PATH=$PATH:/usr/local/dakota/Cellar/bin:/usr/local/Cellar/dakota/test:/usr/local/Cellar/dakota/lib;export DYLD_LIBRARY_PATH=$DYLD_LIBRARY_PATH:/usr/local/Cellar/dakota/bin:/usr/local/Cellar/dakota/lib" >> ~/.bash_profile' # following sandia's …

Run Code Online (Sandbox Code Playgroud)

macos homebrew boost cmake

kil*_*les

2017 01-21

6
推荐指数

0
解决办法

378
查看次数

Python CMA-ES算法可解决用户定义的功能和约束

我正在努力用python 创建CMA-ES优化算法的简单示例。使用CMA-ES算法x**2 + 2*y**2 -4*x*y - 0.5*y，在约束-2<x<2和约束下最优化功能的最简便方法是什么-1<2*(x**2)*y<1？

我查看了DEAP库，但无法进行凝聚力的尝试。我发现他们的文档不够直观。我也研究了cma软件包，但是我不清楚如何实现约束。

python algorithm optimization genetic deap

kil*_*les

2016 09-21

6
推荐指数

1
解决办法

1546
查看次数

如何将个体测量不确定性纳入高斯过程？

我有一组观察值，f_i=f(x_i)并且我想构造一个概率代理，f(x) ~ N[mu(x), sigma(x)]其中N是正态分布。每个观察到的输出f_i与测量不确定度相关联sigma_i。我想将这些测量不确定性纳入我的替代项中f_i，以便mu(x)预测观测值，f_i(x_i)并且预测的标准差sigma(x_i)包含观测输出中的不确定性epsilon_i。

我能想到的实现这一目标的唯一方法是通过蒙特卡洛采样和高斯过程建模的结合。在没有蒙特卡洛样本的情况下，使用单个高斯过程来完成此任务是理想的，但我无法完成这项工作。

我展示了实现我的目标的三种尝试。前两个避免了蒙特卡罗采样，但不预测f(x_i)包含的不确定带的平均值epsilon(x_i)。第三种方法使用蒙特卡罗采样并完成我想做的事情。

有没有一种方法可以创建一个高斯过程，平均预测平均观测输出，并且不确定性将包含观测输出中的不确定性，而不使用这种蒙特卡罗方法？

import matplotlib.pyplot as plt
import numpy as np
import matplotlib
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF, Matern, ExpSineSquared, WhiteKernel

# given a set of inputs, x_i, and corresponding outputs, f_i, I want to make a surrogate f(x). 
# each f_i …

Run Code Online (Sandbox Code Playgroud)

python uncertainty scikit-learn gaussian-process

kil*_*les

2022 10-25

6
推荐指数

1
解决办法

764
查看次数

了解R gbm包中的树结构

我很难理解R的gbm梯度增强机器包中的树木是如何构造的.具体来说,查看pretty.gbm.tree 指数SplitVar的哪些特征的输出指向？

我在数据集上训练了一个GBM,这里是我的一棵树的前四分之一 - 调用的结果是pretty.gbm.tree:

   SplitVar SplitCodePred LeftNode RightNode MissingNode ErrorReduction Weight   Prediction
0         9  6.250000e+01        1         2          21      0.6634681   5981  0.005000061
1        -1  1.895699e-12       -1        -1          -1      0.0000000   3013  0.018956988
2        31  4.462500e+02        3         4          20      1.0083722   2968 -0.009168477
3        -1  1.388483e-22       -1        -1          -1      0.0000000   1430  0.013884830
4        38  5.500000e+00        5        18          19      1.5748155   1538 -0.030602956
5        24  7.530000e+03        6        13          17      2.8329899    361 -0.078738904
6        41  2.750000e+01        7 …

Run Code Online (Sandbox Code Playgroud)

tree r gbm

bil*_*l_e

2015 11-29

5
推荐指数

1
解决办法

3884
查看次数

冲泡更改包安装位置

如何更改Homebrew将在何处安装软件包？这有可能吗？我尝试在中手动移动已安装的文件夹/usr/local/Cellar，但该位置的动态链接“硬连线”。

macos homebrew

kil*_*les

2015 09-23

5
推荐指数

1
解决办法

2万
查看次数

如何使用 scipy minimize() 传递固定参数？

如何优化三变量函数中的两个变量？我的理解是我可以在 args 参数中包含最后一个变量，但我无法完成这项工作。我在这里做错了什么？我的想法是我想优化 x 和 y 并且 z 是固定的。

> from scipy.optimize import minimize
> def f(x,y,z):return x**2 * y**2 - x*y*z*32 +10
> minimize(f,[1,2,3],args=[2])
TypeError: f() takes exactly 3 arguments (2 given)

Run Code Online (Sandbox Code Playgroud)

python minimize scipy

kil*_*les

2015 11-30

5
推荐指数

1
解决办法

3936
查看次数