该大熊猫透视表的文件似乎建议更换使用multiindexing数据超过两个维度进行处理:
In [1]: import pandas as pd
In [2]: import numpy as np
In [3]: import pandas.util.testing as tm; tm.N = 3
In [4]: def unpivot(frame):
...: N, K = frame.shape
...: data = {'value' : frame.values.ravel('F'),
...: 'variable' : np.asarray(frame.columns).repeat(N),
...: 'date' : np.tile(np.asarray(frame.index), K)}
...: return pd.DataFrame(data, columns=['date', 'variable', 'value'])
...:
In [5]: df = unpivot(tm.makeTimeDataFrame())
In [6]: df
Out[6]:
date variable value value2
0 2000-01-03 A 0.462461 0.924921
1 2000-01-04 A -0.517911 -1.035823
2 2000-01-05 …Run Code Online (Sandbox Code Playgroud) 说我有一些长数组和一系列指数.如何选择除那些指数以外的所有内容?我找到了一个解决方案,但它并不优雅:
import numpy as np
x = np.array([0,10,20,30,40,50,60])
exclude = [1, 3, 5]
print x[list(set(range(len(x))) - set(exclude))]
Run Code Online (Sandbox Code Playgroud) 我的时间戳在表格中
0992006 09:00
Run Code Online (Sandbox Code Playgroud)
我需要删除前导零以获取此表单:
992006 9:00
Run Code Online (Sandbox Code Playgroud)
这是我现在使用的代码,它不会删除前导零:
prediction$TIMESTAMP <- as.character(format(prediction$TIMESTAMP, '%j%Y %H:%M'))
Run Code Online (Sandbox Code Playgroud) 我正在练习算法,我已经坚持了几天这个问题.当我测试我的解决方案时,我仍然是错误的.这是问题陈述:
纽约华尔街以其令人叹为观止的摩天大楼而闻名.但是下雨的季节即将到来,今年将落在建筑物上的水量将会很大.由于每栋建筑物都被固定在左侧和右侧的建筑物上(除了第一个和最后一个),只有当建筑物的高度高于建筑物的高度时,水才会从建筑物中泄漏出来.向左或向右(华尔街边缘的高度为0).所有建筑物的宽度均为1米.从左到右给出华尔街建筑物的高度(以米为单位),您的任务是打印到华尔街建筑物上的总水量(立方米)标准输出(标准输出) .
输入示例:
heights: [9 8 7 8 9 5 6]
Run Code Online (Sandbox Code Playgroud)
示例输出:
5
Run Code Online (Sandbox Code Playgroud)
说明: 在这个例子中,在第一个和第五个建筑物之间有4立方米的水(第二个是1个,第三个是2个,第四个是1个),第五个和第七个建筑之间有1个立方米水(在第六栋楼).
我解决这个问题的方法是找到全局最大值,并使用这些最大值的差异来计算积水量.我考虑到最后使用local_water变量可能遗漏的水.任何人都可以帮我找到算法或代码中的错误吗?
注意:我正在寻找一种只能通过每个元素一次的解决方案
这是我输入错误的输入:
heights: [8,8,4,5]
Run Code Online (Sandbox Code Playgroud)
这个输入应该产生1,而不是我的答案0.
这是我的代码:
def skyscrapers(heights):
heights.insert(0,0)
heights.append(0)
local_max = 0
global_max = 0
total_water = 0
local_water = 0
end_water = []
# end_water records water heights to be used for finding
# water between the final global maximum and
# subsequent local maximums. These potential values are
# stored in local_water.
for i in range(1, …Run Code Online (Sandbox Code Playgroud) 我正在尝试创建一个brew公式,以简化在osx上安装DAKOTA的过程.为了安装DAKOTA,我需要运行一个cmake文件配置文件.这是我尝试创建一个propper brew配方,虽然我不确定如何实现cmake步骤.我也不确定如何在"依赖"步骤中设置自制程序标志.我是否正确实施了安装选项?如何将公式布局更改为"系统"?
这是我现在的尝试,虽然我不确定layout=system在depends_on实现中指定,但我找不到关于如何cmake在brew公式中使用的文档.
class DAKOTA < Formula
desc "Sandia Lab's DAKOTA"
homepage "https://dakota.sandia.gov"
url "https://dakota.sandia.gov/sites/default/files/distributions/public/dakota-6.2-public.src.tar.gz"
sha256 "53953e477a37d2e870e3be4b22f519474c24537b0e6eb1633e3402273a684a98"
depends_on "gcc" => ["without-multilib"]
depends_on "gcc-4.9" => ["without-multilib"]
depends_on "open-mpi" => ["--C++11"]
system "export", "HOMEBREW_CC=gcc-4.9"
system "export", "HOMEBREW_CXX=gcc-4.9"
depends_on "boost" => ["C++11", "with-mpi", "without-single"] # can't have layout=tagged, need layout=system
def install
system "cmake", "-C", "Buildak.cmake" # not sure how to implement this
system "make", "install"
system 'echo', 'echo "export PATH=$PATH:/usr/local/dakota/Cellar/bin:/usr/local/Cellar/dakota/test:/usr/local/Cellar/dakota/lib;export DYLD_LIBRARY_PATH=$DYLD_LIBRARY_PATH:/usr/local/Cellar/dakota/bin:/usr/local/Cellar/dakota/lib" >> ~/.bash_profile' # following sandia's …Run Code Online (Sandbox Code Playgroud) 我有一组观察值 ,f_i=f(x_i)并且我想构造一个概率代理 ,f(x) ~ N[mu(x), sigma(x)]其中N是正态分布。每个观察到的输出f_i与测量不确定度 相关联sigma_i。我想将这些测量不确定性纳入我的替代项 中f_i,以便mu(x)预测观测值 ,f_i(x_i)并且预测的标准差sigma(x_i)包含观测输出 中的不确定性epsilon_i。
我能想到的实现这一目标的唯一方法是通过蒙特卡洛采样和高斯过程建模的结合。在没有蒙特卡洛样本的情况下,使用单个高斯过程来完成此任务是理想的,但我无法完成这项工作。
我展示了实现我的目标的三种尝试。前两个避免了蒙特卡罗采样,但不预测f(x_i)包含 的不确定带的平均值epsilon(x_i)。第三种方法使用蒙特卡罗采样并完成我想做的事情。
有没有一种方法可以创建一个高斯过程,平均预测平均观测输出,并且不确定性将包含观测输出中的不确定性,而不使用这种蒙特卡罗方法?
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF, Matern, ExpSineSquared, WhiteKernel
# given a set of inputs, x_i, and corresponding outputs, f_i, I want to make a surrogate f(x).
# each f_i …Run Code Online (Sandbox Code Playgroud) 我很难理解R的gbm梯度增强机器包中的树木是如何构造的.具体来说,查看pretty.gbm.tree 指数SplitVar的哪些特征的输出指向?
我在数据集上训练了一个GBM,这里是我的一棵树的前四分之一 - 调用的结果是pretty.gbm.tree:
SplitVar SplitCodePred LeftNode RightNode MissingNode ErrorReduction Weight Prediction
0 9 6.250000e+01 1 2 21 0.6634681 5981 0.005000061
1 -1 1.895699e-12 -1 -1 -1 0.0000000 3013 0.018956988
2 31 4.462500e+02 3 4 20 1.0083722 2968 -0.009168477
3 -1 1.388483e-22 -1 -1 -1 0.0000000 1430 0.013884830
4 38 5.500000e+00 5 18 19 1.5748155 1538 -0.030602956
5 24 7.530000e+03 6 13 17 2.8329899 361 -0.078738904
6 41 2.750000e+01 7 …Run Code Online (Sandbox Code Playgroud) 如何更改Homebrew将在何处安装软件包?这有可能吗?我尝试在中手动移动已安装的文件夹/usr/local/Cellar,但该位置的动态链接“硬连线”。
如何优化三变量函数中的两个变量?我的理解是我可以在 args 参数中包含最后一个变量,但我无法完成这项工作。我在这里做错了什么?我的想法是我想优化 x 和 y 并且 z 是固定的。
> from scipy.optimize import minimize
> def f(x,y,z):return x**2 * y**2 - x*y*z*32 +10
> minimize(f,[1,2,3],args=[2])
TypeError: f() takes exactly 3 arguments (2 given)
Run Code Online (Sandbox Code Playgroud)