小编sau*_*wal的帖子

无法理解线性回归的成本函数

我真的无法理解下面的等式,尤其是1/(2m).

这个等式的目的是什么?哪里1/(2m)来了?

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
Run Code Online (Sandbox Code Playgroud)

请解释.如何施展???

math machine-learning linear-algebra

26
推荐指数
1
解决办法
2万
查看次数

label-encoder编码缺失值

我使用标签编码器将分类数据转换为数值.

LabelEncoder如何处理缺失值?

from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)
Run Code Online (Sandbox Code Playgroud)

输出:

array([1, 2, 3, 0, 4, 1])
Run Code Online (Sandbox Code Playgroud)

对于上面的示例,标签编码器将NaN值更改为类别.我怎么知道哪个类别代表缺失值?

python pandas scikit-learn

26
推荐指数
4
解决办法
2万
查看次数

将16位值转换为8位值的有效方法

我有一个包含16位值的变量.我只需要8 LSB.其余8位需要丢弃.

我正在使用此代码执行此操作.

#include<stdio.h>
#include<stdint.h>
int main(int argc, char *argv[])
{
    int linkIndx,size=128;

    uint16_t val = 0xABCD;
    uint8_t vr;

    vr = val; //this assignment discards upper 8-bits 

    printf("0x%X 0x%X ", val, vr);
}
Run Code Online (Sandbox Code Playgroud)

结果:

0xABCD 0xCD
Run Code Online (Sandbox Code Playgroud)

我想知道,从16位变量获取8 LSB是一个好方法吗?

编辑:
请使用这种特定的实现方式添加性能问题(从内存和速度的角度来看).

c bit-manipulation

8
推荐指数
2
解决办法
2万
查看次数

运行h2o.ensemble时出错

在R中运行h2o.ensemble时出现错误。这是错误输出

[1] "Cross-validating and training base learner 1: h2o.glm.wrapper"
  |======================================================================| 100%
[1] "Cross-validating and training base learner 2: h2o.randomForest.1"
  |==============                                                        |  19%

Got exception 'class java.lang.AssertionError', with msg 'null'
java.lang.AssertionError
    at hex.tree.DHistogram.scoreMSE(DHistogram.java:323)
    at hex.tree.DTree$DecidedNode$FindSplits.compute2(DTree.java:441)
    at hex.tree.DTree$DecidedNode.bestCol(DTree.java:421)
    at hex.tree.DTree$DecidedNode.<init>(DTree.java:449)
    at hex.tree.SharedTree.makeDecided(SharedTree.java:489)
    at hex.tree.SharedTree$ScoreBuildOneTree.onCompletion(SharedTree.java:436)
    at jsr166y.CountedCompleter.__tryComplete(CountedCompleter.java:425)
    at jsr166y.CountedCompleter.tryComplete(CountedCompleter.java:383)
    at water.MRTask.compute2(MRTask.java:683)
    at water.H2O$H2OCountedCompleter.compute(H2O.java:1069)
    at jsr166y.CountedCompleter.exec(CountedCompleter.java:468)
    at jsr166y.ForkJoinTask.doExec(ForkJoinTask.java:263)
    at jsr166y.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:974)
    at jsr166y.ForkJoinPool.runWorker(ForkJoinPool.java:1477)
    at jsr166y.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:104)


Error: 'null'
Run Code Online (Sandbox Code Playgroud)

这是我正在使用的代码。我正在使用此脚本来解决回归问题。“ sales”列用于输出预测。其余的列用于培训。

response <- "Sales"
predictors <- setdiff(names(train), response)

h2o.glm.1 <- function(..., alpha = 0.0) h2o.glm.wrapper(..., alpha = …
Run Code Online (Sandbox Code Playgroud)

r machine-learning h2o

5
推荐指数
2
解决办法
2107
查看次数

避免使用hadoop(EMR)在S3中创建_ $ folder $键

我在AWS数据管道中使用EMR活动。此EMR活动在EMR群集中运行配置单元脚本。它以dynamo DB作为输入并将数据存储在S3中。

这是EMR活动中使用的EMR步骤

s3://elasticmapreduce/libs/script-runner/script-runner.jar,s3://elasticmapreduce/libs/hive/hive-script,--run-hive-script,--hive-versions,latest,--args,-f,s3://my-s3-bucket/hive/my_hive_script.q,-d,DYNAMODB_INPUT_TABLE1=MyTable,-d,S3_OUTPUT_BUCKET=#{output.directoryPath}
Run Code Online (Sandbox Code Playgroud)

哪里

out.direcoryPath是:

s3://my-s3-bucket/output/#{format(@scheduledStartTime,"YYYY-MM-dd")}
Run Code Online (Sandbox Code Playgroud)

因此,这将在S3中创建一个文件夹和一个文件。(从技术上讲,它会创建两个键2017-03-18/<some_random_number>2017-03-18_$folder$

2017-03-18
2017-03-18_$folder$
Run Code Online (Sandbox Code Playgroud)

如何避免创建这些多余的空_$folder$文件。

编辑:我在https://issues.apache.org/jira/browse/HADOOP-10400中找到了一个解决方案,但我不知道如何在AWS数据管道中实现它。

hadoop amazon-s3 amazon-web-services amazon-emr

4
推荐指数
3
解决办法
5491
查看次数

合并两个Seq以创建一个Map

我有一个对象,例如:

case class Person(name: String, number: Int)
Run Code Online (Sandbox Code Playgroud)

以及该对象的两个序列:

Seq(("abc", 1), ("def", 2))
Seq(("abc", 300), ("xyz", 400))
Run Code Online (Sandbox Code Playgroud)

我想将这两个序列合并到一个键为names且值此单独对象的单个Map中:

case class CombineObject(firstNumber: Option[Int], secondNumber: Option[Int])
Run Code Online (Sandbox Code Playgroud)

这样我的最终地图将如下所示:

Map(
  "abc" -> CombineObject(Some(1), Some(300)),
  "def" -> CombineObject(Some(2), None)),
  "xyz" -> CombineObject(None,    Some(400))
)
Run Code Online (Sandbox Code Playgroud)

我能想到的是在序列上运行2 for循环以创建映射。有没有更好的方法来解决问题?

dictionary scala

4
推荐指数
1
解决办法
108
查看次数

如何在CVS中添加目录

我有一个CVS服务器.我想在一些已经存在的目录中添加一个新目录.我怎样才能做到这一点?

CVS add命令在现有目录中添加文件.我想知道如何在CVS文件夹中添加子文件夹.

cvs

3
推荐指数
1
解决办法
8028
查看次数

将新节点分配给树节点时程序崩溃

我已经为树写了ac程序.

#include<stdio.h>
#include<stdlib.h>

struct node{
    int data;
    struct node *left;
    struct node *right;
 };

 struct node* newNode(int value){
    struct node* temp;
    temp->left = NULL;
    temp->right = NULL;
    temp->data = value;

    return temp;
 }

 int main(){
    struct node *root;
    root = newNode(60);
    root->left = newNode(40);
    root->right = newNode(80);
    root->left->left = newNode(30); // program crashes here. 
    root->left->right = newNode(50);

 }
Run Code Online (Sandbox Code Playgroud)

这是我写的另一个程序的子部分.调试时我意识到我在分配时遇到错误newNode(30).我不明白为什么?

c pointers memory-management dereference

2
推荐指数
1
解决办法
29
查看次数

如何对字符串数组的每个字符串进行排序

我想排序每个字符串数组的字符串,这是我尝试的代码.

#include <iostream>
#include <algorithm>

void _sort_word(char *str)
{
    int len = strlen(str); 
    std::sort(str,str+len); // program get stuck here. 
}
int main()
{
    char *str[] = {"hello", "world"};
    for(int i=0;i<2;i++){
        _sort_word(str[i]);
        cout << str[i] << "\n";
    }
}
Run Code Online (Sandbox Code Playgroud)

我想知道sort(str,str+len);这里有一个有效的陈述,如果不是应该做什么呢?

c++ sorting string

2
推荐指数
1
解决办法
61
查看次数

@Mock 对象实例为空

@Mock 对象实例为 null 。

我在做这是我的测试课

@Mock
private SchoolRequest schoolRequest;

@InjectMock
private FormRequest formRequest;

@Before
public void init(){
     MockitoAnnotations.initMocks(this);
}

Class FormRequest {

@Autowired 
private SchoolRequest schoolRequest;


}
Run Code Online (Sandbox Code Playgroud)

此应用程序运行正常,但在测试用例中schoolRequest为 null。关于为什么会发生的任何指示?

java junit mockito

1
推荐指数
2
解决办法
5952
查看次数

如何通过索引为c ++字符串索引赋值

如何通过索引为c ++字符串索引赋值.我尝试过这段代码,但这并没有改变字符串的值.

#include <iostream.h>
#include <string>

void change(string & str)
{
    str[0] = '1';
    str[1] = '2';
    // str = "12" ; // it works but i want to assign value to each index separately. 
}
void main()
{
    string str;
    change(str);
    cout << str << endl; // expected "12"
}
Run Code Online (Sandbox Code Playgroud)

c++ string

-1
推荐指数
1
解决办法
1486
查看次数

如何在C中实现按位移位运算符.它是原子的吗?

我想知道移位运算如何按位"<<"">>"语言实现.是原子还是不原子?c是一次移动整个单词还是逐个移动每一位.

是否存在对编译器,操作系统或计算机体系结构的依赖性?

C标准是否定义了移位运算符的实现方式?

示例:

假设两个线程正在访问数据.其中一个通过移位3位来修改它.这个3位移位原子操作是否也是如此?我应该使用锁来处理这种修改吗?

编辑:它只是一个班次操作员,没有商店指令.数据已经在内存中,因此无需加载操作.我的处理器:Powerpc MPC8569,e600核心架构.

c

-2
推荐指数
1
解决办法
596
查看次数