小编sau*_*wal的帖子

无法理解线性回归的成本函数

我真的无法理解下面的等式,尤其是1/(2m).

这个等式的目的是什么？哪里1/(2m)来了？

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2

Run Code Online (Sandbox Code Playgroud)

请解释.如何施展???

math machine-learning linear-algebra

Fah*_*eem

2016 02-19

26
推荐指数

1
解决办法

2万
查看次数

label-encoder编码缺失值

我使用标签编码器将分类数据转换为数值.

LabelEncoder如何处理缺失值？

from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)

Run Code Online (Sandbox Code Playgroud)

输出:

array([1, 2, 3, 0, 4, 1])

Run Code Online (Sandbox Code Playgroud)

对于上面的示例,标签编码器将NaN值更改为类别.我怎么知道哪个类别代表缺失值？

python pandas scikit-learn

sau*_*wal

2018 02-15

26
推荐指数

4
解决办法

2万
查看次数

将16位值转换为8位值的有效方法

我有一个包含16位值的变量.我只需要8 LSB.其余8位需要丢弃.

我正在使用此代码执行此操作.

#include<stdio.h>
#include<stdint.h>
int main(int argc, char *argv[])
{
    int linkIndx,size=128;

    uint16_t val = 0xABCD;
    uint8_t vr;

    vr = val; //this assignment discards upper 8-bits 

    printf("0x%X 0x%X ", val, vr);
}

Run Code Online (Sandbox Code Playgroud)

结果:

0xABCD 0xCD

Run Code Online (Sandbox Code Playgroud)

我想知道,从16位变量获取8 LSB是一个好方法吗？

编辑:
请使用这种特定的实现方式添加性能问题(从内存和速度的角度来看).

c bit-manipulation

sau*_*wal

2015 07-24

8
推荐指数

2
解决办法

2万
查看次数

运行h2o.ensemble时出错

在R中运行h2o.ensemble时出现错误。这是错误输出

[1] "Cross-validating and training base learner 1: h2o.glm.wrapper"
  |======================================================================| 100%
[1] "Cross-validating and training base learner 2: h2o.randomForest.1"
  |==============                                                        |  19%

Got exception 'class java.lang.AssertionError', with msg 'null'
java.lang.AssertionError
    at hex.tree.DHistogram.scoreMSE(DHistogram.java:323)
    at hex.tree.DTree$DecidedNode$FindSplits.compute2(DTree.java:441)
    at hex.tree.DTree$DecidedNode.bestCol(DTree.java:421)
    at hex.tree.DTree$DecidedNode.<init>(DTree.java:449)
    at hex.tree.SharedTree.makeDecided(SharedTree.java:489)
    at hex.tree.SharedTree$ScoreBuildOneTree.onCompletion(SharedTree.java:436)
    at jsr166y.CountedCompleter.__tryComplete(CountedCompleter.java:425)
    at jsr166y.CountedCompleter.tryComplete(CountedCompleter.java:383)
    at water.MRTask.compute2(MRTask.java:683)
    at water.H2O$H2OCountedCompleter.compute(H2O.java:1069)
    at jsr166y.CountedCompleter.exec(CountedCompleter.java:468)
    at jsr166y.ForkJoinTask.doExec(ForkJoinTask.java:263)
    at jsr166y.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:974)
    at jsr166y.ForkJoinPool.runWorker(ForkJoinPool.java:1477)
    at jsr166y.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:104)


Error: 'null'

Run Code Online (Sandbox Code Playgroud)

这是我正在使用的代码。我正在使用此脚本来解决回归问题。“ sales”列用于输出预测。其余的列用于培训。

response <- "Sales"
predictors <- setdiff(names(train), response)

h2o.glm.1 <- function(..., alpha = 0.0) h2o.glm.wrapper(..., alpha = …

Run Code Online (Sandbox Code Playgroud)

r machine-learning h2o

sau*_*wal

lucky-day

5
推荐指数

2
解决办法

2107
查看次数

避免使用hadoop（EMR）在S3中创建_ $ folder $键

我在AWS数据管道中使用EMR活动。此EMR活动在EMR群集中运行配置单元脚本。它以dynamo DB作为输入并将数据存储在S3中。

这是EMR活动中使用的EMR步骤

s3://elasticmapreduce/libs/script-runner/script-runner.jar,s3://elasticmapreduce/libs/hive/hive-script,--run-hive-script,--hive-versions,latest,--args,-f,s3://my-s3-bucket/hive/my_hive_script.q,-d,DYNAMODB_INPUT_TABLE1=MyTable,-d,S3_OUTPUT_BUCKET=#{output.directoryPath}

Run Code Online (Sandbox Code Playgroud)

哪里

out.direcoryPath是：

s3://my-s3-bucket/output/#{format(@scheduledStartTime,"YYYY-MM-dd")}

Run Code Online (Sandbox Code Playgroud)

因此，这将在S3中创建一个文件夹和一个文件。（从技术上讲，它会创建两个键2017-03-18/<some_random_number>和2017-03-18_$folder$）

2017-03-18
2017-03-18_$folder$

Run Code Online (Sandbox Code Playgroud)

如何避免创建这些多余的空_$folder$文件。

编辑：我在https://issues.apache.org/jira/browse/HADOOP-10400中找到了一个解决方案，但我不知道如何在AWS数据管道中实现它。

hadoop amazon-s3 amazon-web-services amazon-emr

sau*_*wal

2017 03-19

4
推荐指数

3
解决办法

5491
查看次数

合并两个Seq以创建一个Map

我有一个对象，例如：

case class Person(name: String, number: Int)

Run Code Online (Sandbox Code Playgroud)

以及该对象的两个序列：

Seq(("abc", 1), ("def", 2))
Seq(("abc", 300), ("xyz", 400))

Run Code Online (Sandbox Code Playgroud)

我想将这两个序列合并到一个键为names且值此单独对象的单个Map中：

case class CombineObject(firstNumber: Option[Int], secondNumber: Option[Int])

Run Code Online (Sandbox Code Playgroud)

这样我的最终地图将如下所示：

Map(
  "abc" -> CombineObject(Some(1), Some(300)),
  "def" -> CombineObject(Some(2), None)),
  "xyz" -> CombineObject(None,    Some(400))
)

Run Code Online (Sandbox Code Playgroud)

我能想到的是在序列上运行2 for循环以创建映射。有没有更好的方法来解决问题？

dictionary scala

sau*_*wal

2019 06-12

4
推荐指数

1
解决办法

108
查看次数

如何在CVS中添加目录

我有一个CVS服务器.我想在一些已经存在的目录中添加一个新目录.我怎样才能做到这一点？

CVS add命令在现有目录中添加文件.我想知道如何在CVS文件夹中添加子文件夹.

cvs

sau*_*wal

2017 09-01

3
推荐指数

1
解决办法

8028
查看次数

将新节点分配给树节点时程序崩溃

我已经为树写了ac程序.

#include<stdio.h>
#include<stdlib.h>

struct node{
    int data;
    struct node *left;
    struct node *right;
 };

 struct node* newNode(int value){
    struct node* temp;
    temp->left = NULL;
    temp->right = NULL;
    temp->data = value;

    return temp;
 }

 int main(){
    struct node *root;
    root = newNode(60);
    root->left = newNode(40);
    root->right = newNode(80);
    root->left->left = newNode(30); // program crashes here. 
    root->left->right = newNode(50);

 }

Run Code Online (Sandbox Code Playgroud)

这是我写的另一个程序的子部分.调试时我意识到我在分配时遇到错误newNode(30).我不明白为什么？

c pointers memory-management dereference

sau*_*wal

2016 05-14

2
推荐指数

1
解决办法

29
查看次数

如何对字符串数组的每个字符串进行排序

我想排序每个字符串数组的字符串,这是我尝试的代码.

#include <iostream>
#include <algorithm>

void _sort_word(char *str)
{
    int len = strlen(str); 
    std::sort(str,str+len); // program get stuck here. 
}
int main()
{
    char *str[] = {"hello", "world"};
    for(int i=0;i<2;i++){
        _sort_word(str[i]);
        cout << str[i] << "\n";
    }
}

Run Code Online (Sandbox Code Playgroud)

我想知道sort(str,str+len);这里有一个有效的陈述,如果不是应该做什么呢？

c++ sorting string

sau*_*wal

2016 06-22

2
推荐指数

1
解决办法

61
查看次数

@Mock 对象实例为空

@Mock 对象实例为 null 。

我在做这是我的测试课

@Mock
private SchoolRequest schoolRequest;

@InjectMock
private FormRequest formRequest;

@Before
public void init(){
     MockitoAnnotations.initMocks(this);
}

Class FormRequest {

@Autowired 
private SchoolRequest schoolRequest;


}

Run Code Online (Sandbox Code Playgroud)

此应用程序运行正常，但在测试用例中schoolRequest为 null。关于为什么会发生的任何指示？

java junit mockito

sau*_*wal

lucky-day

1
推荐指数

2
解决办法

5952
查看次数

如何通过索引为c ++字符串索引赋值

如何通过索引为c ++字符串索引赋值.我尝试过这段代码,但这并没有改变字符串的值.

#include <iostream.h>
#include <string>

void change(string & str)
{
    str[0] = '1';
    str[1] = '2';
    // str = "12" ; // it works but i want to assign value to each index separately. 
}
void main()
{
    string str;
    change(str);
    cout << str << endl; // expected "12"
}

Run Code Online (Sandbox Code Playgroud)

c++ string

sau*_*wal

lucky-day

-1
推荐指数

1
解决办法

1486
查看次数