我真的无法理解下面的等式,尤其是1/(2m)
.
这个等式的目的是什么?哪里1/(2m)
来了?
J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
Run Code Online (Sandbox Code Playgroud)
请解释.如何施展???
我使用标签编码器将分类数据转换为数值.
LabelEncoder如何处理缺失值?
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)
Run Code Online (Sandbox Code Playgroud)
输出:
array([1, 2, 3, 0, 4, 1])
Run Code Online (Sandbox Code Playgroud)
对于上面的示例,标签编码器将NaN值更改为类别.我怎么知道哪个类别代表缺失值?
我有一个包含16位值的变量.我只需要8 LSB.其余8位需要丢弃.
我正在使用此代码执行此操作.
#include<stdio.h>
#include<stdint.h>
int main(int argc, char *argv[])
{
int linkIndx,size=128;
uint16_t val = 0xABCD;
uint8_t vr;
vr = val; //this assignment discards upper 8-bits
printf("0x%X 0x%X ", val, vr);
}
Run Code Online (Sandbox Code Playgroud)
结果:
0xABCD 0xCD
Run Code Online (Sandbox Code Playgroud)
我想知道,从16位变量获取8 LSB是一个好方法吗?
编辑:
请使用这种特定的实现方式添加性能问题(从内存和速度的角度来看).
在R中运行h2o.ensemble时出现错误。这是错误输出
[1] "Cross-validating and training base learner 1: h2o.glm.wrapper"
|======================================================================| 100%
[1] "Cross-validating and training base learner 2: h2o.randomForest.1"
|============== | 19%
Got exception 'class java.lang.AssertionError', with msg 'null'
java.lang.AssertionError
at hex.tree.DHistogram.scoreMSE(DHistogram.java:323)
at hex.tree.DTree$DecidedNode$FindSplits.compute2(DTree.java:441)
at hex.tree.DTree$DecidedNode.bestCol(DTree.java:421)
at hex.tree.DTree$DecidedNode.<init>(DTree.java:449)
at hex.tree.SharedTree.makeDecided(SharedTree.java:489)
at hex.tree.SharedTree$ScoreBuildOneTree.onCompletion(SharedTree.java:436)
at jsr166y.CountedCompleter.__tryComplete(CountedCompleter.java:425)
at jsr166y.CountedCompleter.tryComplete(CountedCompleter.java:383)
at water.MRTask.compute2(MRTask.java:683)
at water.H2O$H2OCountedCompleter.compute(H2O.java:1069)
at jsr166y.CountedCompleter.exec(CountedCompleter.java:468)
at jsr166y.ForkJoinTask.doExec(ForkJoinTask.java:263)
at jsr166y.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:974)
at jsr166y.ForkJoinPool.runWorker(ForkJoinPool.java:1477)
at jsr166y.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:104)
Error: 'null'
Run Code Online (Sandbox Code Playgroud)
这是我正在使用的代码。我正在使用此脚本来解决回归问题。“ sales”列用于输出预测。其余的列用于培训。
response <- "Sales"
predictors <- setdiff(names(train), response)
h2o.glm.1 <- function(..., alpha = 0.0) h2o.glm.wrapper(..., alpha = …
Run Code Online (Sandbox Code Playgroud) 我在AWS数据管道中使用EMR活动。此EMR活动在EMR群集中运行配置单元脚本。它以dynamo DB作为输入并将数据存储在S3中。
这是EMR活动中使用的EMR步骤
s3://elasticmapreduce/libs/script-runner/script-runner.jar,s3://elasticmapreduce/libs/hive/hive-script,--run-hive-script,--hive-versions,latest,--args,-f,s3://my-s3-bucket/hive/my_hive_script.q,-d,DYNAMODB_INPUT_TABLE1=MyTable,-d,S3_OUTPUT_BUCKET=#{output.directoryPath}
Run Code Online (Sandbox Code Playgroud)
哪里
out.direcoryPath是:
s3://my-s3-bucket/output/#{format(@scheduledStartTime,"YYYY-MM-dd")}
Run Code Online (Sandbox Code Playgroud)
因此,这将在S3中创建一个文件夹和一个文件。(从技术上讲,它会创建两个键2017-03-18/<some_random_number>
和2017-03-18_$folder$
)
2017-03-18
2017-03-18_$folder$
Run Code Online (Sandbox Code Playgroud)
如何避免创建这些多余的空_$folder$
文件。
编辑:我在https://issues.apache.org/jira/browse/HADOOP-10400中找到了一个解决方案,但我不知道如何在AWS数据管道中实现它。
我有一个对象,例如:
case class Person(name: String, number: Int)
Run Code Online (Sandbox Code Playgroud)
以及该对象的两个序列:
Seq(("abc", 1), ("def", 2))
Seq(("abc", 300), ("xyz", 400))
Run Code Online (Sandbox Code Playgroud)
我想将这两个序列合并到一个键为name
s且值此单独对象的单个Map中:
case class CombineObject(firstNumber: Option[Int], secondNumber: Option[Int])
Run Code Online (Sandbox Code Playgroud)
这样我的最终地图将如下所示:
Map(
"abc" -> CombineObject(Some(1), Some(300)),
"def" -> CombineObject(Some(2), None)),
"xyz" -> CombineObject(None, Some(400))
)
Run Code Online (Sandbox Code Playgroud)
我能想到的是在序列上运行2 for循环以创建映射。有没有更好的方法来解决问题?
我有一个CVS服务器.我想在一些已经存在的目录中添加一个新目录.我怎样才能做到这一点?
CVS add
命令在现有目录中添加文件.我想知道如何在CVS文件夹中添加子文件夹.
我已经为树写了ac程序.
#include<stdio.h>
#include<stdlib.h>
struct node{
int data;
struct node *left;
struct node *right;
};
struct node* newNode(int value){
struct node* temp;
temp->left = NULL;
temp->right = NULL;
temp->data = value;
return temp;
}
int main(){
struct node *root;
root = newNode(60);
root->left = newNode(40);
root->right = newNode(80);
root->left->left = newNode(30); // program crashes here.
root->left->right = newNode(50);
}
Run Code Online (Sandbox Code Playgroud)
这是我写的另一个程序的子部分.调试时我意识到我在分配时遇到错误newNode(30)
.我不明白为什么?
我想排序每个字符串数组的字符串,这是我尝试的代码.
#include <iostream>
#include <algorithm>
void _sort_word(char *str)
{
int len = strlen(str);
std::sort(str,str+len); // program get stuck here.
}
int main()
{
char *str[] = {"hello", "world"};
for(int i=0;i<2;i++){
_sort_word(str[i]);
cout << str[i] << "\n";
}
}
Run Code Online (Sandbox Code Playgroud)
我想知道sort(str,str+len);
这里有一个有效的陈述,如果不是应该做什么呢?
@Mock 对象实例为 null 。
我在做这是我的测试课
@Mock
private SchoolRequest schoolRequest;
@InjectMock
private FormRequest formRequest;
@Before
public void init(){
MockitoAnnotations.initMocks(this);
}
Class FormRequest {
@Autowired
private SchoolRequest schoolRequest;
}
Run Code Online (Sandbox Code Playgroud)
此应用程序运行正常,但在测试用例中schoolRequest
为 null。关于为什么会发生的任何指示?
如何通过索引为c ++字符串索引赋值.我尝试过这段代码,但这并没有改变字符串的值.
#include <iostream.h>
#include <string>
void change(string & str)
{
str[0] = '1';
str[1] = '2';
// str = "12" ; // it works but i want to assign value to each index separately.
}
void main()
{
string str;
change(str);
cout << str << endl; // expected "12"
}
Run Code Online (Sandbox Code Playgroud) 我想知道移位运算如何按位"<<"
和">>"
语言实现.是原子还是不原子?c是一次移动整个单词还是逐个移动每一位.
是否存在对编译器,操作系统或计算机体系结构的依赖性?
C标准是否定义了移位运算符的实现方式?
示例:
假设两个线程正在访问数据.其中一个通过移位3位来修改它.这个3位移位原子操作是否也是如此?我应该使用锁来处理这种修改吗?
编辑:它只是一个班次操作员,没有商店指令.数据已经在内存中,因此无需加载操作.我的处理器:Powerpc MPC8569,e600核心架构.