我试图在R中使用32位java的H2O包.不幸的是,我被comapny的IT限制安装64位版本的java.
如何使H2O与32位java一起工作,即如果可能的话?
操作系统 - Windows 7
例如,我有一个数据集
Data <- data.frame(
groupname = as.factor(sample(c("a", "b", "c"), 10, replace = TRUE)),
someuser = sample(c("x", "y", "z"), 10, replace = TRUE))
groupname someuser
1 a x
2 b y
3 a x
4 a y
5 c z
6 b x
7 b x
8 c x
9 c y
10 c x
Run Code Online (Sandbox Code Playgroud)
如何汇总数据,以便获得:
groupname someuser
a x
b x
c x
Run Code Online (Sandbox Code Playgroud)
这是每个组名最常见的值。
PS:根据我的设置,我只能使用2个包-plyr和lubridate
我正在使用它来获取表格中的一行:
element = browser.find_element_by_xpath("//*[contains(text(),'Sample Text')]")
html_text = element.get_attribute('outerHTML')
Run Code Online (Sandbox Code Playgroud)
这给了我,<td>...</td>但我想要<tr><td>...</td><td>...</td></tr>
我该怎么做呢?
我有一列字符串,示例如下。每个字符串都是分隔的文本组合。每行都有不同数量的文本。我想基于该列创建一列,每行一个文本。
从:
a;b
x;y;z
p;q;r;s;t
Run Code Online (Sandbox Code Playgroud)
到:
a
b
x
y
z
p
q
r
s
t
Run Code Online (Sandbox Code Playgroud)
如何使用单个公式实现这一目标?
我尝试过TRANSPOSE(TEXTSPLIT(TEXTJOIN(";",TRUE, data),";"))
但是失败了,因为 TEXTJOIN 部分导致超过 32767 个字符。
我还尝试构建 mxn 的二维数组,其中 m=no。原始数据中的行数,且 n=no。的文本。但是,MAKEARRAY 仍然会生成单个列。如果它有效,我会使用 TOCOL 或类似的东西来转换为单列。
=MAKEARRAY(ROWS(data),COLUMNS(MAX(num_of_texts_in_each_row)), LAMBDA(r,c, LET(
drow, INDEX(data,r,1),
splits, TEXTSPLIT(drow,";"),
INDEX(splits,,c)
)))
Run Code Online (Sandbox Code Playgroud) 对不起,如果感觉像是一个重复的问题,但老实说,我已经花了12个多小时,并且还没有找到易于理解和易于应用的方法.
情况很简单,我创建了2个模型,需要将它们应用到测试数据中.
#Model 1 -
reg5 <- glm(train$survived ~ train$pclass_str + train$sex +
train$age_2 + train$sibsp + train$pclass_str*train$sex,
family = "binomial")
#Model 2 -
reg6 <- randomForest(train$survived_str ~ train$pclass_str + train$sex +
train$age_2 + train$sibsp, ntree=5000)
Run Code Online (Sandbox Code Playgroud)
test$pred_reg5 <- predict(reg5, newdata = test, type="response")
test$pred_reg6 <- predict(reg6, newdata = test, type="response")
Run Code Online (Sandbox Code Playgroud)
我可以保证的是,列车和测试数据都包含模型中使用的相同名称的变量.虽然还有其他未使用的变量.
我得到的错误:
Error in `[<-.factor`(`*tmp*`, keep, value = c("0", "1", "1", "1", "0", :
NAs are not allowed in subscripted assignments
In addition: Warning message:
'newdata' had 418 …Run Code Online (Sandbox Code Playgroud) 我正在尝试打印行并在text/html文件的行中替换单词但由于python(2.7)逐字符地读取它而无法这样做.我究竟做错了什么?
这是代码和输出:
import sys
infile = open('filenmae').read()
for line in infile:
print line
Run Code Online (Sandbox Code Playgroud)
我应该得到的输出(这里只显示第一行):
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
Run Code Online (Sandbox Code Playgroud)
我得到的输出:
<
!
D
O
C
T
Y
P
E
.
.
.
Run Code Online (Sandbox Code Playgroud)