小编dsa*_*uce的帖子

R H2O与32位java

我试图在R中使用32位java的H2O包.不幸的是,我被comapny的IT限制安装64位版本的java.

如何使H2O与32位java一起工作,即如果可能的话?

操作系统 - Windows 7

windows r windows-7 h2o

5
推荐指数
1
解决办法
942
查看次数

如何以每行的模式(最常见)值聚合R中的数据?

例如,我有一个数据集

Data <- data.frame(
  groupname = as.factor(sample(c("a", "b", "c"), 10, replace = TRUE)),
  someuser = sample(c("x", "y", "z"), 10, replace = TRUE))


   groupname someuser
1          a        x
2          b        y
3          a        x
4          a        y
5          c        z
6          b        x
7          b        x
8          c        x
9          c        y
10         c        x
Run Code Online (Sandbox Code Playgroud)

如何汇总数据,以便获得:

groupname someuser
a         x
b         x
c         x
Run Code Online (Sandbox Code Playgroud)

这是每个组名最常见的值。

PS:根据我的设置,我只能使用2个包-plyr和lubridate

aggregate r

2
推荐指数
1
解决办法
4202
查看次数

有没有办法在 Python 中使用 Selenium 获取 web 元素的外部 HTML 的外部 HTML?

我正在使用它来获取表格中的一行:

element = browser.find_element_by_xpath("//*[contains(text(),'Sample Text')]")
html_text = element.get_attribute('outerHTML')
Run Code Online (Sandbox Code Playgroud)

这给了我,<td>...</td>但我想要<tr><td>...</td><td>...</td></tr>

我该怎么做呢?

python selenium

2
推荐指数
1
解决办法
1258
查看次数

使用公式循环遍历列和 vstack 到新的单列

我有一列字符串,示例如下。每个字符串都是分隔的文本组合。每行都有不同数量的文本。我想基于该列创建一列,每行一个文本。

从:

a;b
x;y;z
p;q;r;s;t
Run Code Online (Sandbox Code Playgroud)

到:

a
b
x
y
z
p
q
r
s
t
Run Code Online (Sandbox Code Playgroud)

如何使用单个公式实现这一目标?

我尝试过TRANSPOSE(TEXTSPLIT(TEXTJOIN(";",TRUE, data),";")) 但是失败了,因为 TEXTJOIN 部分导致超过 32767 个字符。

我还尝试构建 mxn 的二维数组,其中 m=no。原始数据中的行数,且 n=no。的文本。但是,MAKEARRAY 仍然会生成单个列。如果它有效,我会使用 TOCOL 或类似的东西来转换为单列。

=MAKEARRAY(ROWS(data),COLUMNS(MAX(num_of_texts_in_each_row)), LAMBDA(r,c, LET(
drow, INDEX(data,r,1),
splits, TEXTSPLIT(drow,";"),
INDEX(splits,,c)
)))
Run Code Online (Sandbox Code Playgroud)

excel excel-formula

2
推荐指数
1
解决办法
650
查看次数

如何在R中的新数据上完美地应用(创建的)模型?

对不起,如果感觉像是一个重复的问题,但老实说,我已经花了12个多小时,并且还没有找到易于理解和易于应用的方法.

情况很简单,我创建了2个模型,需要将它们应用到测试数据中.

#Model 1 -

reg5 <- glm(train$survived ~ train$pclass_str + train$sex + 
             train$age_2 + train$sibsp + train$pclass_str*train$sex, 
             family = "binomial")

#Model 2 - 
reg6 <- randomForest(train$survived_str ~ train$pclass_str + train$sex + 
                      train$age_2 + train$sibsp, ntree=5000)
Run Code Online (Sandbox Code Playgroud)

应用它 -

test$pred_reg5 <- predict(reg5, newdata = test, type="response")
test$pred_reg6 <- predict(reg6, newdata = test, type="response")
Run Code Online (Sandbox Code Playgroud)

我可以保证的是,列车和测试数据都包含模型中使用的相同名称的变量.虽然还有其他未使用的变量.

我得到的错误:

Error in `[<-.factor`(`*tmp*`, keep, value = c("0", "1", "1", "1", "0",  : 
  NAs are not allowed in subscripted assignments
In addition: Warning message:
'newdata' had 418 …
Run Code Online (Sandbox Code Playgroud)

model r prediction

1
推荐指数
1
解决办法
2870
查看次数

python在新行中打印每个字符

我正在尝试打印行并在text/html文件的行中替换单词但由于python(2.7)逐字符地读取它而无法这样做.我究竟做错了什么?

这是代码和输出:

import sys

infile = open('filenmae').read()

for line in infile:
    print line
Run Code Online (Sandbox Code Playgroud)

我应该得到的输出(这里只显示第一行):

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
Run Code Online (Sandbox Code Playgroud)

我得到的输出:

<
!
D
O
C
T
Y
P
E
.
.
.
Run Code Online (Sandbox Code Playgroud)

python python-2.7

0
推荐指数
1
解决办法
6380
查看次数