小编tuc*_*son的帖子

R caret train evalSummaryFunction中的错误:无法计算回归的类概率

> cv.ctrl <- trainControl(method = "repeatedcv", repeats = 3,
+                         summaryFunction = twoClassSummary,
+                         classProbs = TRUE)
> 
> set.seed(35)
> glm.tune.1 <- train(y ~ bool_3,
+                     data = train.batch,
+                     method = "glm",
+                     metric = "ROC",
+                     trControl = cv.ctrl)
Error in evalSummaryFunction(y, trControl, classLevels, metric, method) : 
  train()'s use of ROC codes requires class probabilities. See the classProbs option of trainControl()
In addition: Warning message:
In train.default(x, y, weights = w, ...) :
  cannnot compute class probabilities …

Run Code Online (Sandbox Code Playgroud)

r r-caret

tuc*_*son

2015 07-18

4
推荐指数

1
解决办法

4798
查看次数

Julia-布尔元素操作数组

我不了解以下元素明智的布尔运算结果（请参阅最后一部分的箭头）：

A = [1,2,3,1,2]
B = [1,2,1,3,2]

julia> A.==1
5-element BitArray{1}:
  true
 false
 false
  true
 false

julia> B.==1
5-element BitArray{1}:
  true
 false
  true
 false
 false

julia> A.==1 .& B.==1
5-element BitArray{1}:
  true
 false
 false
  true        <----- I expect this to be false
 false

Run Code Online (Sandbox Code Playgroud)

A。== 1。＆B。== 1的第四个元素应该为false，因为它是（true＆false）。有人可以解释吗？

julia

tuc*_*son

lucky-day

4
推荐指数

1
解决办法

73
查看次数

使用重复的索引重塑 Pandas Dataframe 并填充缺失的行

我想添加与给定索引相对应的缺失行。

例如，如果我有：

df = pd.DataFrame({"date": ["1", "2", "1", "3"],
                   "name": ["bob", "bob", "anne", "anne"],
                   "x": [1, 2, 2, 3],
                   "y": [2, 4, 5, 5]})

Run Code Online (Sandbox Code Playgroud)

我想获得以下内容：

    name    date    x   y
    anne    1       2   5
    anne    2       NA  NA   <- because date 2 is missing for Anne
    anne    3       3   5
    bob     1       1   2
    bob     2       2   4
    bob     3       NA  NA   <- because date 3 is missing for Bob

Run Code Online (Sandbox Code Playgroud)

我已经用pivot_table，pivot尝试了很多东西，但到目前为止还没有弄清楚。

df.pivot_table(index = ["name", "date"], values = ['x','y'], fill_value=0).reset_index()

Run Code Online (Sandbox Code Playgroud)

没有填充缺失的行。

python pandas

tuc*_*son

lucky-day

4
推荐指数

1
解决办法

110
查看次数

使用Python DictReader获取特定的行和值

我有一个csv文件,我试图得到一个特定的值,比如第20行第3列.

但到目前为止,我所管理的只是显示第3列的所有值(此处称为"名称").

这是我的Python代码

d = DictReader(r.csv().split('\n'))
for line in d:
    score = line["name"]
    print score

Run Code Online (Sandbox Code Playgroud)

如何显示并获取特定行的值？

python csv

tuc*_*son

2014 07-28

3
推荐指数

1
解决办法

4186
查看次数

setTimeout不等待指定的毫秒数

我希望在几秒钟不活动(使用该onKeyup事件)后触发提交表单.

我的代码如下:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
        <title>Title</title>
    </head>
    <body>
        <form id="getJSONForm">
            <textarea rows="1" cols="10" onKeyUp="onKeyUp()"></textarea>
            <input type="submit" value="Submit" id="getJSON" />
        </form>

        <div id="result"  class="functions"></div>

        <script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.3.2/jquery.min.js"></script>
        <script type="text/javascript">
            $.ajaxSetup ({
                cache: false
            });

            var timer;

            function onKeyUp() {
                stoper();
                timer = setTimeout ( $("#getJSONForm").submit(), 10000 ); 
            }

            function stoper() {
                clearTimeout(timer);
            }

            $("#getJSONForm").submit(function(){
                    $("#result").html("hello");
                    return false;
            });
        </script>
    </body>
</html>

Run Code Online (Sandbox Code Playgroud)

但是......表格会在onKeyUp看似每一个事件时提交.它不会等待计时器达到指定的10,000毫秒.有没有办法来解决这个问题？

javascript jquery settimeout onkeyup

tuc*_*son

2011 02-24

3
推荐指数

1
解决办法

2013
查看次数

r表示整个数据的数据更新列的子集

我希望计算数据子集的一列的平均值,并将此平均值输入到整个数据的新列中.

这里有一些代码可以让事情更清晰:

t <- data.table(Label=c(0,1,0,1,1,1), x=c("aa","aa","aa","aa","bb","bb"), environment=c("train","train","test","test","train","test"))
t
   Label  x environment
1:     0 aa       train
2:     1 aa       train
3:     0 aa        test
4:     1 aa        test
5:     1 bb       train
6:     1 bb        test
setkey(t,x)
t[environment=="train",avg := mean(Label),by=c("x")]

t
   Label  x environment avg
1:     0 aa       train 0.5
2:     1 aa       train 0.5
3:     0 aa        test  NA
4:     1 aa        test  NA
5:     1 bb       train 1.0
6:     1 bb        test  NA

Run Code Online (Sandbox Code Playgroud)

上面的代码工作,除了它不更新环境=="test"的行,这是正常的,因为我在子集上做了除了那些的平均值.

所以我想保留子集的均值,但更新所有行的avg列,包括"test".

所以结果应该是:

t
   Label  x …

Run Code Online (Sandbox Code Playgroud)

r data.table

tuc*_*son

lucky-day

3
推荐指数

1
解决办法

379
查看次数

r以给定的概率生成随机二元结果

我希望以0.05的给定概率生成随机二元结果.所以平均而言,我应该每20次抽取得到一个正(1)和19个负数(0).

我怎么能用R做到这一点？

我知道如何以0.5的概率生成:

sample(0:1, 10000, replace=T)
mean(sample(0:1, 10000, replace=T))
[1] 0.5034

Run Code Online (Sandbox Code Playgroud)

但我需要概率为0.05.

tuc*_*son

lucky-day

3
推荐指数

2
解决办法

7164
查看次数

R数据表：对除当前行之外的组使用函数

假设我有：

x = data.table( id=c(1,1,1,2,2,2), price=c(100,110,120,200,200,220) )
> x
   id price
1:  1   100
2:  1   110
3:  1   120
4:  2   200
5:  2   200
6:  2   220

Run Code Online (Sandbox Code Playgroud)

并希望在省略当前行后为每行找到组中最便宜的价格 (by=id)。所以结果应该是这样的：

> x
   id price   cheapest_in_this_id_omitting_current_row
1:  1   100   110       # if I take this row out the cheapest is the next row
2:  1   110   100       # row 1
3:  1   120   100       # row 1
4:  2   200   200       # row 5
5:  2   200   200       # row …

Run Code Online (Sandbox Code Playgroud)

r data.table

tuc*_*son

2015 10-23

3
推荐指数

1
解决办法

264
查看次数

如何用rvest过滤掉节点？

我正在使用 R rvest 库来读取包含表格的 html 页面。不幸的是，这些表的列数不一致。

这是我阅读的表格示例：

<table>
    <tr class="alt">
        <td>1</td>
        <td>2</td>
        <td class="hidden">3</td>
   </tr>
   <tr class="tr0 close notule">
        <td colspan="9">4</td>
    </tr>
</table>

Run Code Online (Sandbox Code Playgroud)

以及我在 R 中读取表格的代码：

require(rvest)
url = "table.html"
x <- read_html(url)
(x %>% html_nodes("table")) %>% html_table(fill=T)
# [[1]]
  # X1 X2 X3 X4 X5 X6 X7 X8 X9
# 1  1  2  3 NA NA NA NA NA NA
# 2  4  4  4  4  4  4  4  4  4

Run Code Online (Sandbox Code Playgroud)

我想避免考虑隐藏类的 td 和类 'tr0 close notule' 的 tr，因此我只能得到如下表： …

r web-scraping rvest

tuc*_*son

lucky-day

3
推荐指数

1
解决办法

2590
查看次数

Meshes.jl 错误：UndefVarError：P2 未定义

我试图运行 Meshes.jl 测试源代码中的一些代码，但失败了。我缺少什么？

using Meshes

points = P2[(0,0), (1,0), (0,1), (1,1), (0.5,0.5)]
#ERROR: UndefVarError: P2 not defined
#Stacktrace:
# [1] top-level scope
#   @ REPL[2]:1

Run Code Online (Sandbox Code Playgroud)

代码来自这里： https: //github.com/JuliaGeometry/Meshes.jl/blob/bcc08b0b53622f2578c61561fef91153c05c393b/test/mesh.jl#L176

julia

tuc*_*son

lucky-day

3
推荐指数

1
解决办法

158
查看次数