小编mik*_*kom的帖子

如何使用javascript获取当前的html页面标题

我想用javascript获取普通的html页面标题.

我用firefox和

document.title 
Run Code Online (Sandbox Code Playgroud)

我得到额外的" - Mozilla Firefox"到标题的末尾.我知道通过修改字符串很容易摆脱这一点,但如果他们改变文本,使用不同的格式等,或者其他一些浏览器以不同的方式修改它我再次有额外的文本.

那么,有没有任何跨浏览器的方式来获取javascript的普通标签内容?Jquery解决方案没问题.

javascript title

53
推荐指数
3
解决办法
10万
查看次数

Scikit-learn平衡子采样

我正在尝试创建我的大型非平衡数据集的N个平衡随机子样本.有没有办法简单地使用scikit-learn/pandas或者我必须自己实现它?任何指向这样做的代码的指针?

这些子样本应该是随机的,并且可以重叠,因为我在非常大的分类器集合中将每个子样本提供给单独的分类器.

在Weka中有一个名为spreadsubsample的工具,sklearn中有相同的东西吗? http://wiki.pentaho.com/display/DATAMINING/SpreadSubsample

(我知道加权但这不是我想要的.)

python subsampling pandas scikit-learn

39
推荐指数
5
解决办法
4万
查看次数

Clojure中的模式匹配函数?

我过去使用过erlang,它有一些非常有用的东西,比如模式匹配函数或"函数守卫".erlang文档的示例是:

fact(N) when N>0 -> 
    N * fact(N-1); 
fact(0) ->      
    1.    
Run Code Online (Sandbox Code Playgroud)

但是这可以扩展到一个更复杂的例子,其中的参数和值的形式是匹配的.

在clojure中有类似的东西吗?

design-patterns clojure matching

28
推荐指数
3
解决办法
2万
查看次数

将内存H2数据库保存到磁盘

如何以二进制模式将完整的嵌入式h2内存数据库保存/加载到某个文件或目录,以加快加载速度.

我想用它来缓存数据,所以我不必每次都运行create table/insert子句的所有行.

load save h2 embedded-database in-memory

16
推荐指数
1
解决办法
9707
查看次数

Gitcherry-pick - 如何在不实际执行任何操作的情况下显示更改

在实际执行任何操作之前,有什么方法可以显示“gitcherry-pick”将应用的更改吗?

我希望看到“git diff”类型的更改列表,这些更改将由命令完成,而无需实际进行更改或修改任何内容。

git cherry-pick git-cherry-pick

7
推荐指数
2
解决办法
3264
查看次数

熊猫:如何从相关矩阵中删除自相关

我正在尝试使用pandas找到不同列的最高相关性.我知道可以得到相关矩阵

df.corr()
Run Code Online (Sandbox Code Playgroud)

我知道在那之后我可以得到最高的相关性

df.sort() 
df.stack() 
df[-5:]
Run Code Online (Sandbox Code Playgroud)

问题是这些相关性还包含列本身的值(1).如何删除包含与self相关的列?我知道我可以通过删除所有1个值来删除它们,但我不想这样做,因为可能还有实际的1个相关性.

python numpy correlation pandas

6
推荐指数
2
解决办法
3633
查看次数

目前的Open Dylan实施有多成熟?

打开迪伦看起来很有趣.然而,在我将它用于实际开发之前,我想知道实现的成熟程度.我知道Dylan本身是一种古老的语言,它已被Apple使用.

performance stability dylan

5
推荐指数
1
解决办法
905
查看次数

python中的zip(),如何使用静态值

我正在尝试构建一个元组数组,其中列表中的第一个值带有一些静态值.

它应该很简单,但我出于某种原因努力做到这一点.

例如,我如何获得以下内容:

 [(1,100,200),
  (2,100,200),
  (3,100,200),
  (4,100,200),
  (5,100,200)]

>>> zip([1,2,3,4,5],100,200)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: zip argument #2 must support iteration
Run Code Online (Sandbox Code Playgroud)

python zip tuples list

3
推荐指数
1
解决办法
372
查看次数

clojure:为地图矢量添加索引

我有一张地图矢量.我想为每个元素关联一个索引元素.

例:

(append-index [{:name "foo"} {:name "bar"} {:name "baz"}])
Run Code Online (Sandbox Code Playgroud)

应该回来

[{:name "foo" :index 1} {:name "bar" :index 2} {:name "baz" :index 3}]
Run Code Online (Sandbox Code Playgroud)

实现append-index函数的最佳方法是什么?

vector clojure

3
推荐指数
1
解决办法
389
查看次数

clojure:删除不区分大小写的字符串重复项

如果存在不区分大小写的匹配,从字符串数组中删除字符串的惯用 clojure 方法是什么?

我需要保留结果的大小写(我总是想保留不敏感匹配的第一次出现)。

简单的例子:

(distinct-case-insensitive ["fish" "Dog" "cat"] ["FISH "DOG"])
Run Code Online (Sandbox Code Playgroud)

会回来

["fish" "Dog" "cat"]
Run Code Online (Sandbox Code Playgroud)

string clojure matching

2
推荐指数
1
解决办法
1434
查看次数

scikit-learn适合剩余时间

有没有办法估算拟合模型时的剩余时间?例如

model = sk.ensemble.RandomForestRegressor(n_estimators=10)
model.fit(x, y)
Run Code Online (Sandbox Code Playgroud)

我有一个非常大的数据集(数百万行),这需要一些时间,所以我想知道估计的时间,所以我可以做其他的thigngs并在过程结束时回来.

对随机森林等集合估计剩余时间应该[合理]容易.

python scikit-learn

1
推荐指数
1
解决办法
4111
查看次数