小编Gya*_*eda的帖子

scikit-learn中的随机森林解释

我使用scikit-learn的随机森林回归器来拟合数据集上的随机森林回归量.是否有可能以一种格式解释输出,然后我可以在不使用scikit-learn甚至Python的情况下实现模型拟合？

该解决方案需要在微控制器或甚至FPGA中实现.我正在使用Python进行分析和学习,但希望在uC或FPGA上实现.

python regression machine-learning random-forest scikit-learn

Amo*_*sai

2015 06-24

6
推荐指数

1
解决办法

2552
查看次数

SQL差异的原因

尽管SQL存在针对SQL的标准,为什么SQL发行版如此非标准？SQL数据库的工作方式确实存在很多有意义的差异,还是我一直在使用的两个数据库:MS-SQL和PostgreSQL？为什么会出现这些差异？

sql sql-server postgresql

Jas*_*ker

2015 04-30

5
推荐指数

3
解决办法

486
查看次数

RegEx检测SQL注入

是否有正则表达式可以检测字符串中的SQL？有没有人有他们以前分享过的东西的样本？

regex sql sql-injection

JC *_*bbs

2015 04-30

5
推荐指数

2
解决办法

2万
查看次数

如何按近距离对一组中的对象进行分组？

我有一个包含数千个地址的集合.如果我可以获得每个地址的经度和纬度,如何通过接近度将集合分组？

此外,我可能想根据不同的规则重试'群集':

N组
每组M个地址
组中任何地址之间的最大距离

algorithm cluster-analysis machine-learning

car*_*ier

2015 05-02

5
推荐指数

2
解决办法

4095
查看次数

在R中找到对称差异(交叉点的对面)的函数？

问题

我有两个不同长度的字符串向量.每个向量都有一组不同的字符串.我想找到一个向量但不在两个向量中的字符串; 也就是说,对称差异.

分析

我查看了函数setdiff,但其输出取决于向量的考虑顺序.我发现自定义函数outersect,但是这个函数要求两个向量具有相同的长度.

有什么建议？

更正

这个问题似乎与我工作的数据有关.否则,下面的答案解决了我在这篇文章中提到的问题.我会看看我的数据有什么独特之处,如果我学到任何可能对其他用户有帮助的东西,我会回复.

r xor set-difference intersect symmetric-difference

Gya*_*eda

2013 11-06

5
推荐指数

2
解决办法

3286
查看次数

如何限制Ingres中任意查询的结果集大小？

在Oracle中,可以通过在"虚拟" rownum列上进行过滤来限制在任意查询中返回的行数.请考虑以下示例,该示例最多将返回10行.

SELECT * FROM all_tables WHERE rownum <= 10

是否有简单,通用的方法在Ingres做类似的事情？

sql oracle ingres

Cra*_*Day

2015 05-04

4
推荐指数

1
解决办法

7482
查看次数

验证聚类算法的输出

是否有客观的方法来验证聚类算法的输出？

我正在对由具有许多属性的对象组成的数据集使用scikit-learn的亲和传播聚类.提供给聚类算法的差异矩阵由这些属性的加权差异组成.我正在寻找一种方法来客观地验证距离权重中的调整,如结果簇中所反映的那样.数据集很大,并且具有足够的属性,手动检查小示例不是验证生成的集群的合理方法.

cluster-analysis machine-learning data-mining scipy scikit-learn

And*_*w M

2015 04-28

4
推荐指数

1
解决办法

1883
查看次数

计算Hive中的列数

我正在寻找一种方法来计算Hive表中的列数.

我知道以下代码适用于Microsoft SQL Server.有Hive等价物吗？

SELECT COUNT(*),
  FROM INFORMATION_SCHEMA.COLUMNS
 WHERE TABLE_CATALOG = 'database_name'
   AND TABLE_SCHEMA = 'schema_name'
   AND TABLE_NAME = 'table_name'

Run Code Online (Sandbox Code Playgroud)

sql sql-server hive count distinct

Gya*_*eda

2013 12-17

4
推荐指数

2
解决办法

2万
查看次数

CSS和Javascript效果:用字母之间的不同间距来对齐字符.Mousemove影响了

我有两个单词"Word"和"Arrangement",在这些字符之间有不同的间距.

在此输入图像描述

<h1 id="logo">
    <span class="word">
        <span class="w">w</span>
        <span class="o">o</span>
        <span class="r">r</span>
        <span class="d">d</span>
    </span>
    <span class="arrangement">
        <span class="a1">a</span>
        <span class="r1">r</span>
        <span class="r2">r</span>
        <span class="a2">a</span>
        <span class="n1">n</span>
        <span class="g">g</span>
        <span class="e1">e</span>
        <span class="m">m</span>
        <span class="e2">e</span>
        <span class="n2">n</span>
        <span class="t">t</span>
    </span>
</h1>

Run Code Online (Sandbox Code Playgroud)

当我沿着屏幕移动鼠标时,我希望字符之间的间距略微移动.例如,当我向右移动时,左边的间距应该增加,右边的间距会变得更紧.反之亦然.

的jsfiddle

做这个的最好方式是什么？

我不知道我是否正走在正确的道路上.如果每页加载时间距是随机的,那就更酷了.只有一条规则.这两个词应该仍然是可以区分的.与上面的示例一样,您可以清楚地阅读"单词排列".

亲切的问候,Sepp88

html javascript css experimental-design

mat*_*att

2015 04-28

3
推荐指数

3
解决办法

397
查看次数

Vectorize python函数

我有一个名为old的函数old_func,它将两个位置参数作为输入,x和y.使用元组作为输入,函数的输入是这样写的:

def old_func(position):

    x, y = position 
    return x**2 + y**2

Run Code Online (Sandbox Code Playgroud)

我现在想要一种通过值网格调用函数的快捷方法:

xx = numpy.linspace(0, 1, 100)
yy = numpy.linspace(0, 1, 100)
X, Y = numpy.meshgrid(xx, yy)

array_positions = (X,Y)
old_fun(array_positions)

Run Code Online (Sandbox Code Playgroud)

意图是x函数中的每个操作都在所有X和相同的上完成y.我尝试使用功能向量化,numpy.vectorize但这不起作用.我不想更改接受NumPy数组的函数,因为这需要太长时间.

python numpy vectorization apply

Dip*_*ole

2015 07-21

3
推荐指数

1
解决办法

566
查看次数

标签统计

sql ×4

machine-learning ×3

cluster-analysis ×2

python ×2

scikit-learn ×2

sql-server ×2

algorithm ×1

apply ×1

count ×1

css ×1

data-mining ×1

distinct ×1

experimental-design ×1

hive ×1

html ×1

ingres ×1

intersect ×1

javascript ×1

numpy ×1

oracle ×1

postgresql ×1

r ×1

random-forest ×1

regex ×1

regression ×1

scipy ×1

set-difference ×1

sql-injection ×1

symmetric-difference ×1

vectorization ×1

xor ×1

标签 统计

小编Gya_eda的帖子

标签统计