小编fma*_*ark的帖子

python浮点数

我有点困惑为什么python在这种情况下添加一些额外的十进制数,请帮忙解释一下

>>> mylist = ["list item 1", 2, 3.14]
>>> print mylist ['list item 1', 2, 3.1400000000000001]
Run Code Online (Sandbox Code Playgroud)

python floating-point numerical floating-accuracy

10
推荐指数
2
解决办法
9206
查看次数

什么是R*-Tree算法?

我在哪里可以找到足够的文档来实现R*-Tree?具体来说,我需要能够:

  • 插入节点
  • 删除节点
  • 搜索K最近的邻居
  • 查找距离x内所有最近的邻居.

有没有一个地方可以清楚地记录这个算法?或者,我可以研究一个干净,开源的实现吗?更好的是,如果你能指出我的javascript实现,那么我的工作已经完成.

javascript algorithm spatial-index r-tree data-structures

10
推荐指数
0
解决办法
3906
查看次数

在R中检查和记录函数前置条件和后置条件的惯用方法是什么?

在R中检查和记录函数前置条件和后置条件的惯用方法是什么?我会考虑Eiffel的建成requireensure结构或Dinout艺术在这里的块的状态,但这些在接近他们,所以已经开发的最佳实践出炉的大多数语言都没有.

通过检查前置条件,我的意思是,如果传递了不符合函数假设的数据,则会抛出某种运行时异常.目前stopifnot,我可以在函数开始时考虑每个前提条件.这同样适用于后置条件,但是对于返回值而不是参数.

此外,是否有标准的方法来记录这些先决条件和后置条件是什么?例如,在Java中用JavaDoc注释拼写这些是非常标准的.

R在这方面的最佳做法是什么?

design-by-contract exception-handling r

10
推荐指数
1
解决办法
237
查看次数

如何使用ggplot在直方图上叠加任意参数分布?

如何使用ggplot在直方图上叠加任意参数分布?

我已经基于Quick-R示例进行了尝试,但我不明白缩放因子的来源.这种方法合理吗?如何修改它以使用ggplot?

使用此方法绘制正态分布和对数正态分布的示例如下:

## Get a log-normalish data set: the number of characters per word in "Alice in Wonderland"
alice.raw <- readLines(con = "http://www.gutenberg.org/cache/epub/11/pg11.txt", 
                       n = -1L, ok = TRUE, warn = TRUE,
                       encoding = "UTF-8")

alice.long <- paste(alice.raw, collapse=" ")
alice.long.noboilerplate <- strsplit(alice.long, split="\\*\\*\\*")[[1]][3]
alice.words <- strsplit(alice.long.noboilerplate, "[[:space:]]+")[[1]]
alice.nchar <- nchar(alice.words)
alice.nchar <- alice.nchar[alice.nchar > 0]

# Now we want to plot both the histogram and then log-normal probability dist
require(MASS)
h <- hist(alice.nchar, breaks=1:50, xlab="Characters in …
Run Code Online (Sandbox Code Playgroud)

r data-visualization histogram ggplot2

9
推荐指数
1
解决办法
2315
查看次数

关于Dabo的观点

有人最近使用过Dabo吗?它如何评价与Boa Constructor等?我正在编写一个新的Python数据库应用程序,而Dabo看起来很有希望,但是现实世界的独家新闻是什么呢?

是否被许多开发人员使用?据我所知,在SO或其他任何地方都没有谈到这个问题.我只是担心支持社区可能太小,或者作家可能决定放弃.

你对Dabo的评价是什么?

python dabo

8
推荐指数
1
解决办法
1018
查看次数

python模块的单元测试基础结构

我正在写一个python模块,我想对它进行单元测试.我是python的新手,有点选择可用的选项.

目前,我想把我的测试作为doctests编写,因为我喜欢声明式而不是命令式(但是,如果它被误导,请随意消除我的偏好).然而,这提出了一些问题:

  1. 我应该在哪里进行测试?在与他们正在测试的代码相同的文件中(或在doctests的docstrings中)?或者将它们分成自己的目录是否更好?
  2. 如何一次性从命令行运行整个模块中的所有测试?
  3. 如何报告测试套件的代码覆盖率?
  4. 我应该注意在python中进行单元测试的任何其他最佳实践?

python doctest unit-testing code-coverage

8
推荐指数
1
解决办法
897
查看次数

在R中将数据帧保存到光盘以进行存储的最佳格式是什么?

将简单数据帧保存到R盘中用于存储同时限制语义丢失的最佳格式是什么?

我问,因为我正在存档数据集.在理想的世界中,我的数据格式具有以下特征:

  1. 稳定性 - 存储格式将与R的未来版本兼容
  2. 语义兼容性 - 存储格式将理解R的主要数据类型的语义.例如,它将能够以合理的方式存储带有标签的有序因子.
  3. 开放标准 - 理想情况下,格式将是一个开放标准,因此其他统计软件包(现在或将来)将能够理解它

我的第一个想法是使用非常稳定的CSV,但缺乏所需的语义丰富性.另一方面,R的内置RData格式完全捕获了R的语义,但似乎可能在发行版之间发生变化(如果我错了,请纠正我).

是否有另一种格式可以在这三种命令之间找到平衡点?

persistence r data-formats

8
推荐指数
1
解决办法
1161
查看次数

如何使用Python在Windows上检索附近无线LAN网络的信号强度?

如何使用Python在Windows上检索附近无线LAN网络的信号强度?

我想显示或绘制值.

python windows wireless signals wlan

7
推荐指数
2
解决办法
1万
查看次数

在javascript中执行"整数"转换/类型转换的惯用方法是什么?

另一个问题是关于a >>> 0Javascript中代码片段的含义.事实证明,这是一种确保变量是无符号32位整数的聪明方法.

这很漂亮,但我不喜欢它有两个原因.

  • 表达的意图并不清楚,至少对我来说不是这样.
  • 它不适用于负数

这让我想问:在Javascript中将任意值转换为"整数"的最惯用方法是什么? 它应该适用于有符号整数,而不仅仅是非负数.由于整数只是在Javascript中伪装成浮点这一事实导致的这种情况是可以接受的,但是应该被承认.它不应该返回undefinedNaN在任何情况下(这些不是整数),但返回0非数字值.

javascript integer idioms

6
推荐指数
1
解决办法
263
查看次数

如何才能唯一缩短字符串列表,使其最多为x个字符

我正在寻找一种算法,它将采用字符串向量v1并返回一个类似的字符串向量,v2其中每个字符串长度小于x字符且是唯一的.字符串v1可能不是唯一的.

虽然我需要接受ASCII v1,但我宁愿只[A-Za-z0-9]在需要插入新字符时插入字母数字字符().

显然这里有三个警告:

  1. 对于某些值的v1x,没有可能的唯一v2.例如,当v1有37个元素时x == 1.

  2. 问题中指定的"类似"是主观的.字符串将是面向用户的,并且可能是短的自然语言短语(例如"颜色数").我希望人类能够尽可能容易地将原始地图映射到缩短的字符串.这可能意味着利用诸如dismvoweling等启发式方法.因为可能没有客观衡量我的相似性结构(字符串距离可能不会在这里最有用,尽管它可能),我对好的东西的判断将是任意的.该方法应适合英语 - 其他语言无关紧要.

显然这是一个(编程)语言无关的问题,但我对python中的实现很有好感(因为我发现它的字符串处理语言是直接的).

python language-agnostic string algorithm abbreviation

6
推荐指数
1
解决办法
1206
查看次数