小编Mat*_*ock的帖子

使d3.js可视化布局响应的最佳方法是什么?

假设我有一个直方图脚本,可以构建一个960 500 svg图形.如何调整响应,以便调整图形宽度和高度是动态的?

<script> 

var n = 10000, // number of trials
    m = 10,    // number of random variables
    data = [];

// Generate an Irwin-Hall distribution.
for (var i = 0; i < n; i++) {
  for (var s = 0, j = 0; j < m; j++) {
    s += Math.random();
  }
  data.push(s);
}

var histogram = d3.layout.histogram()
    (data);

var width = 960,
    height = 500;

var x = d3.scale.ordinal()
    .domain(histogram.map(function(d) { return d.x; }))
    .rangeRoundBands([0, width]); …
Run Code Online (Sandbox Code Playgroud)

javascript responsive-design d3.js

218
推荐指数
4
解决办法
11万
查看次数

如何在调试模式下阻止Flask初始化两次?

在Python中构建Flask服务并设置调试模式时,Flask服务将初始化两次.当初始化加载高速缓存等时,这可能需要一段时间.在开发(调试)模式下,必须执行此操作两次都很烦人.关闭调试时,Flask服务仅初始化一次.

如何在调试模式下阻止Flask初始化两次?

python flask

83
推荐指数
2
解决办法
3万
查看次数

Python有堆栈/堆,内存管理方式如何?

如何在Python中管理变量和内存?它是否有堆栈和堆以及用于管理内存的算法?鉴于这方面的知识有关于大数据/数据处理的内存管理的任何建议吗?

python memory memory-management

79
推荐指数
2
解决办法
5万
查看次数

如何创建pip可安装项目?

如何创建pip可安装项目?你如何注册pip?

所有项目都应具有哪些元数据配置,以便进行集成和轻松导入.

python pip

24
推荐指数
2
解决办法
1万
查看次数

是否有python(scipy)函数来确定获得目标功率所需的参数?

在R中,有一个非常有用的功能,有助于确定双侧t检验的参数,以获得目标统计功效.

该函数被调用power.prop.test.

http://stat.ethz.ch/R-manual/R-patched/library/stats/html/power.prop.test.html

你可以用它来调用它:

power.prop.test(p1 = .50, p2 = .75, power = .90)
Run Code Online (Sandbox Code Playgroud)

它会告诉你获得这种能量所需的样本量.这对于阻止测试的样本大小非常有用.

scipy包中是否有类似的功能?

python numpy r scipy

18
推荐指数
4
解决办法
1万
查看次数

什么时候在python中收集垃圾?

什么时候在python中收集垃圾?什么时候发布内存并且收集会影响性能?可以选择退出或调整gc算法,如果是,如何?

python garbage-collection memory-management

16
推荐指数
2
解决办法
9121
查看次数

迭代大型列表时Python很慢

我目前正在使用pyodbc从数据库中选择一个大的行列表.然后将结果复制到一个大型列表,然后我尝试迭代列表.在我放弃python并尝试在C#中创建它之前,我想知道是否有一些我做错了.

clientItems.execute("Select ids from largetable where year =?", year);
allIDRows = clientItemsCursor.fetchall() #takes maybe 8 seconds.

for clientItemrow in allIDRows:
    aID = str(clientItemRow[0])
    # Do something with str -- Removed because I was trying to determine what was slow
    count = count+1
Run Code Online (Sandbox Code Playgroud)

更多信息:

  • for循环当前以每秒约5个循环运行,这对我来说似乎非常慢.
  • 选择的总行数为~489,000.
  • 它运行的机器有很多RAM和CPU.它似乎只运行一个或两个核心,而ram是1.72GB的4GB.

谁能告诉我什么是错的?脚本运行这么慢吗?

谢谢

python sql database pyodbc

10
推荐指数
1
解决办法
6939
查看次数

你如何在Heroku上运行实用程序服务?

Heroku非常适合原型设计和运行简单的Web服务,我经常使用它来运行像Flask和Django这样的Python Web服务并尝试创意.但是,我总是很难理解如何使用infrastricture在堆栈中的每个启动需求中运行那些非常强大的支持或实用程序服务.4个服务的例外我不能没有,并会推荐给任何创业公司.

  • 詹金斯
  • Statsd
  • 石墨
  • Graylog

你会如何在Heroku上运行这些?最好只安装这些支持服务的专用盒(Rackspace等).

有没有人在Heroku上运行实用程序守护程序(服务)?

heroku jenkins graphite statsd

8
推荐指数
1
解决办法
2890
查看次数

用Python创建信息图

我想在python中创建一个简单的信息图。Matplotlib似乎具有很多功能,但是没有什么可以掩盖我简单的热图网格示例。

信息图表是一个简单的5 x 5网格,其内部数字范围为0到1。然后,网格正方形将被着色为0 =白色1 =蓝色0.5(浅蓝色)。

Matplotlib可能可以使用,但我找不到或合并任何可以提供有关生成此结果的见解的示例。

任何见解,示例代码或库指导都将真正有帮助

关于马特

python grid charts matplotlib heatmap

6
推荐指数
1
解决办法
4872
查看次数

在Hive中创建具有S3位置的外部表时,数据是否已传输?

当您在Hive(在Hadoop上)上创建具有Amazon S3源位置的外部表时,数据将转移到本地Hadoop HDFS:

  • 外部表创建
  • 当quires(MR作业)在外部表上运行时
  • 从不(没有数据传输)和MR作业读取S3数据.

S3读取的成本是多少?将数据传输到HDFS只需要一个成本,或者没有数据传输成本,但是当Hive创建的MapReduce作业在此外部表上运行时,会产生读取成本.

外部表定义的示例如下:

CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';
Run Code Online (Sandbox Code Playgroud)

amazon hadoop hive amazon-s3

6
推荐指数
1
解决办法
6711
查看次数