我正在运行RuntimeWarning:在divide中遇到无效值
import numpy
a = numpy.random.rand((1000000, 100))
b = numpy.random.rand((1,100))
dots = numpy.dot(b,a.T)/numpy.dot(b,b)
norms = numpy.linalg.norm(a, axis =1)
angles = dots/norms ### Basically I am calculating angle between 2 vectors
Run Code Online (Sandbox Code Playgroud)
我的a中有一些向量的范数为0.因此在计算角度时它会给出运行时警告.
是否有一线pythonic方法来计算角度,同时考虑到0的规范?
angles =[i/j if j!=0 else -2 for i,j in zip(dots, norms)] # takes 10.6 seconds
Run Code Online (Sandbox Code Playgroud)
但这需要很多时间.由于所有角度的值都在1到-1之间,我只需要10个最大值,这对我有帮助.这需要大约10.6秒,这是疯了.
我正在使用 wsgi 服务器为我的 Web 应用程序生成服务器。我在记录信息时遇到问题。
这就是我运行应用程序的方式
from gevent import monkey; monkey.patch_all()
from logging.handlers import RotatingFileHandler
import logging
from app import app # this imports app
# create a file to store weblogs
log = open(ERROR_LOG_FILE, 'w'); log.seek(0); log.truncate();
log.write("Web Application Log\n"); log.close();
log_handler = RotatingFileHandler(ERROR_LOG_FILE, maxBytes =1000000, backupCount=1)
formatter = logging.Formatter(
"[%(asctime)s] {%(pathname)s:%(lineno)d} %(levelname)s - %(message)s"
)
log_handler.setFormatter(formatter)
app.logger.setLevel(logging.DEBUG)
app.logger.addHandler(log_handler)
# run the application
server= wsgi.WSGIServer(('0.0.0.0', 8080), app)
server.serve_forever()
Run Code Online (Sandbox Code Playgroud)
但是,在运行应用程序时,它不会记录任何内容。我想这一定是因为 WSGI 服务器,因为 app.logger 在没有 WSGI 的情况下工作。使用 WSGI 时如何记录信息?
问题:将 numpy 链接到更正的线性代数库。过程太复杂了,我可能会第 6 次寻找解决方案,但我不知道出了什么问题。我在 Ubuntu 12.04.5 上。我重新安装了 blas 和 lapack,然后使用 pip 重新安装了 numpy。我在系统环境中这样做,然后也在 virtualenv 环境中尝试。所有的事情似乎都没有奏效。
这是我的numpy.__config__.show():
lapack_info:
NOT AVAILABLE
lapack_opt_info:
NOT AVAILABLE
openblas_lapack_info:
NOT AVAILABLE
blas_info:
NOT AVAILABLE
atlas_3_10_blas_threads_info:
NOT AVAILABLE
atlas_threads_info:
NOT AVAILABLE
blas_src_info:
NOT AVAILABLE
atlas_3_10_threads_info:
NOT AVAILABLE
atlas_blas_info:
NOT AVAILABLE
atlas_3_10_blas_info:
NOT AVAILABLE
lapack_src_info:
NOT AVAILABLE
atlas_blas_threads_info:
NOT AVAILABLE
openblas_info:
NOT AVAILABLE
blas_mkl_info:
NOT AVAILABLE
blas_opt_info:
NOT AVAILABLE
atlas_info:
NOT AVAILABLE
atlas_3_10_info:
NOT AVAILABLE
lapack_mkl_info:
NOT AVAILABLE
mkl_info:
NOT AVAILABLE
Run Code Online (Sandbox Code Playgroud)
这是一个非常常见的错误,根据用户的环境和历史有很多解决方案。我最近按照此处的说明完成了安装 BLAS 和 LAPACK …
我正在尝试从Python中查询此API。它似乎以400个代码响应。有人可以告诉我该如何查询该API吗?
在http://text-processing.com/docs/phrases.html中记录了此API。
import requests
r = requests.post('http://text-processing.com/api/phrases/',
data= {'text':'This is California.'})
Run Code Online (Sandbox Code Playgroud)
我想我误解了应该在此处发布数据的方式。
我一直在尝试在我的MacOSX上安装spark.我已经使用brew安装了Scala和Sbt.下载并解开spark-1.4.1(我也试过spark-1.2.1和spark-1.1.1)我正在运行 -
sbt/sbt clean assembly
Run Code Online (Sandbox Code Playgroud)
每次都出现同样的错误:
Invalid or corrupt jarfile sbt/sbt-launch-0.13.5.jar
Run Code Online (Sandbox Code Playgroud)
我已经尝试过上面提到的更改名称和手动安装sbt的解决方案,但这些似乎都不起作用.我看到很多时候人们在stackoverflow上问问题,解决方案似乎并不一致.有人可以帮助我吗?
我在Ubuntu服务器上安装Spark.我已经按照所有步骤进行了操作,它甚至说最后还是成功了,但是当我运行时./bin/spark-shell它给了我这个错误.
这可能意味着它无法找到位于./spark-1.4.1/launcher/src/main/java/org/apache/spark/launcher位置的.jar文件,该文件包含所有java文件,如Main.java .
$ CLASSPATH和$ SPARK_CLASSPATH也没有任何内容.我以前在Linux和Mac上安装了Spark,并没有遇到这个问题.谁能告诉我这里有什么问题?可能我需要指定classpath或一些环境变量来指向包含所有类文件的jar.
我的JAVA_HOME指向/ jvm/java-6-openjdk-amd64/jre.这有什么问题吗?
编辑:我尝试了更多的东西.我编写了一个shell脚本来找出包含org/apache/spark/launcher/Main.class文件的jar文件,并发现它位于:/usr/local/src/spark/spark-1.4.1/launcher/target/spark-launcher_2.10-1.4.1.jar.我将我的CLASSPATH和SPARK_CLASSPATH更改为相同的位置并尝试运行Spark.它给了我同样的错误.
我还改变了./conf/spark-env.sh以包含不同的SPARK_CLASSPATH.它也没用.
我的.tmux.conf看起来像这样:
#remap default "prefix" from Ctrl-b to Ctrl-a
set -g prefix C-a
# mouse options for selecting pane
set -g mode-mouse on
set -g mouse resize-pane on
set -g mouse-select-pane on
set -g mouse-select-window on
# Use vim keybindings in copy mode
setw -g mode-keys vi
# Setup 'v' to begin selection as in Vim
bind-key -t vi-copy v begin-selection
bind-key -t vi-copy y copy-pipe "reattach-to-user-namespace pbcopy"
# Update default binding of `Enter` to also use copy-pipe
unbind -t vi-copy …Run Code Online (Sandbox Code Playgroud) 我正在制作像http://bl.ocks.org/mbostock/3883195这样的面积图,我想在上面添加一个附加功能。我想根据高度或其他一些变量使用不同的颜色。有没有办法做到这一点?
var area = d3.svg.area().interpolate("step-before")
.x(function(d) { return x(d.decile/10);})
.y0(height)
.y1(function(d) { return y(d.count);});
var svg = d3.select("body").append("svg")
.attr("width", width + margin.left + margin.right)
.attr("height", height + margin.top + margin.bottom)
.append("g")
.attr("transform", "translate(" + margin.left + "," + margin.top + ")");
d3.tsv("mark_vis.tsv", function(error, data){
if(error) throw error;
data = getCount(data);
console.log(data);
// data[0] = {decile : 1, count:0.34, other_variable:0.3}
svg.append("path").datum(data).attr("class", "area").attr("d", area);
//I wish I could do something like this .style("fill", function(d){return d.other_variable};);
svg.append("g").attr("class", "x axis").attr("transform", "translate(0," + …Run Code Online (Sandbox Code Playgroud) 在谷歌上做了大量搜索后,我无法在 python 中找到任何交通算法求解器。我希望在 Scipy 中找到一些没有用的东西。有人可以指导我找到正确的来源吗?
不知道在哪里发布这个问题,我知道有些策展人会问我代码或说这不是一个合适的地方。在这种情况下,请不要忘记将我引导到正确的地方。
我的问题:
Max(Sum_{i,j}( Cij*Xij) )
x11 + x12 + x13 = D1
X21 + X22 + x23 = D2
X11<10
X23 <100
Run Code Online (Sandbox Code Playgroud)
我通常会有 100,000 个汇(创造需求)和大约 1000 个来源(供应需求)。
algorithm optimization mathematical-optimization scipy python-2.7
我在Python文件中有一个名为some_class()的类:
/some-folder/app/bin/file.py
Run Code Online (Sandbox Code Playgroud)
我将它导入我的代码:
/some-folder2/app/code/file2.py
Run Code Online (Sandbox Code Playgroud)
通过
import sys
sys.path.append('/some-folder/app/bin')
from file import some_class
clss = some_class()
Run Code Online (Sandbox Code Playgroud)
我想在spark的map中使用这个类名为some_function的函数
sc.parallelize(some_data_iterator).map(lambda x: clss.some_function(x))
Run Code Online (Sandbox Code Playgroud)
这给了我一个错误:
No module named file
Run Code Online (Sandbox Code Playgroud)
而class.some_function当我在pyspark的map函数之外调用它时,即通常但不在pySpark的RDD中.我认为这与pyspark有关.我不知道我在哪里错了.
我尝试播放这个课程但仍然无法正常工作.