小编Ghi*_*ADJ的帖子

禁用Tensorflow调试信息

通过调试信息,我的意思是TensorFlow在我的终端中显示有关加载的库和找到的设备等,而不是python错误.

I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcudnn.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcurand.so locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:900] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_init.cc:102] Found device 0 with properties: 
name: Graphics Device
major: 5 minor: …
Run Code Online (Sandbox Code Playgroud)

python tensorflow

131
推荐指数
9
解决办法
9万
查看次数

匹配不包含特定单词的字符串

我正在使用该match方法使用ruby,我希望将不包含某个字符串的URL与正则表达式匹配:ex:

http://website1.com/url_with_some_words.html
http://website2.com/url_with_some_other_words.html
http://website3.com/url_with_the_word_dog.html
Run Code Online (Sandbox Code Playgroud)

我想匹配不包含单词的网址dog,因此第一个和第二个匹配

ruby regex match

24
推荐指数
2
解决办法
2万
查看次数

如何生成一个随机的整数正态分布

如何生成一个随机整数np.random.randint(),但是正态分布在0左右.

np.random.randint(-10, 10)返回具有离散均匀分布的整数 np.random.normal(0, 0.1, 1)返回具有正态分布的浮点数

我想要的是两种功能之间的一种组合.

python random numpy

19
推荐指数
3
解决办法
4万
查看次数

找到最佳子串匹配

我正在寻找一个库或使用现有库的方法(difflib,fuzzywuzzy,python-levenshtein)中查找的字符串(的最接近的匹配query)文本(corpus)

我开发了一个基于的方法difflib,我将其corpus分成大小n(长度query)的ngrams .

import difflib
from nltk.util import ngrams

def get_best_match(query, corpus):
    ngs = ngrams( list(corpus), len(query) )
    ngrams_text = [''.join(x) for x in ngs]
    return difflib.get_close_matches(query, ngrams_text, n=1, cutoff=0)
Run Code Online (Sandbox Code Playgroud)

当查询和匹配字符串之间的差异只是字符替换时,它可以按我的意愿工作.

query = "ipsum dolor"
corpus = "lorem 1psum d0l0r sit amet"

match = get_best_match(query, corpus)
# match = "1psum d0l0r"
Run Code Online (Sandbox Code Playgroud)

但是当差异是字符删除时,它不是.

query = "ipsum dolor"
corpus = "lorem 1psum dlr sit …
Run Code Online (Sandbox Code Playgroud)

python distance match n-gram

18
推荐指数
1
解决办法
2482
查看次数

将TrueType字体加载到OpenCV

我们可以加载自定义TrueType字体并将其与cv2.putText函数一起使用吗?

font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img,'OpenCV',(10,500), font, 4,(255,255,255),2,cv2.LINE_AA)
Run Code Online (Sandbox Code Playgroud)

python opencv

12
推荐指数
3
解决办法
1万
查看次数

将最后一次匹配与正则表达式匹配

我想使用正则表达式匹配模式的最后一次出现.

我有这样的文字结构:

Pellentesque habitant morbi tristique senectus et netus et
lesuada fames ac turpis egestas. Vestibulum tortor quam, feugiat vitae
ultricies eget, tempor sit amet, ante. Donec eu libero sit amet quam
egestas <br>semper<br>tizi ouzou<br>Tizi Ouzou<br>                        
Run Code Online (Sandbox Code Playgroud)

我希望<br>在我的情况下匹配两个之间的最后一个文本<br>Tizi Ouzou<br>,理想情况下是Tizi Ouzou字符串

请注意,最后一个后面有一些空格 <br>

我试过这个:

<br>.*<br>\s*$
Run Code Online (Sandbox Code Playgroud)

但它会选择从第一个<br>到最后一个的所有内容.

注意:我正在使用python,我正在使用pythex来测试我的正则表达式

python regex

8
推荐指数
4
解决办法
1万
查看次数

HoughLines中rho和theta参数的解释

你能给我一个OpenCV的HoughLines函数的快速定义rhotheta参数吗?

void cv::HoughLines (   InputArray  image,
    OutputArray     lines,
    double  rho,
    double  theta,
    int     threshold,
    double  srn = 0,
    double  stn = 0,
    double  min_theta = 0,
    double  max_theta = CV_PI 
)
Run Code Online (Sandbox Code Playgroud)

我在文档中找到的唯一一件事是:

rho:累加器的距离分辨率,以像素为单位.

theta:累加器的角度分辨率,以弧度表示.

这意味着,如果我设置,rho=2那么我的图像的1/2的像素将被忽略...一种步幅= 2?

opencv image-processing hough-transform

8
推荐指数
2
解决办法
5469
查看次数

删除标签但在饼图中保留图例

如何从饼图中删除标签但保留图例?

import matplotlib.pyplot as plt

x = [15, 30, 55]
labels = [1, 2, 3]

plt.figure(figsize=(3, 3), dpi=72)
plt.pie(x, labels=labels)
plt.legend()
plt.savefig('pie_1.png')
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

python matplotlib

7
推荐指数
1
解决办法
3732
查看次数

根据成本函数选择最佳群集分区

我有一个我想要聚集的字符串:

s = 'AAABBCCCCC'
Run Code Online (Sandbox Code Playgroud)

我事先并不知道我会得到多少个集群.我所拥有的只是一个成本函数,可以进行聚类并给它一个分数.

群集大小也存在约束:它们必须在[a,b]范围内

在我的例子中,for a=3b=4,所有可能的聚类是:

[
    ['AAA', 'BBC', 'CCCC'],
    ['AAA', 'BBCC', 'CCC'],
    ['AAAB', 'BCC', 'CCC'],
]
Run Code Online (Sandbox Code Playgroud)

每个聚类的连接必须给出字符串 s

成本函数是这样的

cost(clustering) = alpha*l + beta*e + gamma*d
Run Code Online (Sandbox Code Playgroud)

哪里:

  • l = variance(cluster_lengths)
  • e = mean(clusters_entropies)
  • d = 1 - nb_characters_in_b_that_are_not_in_a)/size_of_b(对于b连续的群集a)
  • alpha,beta,gamma是权重

此成本函数为最佳情况提供低成本(0):

  1. 所有集群都具有相同的大小.
  2. 每个群集内的内容都是相同的.
  3. 连续集群不具有相同的内容.

从理论上讲,解决方案是计算此字符串的所有可能成分的成本并选择最低成本.但这需要太多时间.

是否有任何聚类算法可以在合理的时间内根据此成本函数找到最佳聚类?

algorithm machine-learning

6
推荐指数
1
解决办法
495
查看次数

在bazel构建中使用生成的代码

$ python gencpp.py 
Run Code Online (Sandbox Code Playgroud)

此命令foo.cpp在工作目录中生成cpp文件.

我想在运行此命令bazel建立能够包括之前foo.cppcc_binarysrcs属性.

我尝试过的:

genrule(
    name = 'foo',
    outs = ['foo.cpp'],
    cmd = 'python gencpp.py',
)

cc_library(
    srcs = ['foo.cpp'], # tried also with :foo
    ...
)
Run Code Online (Sandbox Code Playgroud)

声明输出'external/somelib/foo.cpp'不是由genrule创建的.这可能是因为genrule实际上没有创建此输出,或者因为输出是一个目录而且genrule是远程运行的(请注意,只有声明的文件输出的内容是从远程运行的genrules复制的).

我知道有一个解决方案需要gencpp.py稍微修改一下,但这不是我想要的.

bazel

6
推荐指数
2
解决办法
2829
查看次数