小编she*_*nzy的帖子

如何在matplotlib中绘制(高质量)表情符号?

我有以下字典:

a = {'?': 10, '???': 23, '': 13, '': 10, '': 13}
Run Code Online (Sandbox Code Playgroud)

我想将表情符号绘制为条形图,然后在条形图上绘制它们.起初我喜欢这里(带annotate),但它看起来很糟糕,而且它不支持一些表情符号.

import matplotlib.pyplot as plt
ax = plt.subplot(111)
ax.bar(range(1,6), a.values())
for label, x, y in zip(a.keys(), range(1,6), a.values()):
    plt.annotate(
        label, 
        xy=(x, y), xytext=(10,10),
        textcoords='offset points', ha='right', va='bottom',
        bbox=dict(boxstyle='round,pad=0.5', alpha=0),
        fontname='Segoe UI Emoji',
        fontsize=20)

ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.set_xticks([])
plt.show()
Run Code Online (Sandbox Code Playgroud)

正如我所说,看起来很糟糕:

在此输入图像描述

我如何绘制表情符号,以便matplotlib看起来很好看?

最好的办法是使用不同的字体在matplotlib将支持这些表情符号(我试图用一些不同的值plt.rcParams['font.family'],但没有成功),但如果不存在,它图像将工作太(但如何?)

我不想开始网络抓取图像并标记它们(因为我很确定有人已经这样做了).

我正在使用python 3,Spyder IDE,matplotlib版本2.0.2和anaconda.

有什么建议?

python plot matplotlib emoji

11
推荐指数
0
解决办法
2363
查看次数

发布/订阅主题的 GCP Cloud Function 触发器速率限制

我有一个从 Pub/Sub 主题触发的云函数。

我想对我的 Cloud Function 进行速率限制,因此我将最大实例设置为 5。在我的情况下,生成的消息将比 Cloud Functions 更多(并且我想限制正在运行的 Cloud Functions 的数量)。

我预计这个过程的行为类似于 Kafka/队列 - 主题消息将被累积,云函数将慢慢消耗消息,直到主题为空。

但似乎所有没有触发云功能(ack)的消息,只是发送了一个UNACK - 并留下了。我的订阅详情:

在此输入图像描述

确认截止时间最大值对我来说太低了(由于速率限制,云功能可能需要几个小时才能收到消息)。

我可以在 Pub/Sub 中更改哪些内容来满足我的需求?或者我需要添加一个队列?(Pub/Sub 发送到任务队列,Cloud Function 消耗任务队列?)。

顺便说一句,发布/订阅数据实际上是 GCS 事件。如果这是 AWS,我只需将 S3 文件创建的事件发送到 SQS,并让 Lambda 在队列的另一端进行使用。

任何帮助,将不胜感激。

message-queue publish-subscribe google-cloud-platform google-cloud-pubsub google-cloud-functions

8
推荐指数
1
解决办法
1491
查看次数

pandas将列表拆分为带正则表达式的列

我有一个字符串列表:

content
01/09/15, 10:07 - message1
01/09/15, 10:32 - message2
01/09/15, 10:44 - message3
Run Code Online (Sandbox Code Playgroud)

我想要一个数据框,如:

     date                message
01/09/15, 10:07          message1
01/09/15, 10:32          message2
01/09/15, 10:44          message3
Run Code Online (Sandbox Code Playgroud)

考虑到列表中的所有字符串都以该格式开头,我可以分开-,但我宁愿寻找一种更聪明的方法.

history = pd.DataFrame([line.split(" - ", 1) for line in content], columns=['date', 'message'])
Run Code Online (Sandbox Code Playgroud)

(之后我会将日期转换为日期时间)

任何帮助,将不胜感激.

python regex split dataframe pandas

7
推荐指数
2
解决办法
4457
查看次数

bash 带有变量的算术表达式

我在处理 bash 文件(unix 文件 .sh)中的算术表达式时遇到问题。

我有变量“total”,它由几个用空格分隔的数字组成,我想计算它们的总和(在变量“dollar”中)。

#!/bin/bash
..
dollar=0
for a in $total; do
  $dollar+=$a
done
Run Code Online (Sandbox Code Playgroud)

我知道我遗漏了算术括号中的一些内容,但我无法让它与变量一起使用。

bash arithmetic-expressions

6
推荐指数
2
解决办法
2722
查看次数

sklearn:发现样本数量不一致的输入变量:[1, 99]

我正在尝试用 spyder 中的熊猫构建一个简单的回归线。执行以下代码后,我收到此错误:

Found input variables with inconsistent numbers of samples: [1, 99]
Run Code Online (Sandbox Code Playgroud)

编码:

import numpy as np
import pandas as pd

dataset = pd.read_csv('Phil.csv')

x = dataset.iloc[:, 0].values
y = dataset.iloc[:, 2].values

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(x, y)
Run Code Online (Sandbox Code Playgroud)

我想我知道问题出在哪里,但我不太确定如何处理语法。在变量资源管理器中,x(和 y)的大小是 (99L,),据我所知,它不能是向量,必须是大小 (99,1)。y 也一样。

看到一堆相关的话题,但没有一个有帮助。

linear-regression pandas spyder sklearn-pandas

6
推荐指数
1
解决办法
1万
查看次数

谷歌语音API收到RST_STREAM,错误代码2

C#中的代码:

namespace GoogleSpeechConsole
{
    class Program
    {
        static void Main(string[] args)
        {
            var speech = SpeechClient.Create();

            var response = speech.Recognize(new RecognitionConfig()
            {
                Encoding = RecognitionConfig.Types.AudioEncoding.Flac,
                SampleRateHertz = 16000,
                LanguageCode = "en",
            }, RecognitionAudio.FromFile("myAudioFile.flac"));
            foreach (var result in response.Results)
            {
                foreach (var alternative in result.Alternatives)
                {
                    Console.WriteLine(alternative.Transcript);
                }
            }
        }
    }

}
Run Code Online (Sandbox Code Playgroud)

我尝试了各种格式和设置,例如原始,波形和flac。但是没有运气。我在CloudSpeechGrpc.cs中遇到以下错误:

  public virtual global::Google.Cloud.Speech.V1.RecognizeResponse Recognize(global::Google.Cloud.Speech.V1.RecognizeRequest request, grpc::CallOptions options)
  {
    return CallInvoker.BlockingUnaryCall(__Method_Recognize, null, options, request);
  }
Run Code Online (Sandbox Code Playgroud)

和以下错误:

Grpc.Core.RpcException:'状态(StatusCode = Internal,Detail =“已收到RST_STREAM,错误代码为2”))

c# api speech

6
推荐指数
0
解决办法
289
查看次数

Elasticsearch集群连接

这可能是一个愚蠢的问题,但我无法找到答案。如果我的集群中有 3 个节点,那么在创建传输客户端时是否需要提供每个节点的 IP 和端口,以便我可以与每个节点进行通信?

new PreBuiltTransportClient(settings, AuthenticationPlugin.class).addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("localhost"),
                        Integer.parseInt("9300")))
                        .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("localhost"),
                        Integer.parseInt("9301")))
InetSocketTransportAddress(InetAddress.getByName("localhost"),
                        Integer.parseInt("9302")));;
Run Code Online (Sandbox Code Playgroud)

有什么方法可以让我不需要提供每个节点的IP和端口吗?请帮忙

java client elasticsearch elasticsearch-java-api

6
推荐指数
1
解决办法
1513
查看次数

在visual studio命令提示符下更改目录

我想知道我应该在visual studio 2013的命令窗口中执行什么命令,将目录更改为:

C/:Users/user/Documents/Visual Studio 2013/Projects/OutlookAddin/publish/<Most_Recent_Version>/OutlookAddin_TemporaryKey.pfx

我必须执行什么命令?

visual-studio visual-studio-2012

5
推荐指数
2
解决办法
2万
查看次数

Rodeo 2.5改变终端颜色主题

我一直在寻找一个适合数据科学的IDE,而Rodeo似乎是正确的.

我想将主题颜色更改为黑暗,但在首选项 - >编辑器 - >主题只更改主题的一部分,但不是终端和其他东西.

在此输入图像描述

是否可以改变终端和其他终端的颜色?因为它不在偏好中.

ide themes rodeo

5
推荐指数
0
解决办法
665
查看次数

Python附加Counter to Counter,就像Python字典更新一样

我有2个计数器(来自集合的计数器),我想将一个附加到另一个,而第一个计数器的重叠键将被忽略.像dic.update(python词典更新)

例如:

from collections import Counter
a = Counter(a=4, b=0, c=1)
b = Counter(z=1, b=2, c=3)
Run Code Online (Sandbox Code Playgroud)

所以类似(忽略第一个计数器的重叠键):

# a.update(b) 
Counter({'a':4, 'z':1, 'b':2, 'c':3})
Run Code Online (Sandbox Code Playgroud)

我想我总是可以将它转换成某种字典,然后将其转换回Counter,或使用条件.但我想知道是否有更好的选择,因为我在一个非常大的数据集上使用它.

python counter dictionary python-3.x python-collections

4
推荐指数
2
解决办法
1077
查看次数