小编and*_*apo的帖子

Python的互信息实现

我在实现Python的机器学习库提供的互信息函数时遇到了一些问题,特别是:sklearn.metrics.mutual_info_score(labels_true,labels_pred,contingency = None)

(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html)

我正在尝试实现我在斯坦福NLP教程网站中找到的示例:

该网站位于:http://nlp.stanford.edu/IR-book/html/htmledition/mutual-information-1.html#mifeatsel2

问题是我不断得出不同的结果,但没有弄清楚原因.

我得到了相互信息和特征选择的概念,我只是不明白它是如何在Python中实现的.我所做的是我提供了基于NLP站点示例的两个数组的mutual_info_score方法,但它输出了不同的结果.另一个有趣的事实是无论如何你玩,并改变那些阵列上的数字,你最有可能得到相同的结果.我是否应该使用另一种特定于Python的数据结构或者背后的问题是什么？如果有人在过去成功使用过这个功能,对我来说将是一个很大的帮助,谢谢你的时间.

python machine-learning feature-selection

and*_*apo

lucky-day

10
推荐指数

1
解决办法

1万
查看次数

LogCat停止工作

如果我的Eclipse工作超过3或4个小时,并且我想在那之后调试我的Android应用程序,那么Logcat就会死掉.只有当我重新启动Eclipse LogCat重新生成时.

我搜索过,但似乎没有找到任何解决方案.

有任何想法吗？

提前致谢.

eclipse android logcat

and*_*apo

lucky-day

8
推荐指数

1
解决办法

5339
查看次数

在Redshift中使用Python聚合UDF

我设法在AmazonRedshift中用Python编写一些标量函数,即将一列或几列作为输入并根据某些逻辑或转换返回单个值.

但是有没有办法在UDF中传递数字列(即列表)的所有值并计算这些值的统计数据,例如平均值或标准差？

python amazon-web-services amazon-redshift udf

and*_*apo

lucky-day

7
推荐指数

1
解决办法

1174
查看次数

Azure Devops 从 Docker 内的 Azure Artifacts 安装 Python 包

我正在尝试从 Azure Artifacts 安装一个 pip 包作为 Docker 映像（带Docker@2任务）的一部分，但无论我尝试什么都不起作用。

看起来pip无论我尝试什么，我的内部 Docker 都无法针对 Azure Artifacts 进行身份验证。我得到的最接近的是

RUN pip install keyring artifacts-keyring
ENV ARTIFACTS_KEYRING_NONINTERACTIVE_MODE true
RUN pip install <> --index-url https://pkgs.dev.azure.com/<>/_packaging/<>/pypi/simple/

Run Code Online (Sandbox Code Playgroud)

但在我的 Azure DevOps 中，我不断收到

ERROR: Could not find a version that satisfies the requirement <> (from versions: none)
ERROR: No matching distribution found for <>

Run Code Online (Sandbox Code Playgroud)

另外 - 关于这方面的 Azure 文档似乎很差，如果我切换ENV ARTIFACTS_KEYRING_NONINTERACTIVE_MODE false它会提示我的 Azure DevOps 管道进行交互身份验证，这不是我想要的。

如何自动安装在 Azure Artifacts 中发布的 Python 包作为 Azure Pipeline Docker 任务的一部分？

azure azure-devops azure-pipelines

and*_*apo

2020 04-08

6
推荐指数

2
解决办法

2903
查看次数

运行COPY命令将gzip-ed数据加载到S3中的Redshift

当我运行我的复制命令将所有文件从S3文件夹复制到Redshift表时,它失败了"ERROR: gzip: unexpected end of stream. Unknown zlib error code. zlib error code: -1":

copy table_name 
    (column_list)
from 's3://bucket_name/folder_name/'
     credentials 'aws_access_key_id=xxxxxx;aws_secret_access_key=xxxxxxxxx'
     delimiter '|' GZIP

Run Code Online (Sandbox Code Playgroud)

但是,当我为文件夹中的每个文件指定文件前缀时,它会成功:

copy table_name 
    (column_list)
from 's3://bucket_name/folder_name/file_prefix'
     credentials 'aws_access_key_id=xxxxxx;aws_secret_access_key=xxxxxxxxx'
     delimiter '|' GZIP

Run Code Online (Sandbox Code Playgroud)

这些文件是GZIP编辑的.

AWS文档中未明确指出,如果您只是指定folder_name,则copy命令可以加载该文件夹的全部内容,但是我确实收到错误.

有没有人遇到过类似的问题？这种操作需要文件前缀吗？

amazon-s3 amazon-web-services amazon-redshift

and*_*apo

2015 01-12

4
推荐指数

1
解决办法

5147
查看次数

Redshift Python UDFs Varchar限制

我已经成功创建了一个Python UDF,它接受表中的varchar值,并根据正则表达式提取该值的子字符串.

DDL中varchar列的最大大小设置为20000字节,在某些情况下,当我尝试调用它时UDF输出错误:

ERROR: Value too long for character type

Detail: 
  -----------------------------------------------
  error:  Value too long for character type
  code:      8001
  context:   Value too long for type character varying(256)
  query:     1127608
  location:  funcs_string.hpp:390
  process:   query0_73 [pid=25345]
  -----------------------------------------------

Run Code Online (Sandbox Code Playgroud)

是否UDF输入变量的max varchar限制设置为256字节？如果是的话,这是我可以在我的代码中更改的内容吗？

谢谢,

python amazon-redshift udf

and*_*apo

lucky-day

4
推荐指数

1
解决办法

1310
查看次数

Azure Functions 访问 Azure 存储帐户防火墙

我想达到什么目的

通过 Azure 函数连接到位于防火墙后面的 Azure BLOB 存储帐户。

迄今为止采取的步骤

Azure Function 针对按预期工作的公共存储帐户进行开发和测试。
按照Azure 资源浏览器的 Azure 功能查找出站地址（"outboundIpAddresses"条目）并将它们添加到存储帐户的防火墙中。

问题

在尝试使用防火墙针对存储帐户运行 Azure 功能时，我收到了 Status: 500 Internal Server Error - This request is not authorized to perform this operation.

我在这里缺少什么？

azure azure-storage azure-storage-blobs azure-functions

and*_*apo

2019 05-10

4
推荐指数

1
解决办法

2294
查看次数

将MongoDb与Java Servlet一起使用

我在Java servlet上使用Mongo DB时遇到了问题.

我的servlet有很多方法(~20)访问数据库以检索和添加数据.一个非常简短的例子:

public static String getSomething(String s) {
  String json = "[]";
  JSONArray jsonArray = new JSONArray();
  DBCollection table;

  try {
    Mongo mongo = new Mongo("localhost", 27017);
    DB db = mongo.getDB( "myDb" );  
        BasicDBObject quoteQuery = new BasicDBObject("abc", abc);
    DBCursor cursor = table.find(quoteQuery);

    try {
      while(cursor.hasNext()) {
        jsonArray.put(cursor.next());
      }
    } finally {
      cursor.close();
    }

// ...

Run Code Online (Sandbox Code Playgroud)

现在问题是当这个Java servlet部署在linux服务器上时,它可以正常工作10天左右.

之后它崩溃了.

当我去我的var/log目录中的mongodb.log时,我得到以下重复输出:

"因为太多的开放连接而拒绝连接"

我不确定现在在哪里编辑或如何处理这个问题.我试图增加服务器中打开连接的限制,但仍然有相同的结果.

有什么建议？

java servlets mongodb

and*_*apo

2013 09-13

2
推荐指数

1
解决办法