小编Hue*_*uey的帖子

在numpy中,[:,None]的选择是做什么的?

我正在深入学习Udacity课程,我遇到了以下代码:

def reformat(dataset, labels):
    dataset = dataset.reshape((-1, image_size * image_size)).astype(np.float32)
    # Map 0 to [1.0, 0.0, 0.0 ...], 1 to [0.0, 1.0, 0.0 ...]
    labels = (np.arange(num_labels) == labels[:,None]).astype(np.float32)
    return dataset, labels
Run Code Online (Sandbox Code Playgroud)

labels[:,None]这里到底做了什么?

python numpy

32
推荐指数
4
解决办法
2万
查看次数

匀称的 OSError:找不到 lib c 或加载其任何变体 []

我只是想使用演示代码。我在 Jupyter Notebook 中运行以下命令:

from shapely.geometry import shape

这给了我以下内容:

OSError                                   Traceback (most recent call last)
<ipython-input-4-cf5b4d0962ea> in <module>()
----> 1 from shapely.geometry import shape

/Users/hkwik/anaconda/lib/python2.7/site-packages/shapely/geometry/__init__.py in <module>()
      2 """
      3 
----> 4 from .base import CAP_STYLE, JOIN_STYLE
      5 from .geo import box, shape, asShape, mapping
      6 from .point import Point, asPoint

/Users/hkwik/anaconda/lib/python2.7/site-packages/shapely/geometry/base.py in <module>()
      7 from ctypes import pointer, c_size_t, c_char_p, c_void_p
      8 
----> 9 from shapely.coords import CoordinateSequence
     10 from shapely.ftools import wraps
     11 from shapely.geos import lgeos, ReadingError …
Run Code Online (Sandbox Code Playgroud)

python shapely

18
推荐指数
3
解决办法
1万
查看次数

即使在使用.loc之后,Pandas仍然会获得SettingWithCopyWarning

起初,我尝试编写一些看起来像这样的代码:

import numpy as np
import pandas as pd
np.random.seed(2016)
train = pd.DataFrame(np.random.choice([np.nan, 1, 2], size=(10, 3)), 
                     columns=['Age', 'SibSp', 'Parch'])

complete = train.dropna()    
complete['AgeGt15'] = complete['Age'] > 15
Run Code Online (Sandbox Code Playgroud)

获得SettingWithCopyWarning后,我尝试使用.loc:

complete.loc[:, 'AgeGt15'] = complete['Age'] > 15
complete.loc[:, 'WithFamily'] = complete['SibSp'] + complete['Parch'] > 0
Run Code Online (Sandbox Code Playgroud)

但是,我仍然得到同样的警告.是什么赋予了?

python pandas chained-assignment

17
推荐指数
1
解决办法
3901
查看次数

从FeatureUnion + Pipeline中获取要素名称

我正在使用FeatureUnion来加入从事件标题和描述中找到的功能:

union = FeatureUnion(
    transformer_list=[
    # Pipeline for pulling features from the event's title
        ('title', Pipeline([
            ('selector', TextSelector(key='title')),
            ('count', CountVectorizer(stop_words='english')),
        ])),

        # Pipeline for standard bag-of-words model for description
        ('description', Pipeline([
            ('selector', TextSelector(key='description_snippet')),
            ('count', TfidfVectorizer(stop_words='english')),
        ])),
    ],

    transformer_weights ={
            'title': 1.0,
            'description': 0.2
    },
)
Run Code Online (Sandbox Code Playgroud)

但是,调用union.get_feature_names()给我一个错误:"变换器标题(类型管道)不提供get_feature_names." 我想看看我的不同矢量化器生成的一些功能.我该怎么做呢?

nlp feature-extraction python-3.x scikit-learn

16
推荐指数
2
解决办法
5879
查看次数

熊猫滚动给NaN

我正在查看有关窗口函数的教程,但我不太明白为什么以下代码会生成NaN.

如果我理解正确,代码会创建一个大小为2的滚动窗口.为什么第一行,第四行和第五行都有NaN?起初,我认为这是因为添加另一个数字的NaN会产生NaN,但是我不知道为什么第二行不会是NaN.

dft = pd.DataFrame({'B': [0, 1, 2, np.nan, 4]}, 
                   index=pd.date_range('20130101 09:00:00', periods=5, freq='s'))


In [58]: dft.rolling(2).sum()
Out[58]: 
                       B
2013-01-01 09:00:00  NaN
2013-01-01 09:00:01  1.0
2013-01-01 09:00:02  3.0
2013-01-01 09:00:03  NaN
2013-01-01 09:00:04  NaN
Run Code Online (Sandbox Code Playgroud)

python pandas

13
推荐指数
2
解决办法
1万
查看次数

在Spark中打印出数据框列的类型

我尝试在我的Spark数据框架上使用VectorAssembler,它抱怨它不支持StringType类型.我的数据框有2126列.

打印出所有列类型的编程方法是什么?

pyspark

11
推荐指数
2
解决办法
2万
查看次数

用Seaborn删除一些x标签

在下面的屏幕截图中,我的所有x标签彼此重叠.

g = sns.factorplot(x='Age', y='PassengerId', hue='Survived', col='Sex', kind='strip', data=train);
Run Code Online (Sandbox Code Playgroud)

我知道我可以通过调用删除所有标签g.set(xticks=[]),但有没有办法只显示一些Age标签,如0,20,40,60,80?

在此输入图像描述

python seaborn

10
推荐指数
1
解决办法
4682
查看次数

如何计算JIRA中的评论数量

我想创建一个问题过滤器,向我显示每个问题的评论数量,然后按此排序.

我尝试过类似的东西:

project = "myProject" AND created >= 2012-06-01 AND created < 2012-08-01 ORDER BY count(comment)
Run Code Online (Sandbox Code Playgroud)

我在JIRA 4.2上.我该怎么做呢?

jira jql

6
推荐指数
1
解决办法
8880
查看次数

基于时间的.rolling()失败,分组依据

这是Pandas Issue#13966的代码片段

dates = pd.date_range(start='2016-01-01 09:30:00', periods=20, freq='s')
df = pd.DataFrame({'A': [1] * 20 + [2] * 12 + [3] * 8,
                   'B': np.concatenate((dates, dates)),
                   'C': np.arange(40)})
Run Code Online (Sandbox Code Playgroud)

失败:

df.groupby('A').rolling('4s', on='B').C.mean()
ValueError: B must be monotonic
Run Code Online (Sandbox Code Playgroud)

根据上面链接的问题,这似乎是一个错误。有没有人有一个好的解决方法?

python group-by pandas

6
推荐指数
1
解决办法
442
查看次数

让fields_for使用has_many关系

我在生成嵌套模型表单时遇到问题.

这是我的模特:

class Workout < ActiveRecord::Base
    has_many :scores
    has_many :users, :through => :scores
    accepts_nested_attributes_for :scores
end

class Score < ActiveRecord::Base
    belongs_to :user
    belongs_to :workout
end

class User < ActiveRecord::Base
    has_many :scores
    has_many :workout, :through => :scores
end
Run Code Online (Sandbox Code Playgroud)

在Workout控制器中,这是我对新动作的所有内容:

def new
    @workout = Workout.new
    3.times { @workout.scores.build }

    respond_to do |format|
        format.html # new.html.erb
        format.json { render json: @wod }
    end
end
Run Code Online (Sandbox Code Playgroud)

但是,在表单中,当我尝试fields_for时,我什么都没得到:

<% f.fields_for :scores do |builder| %>
    <p>
        <%= builder.label :score %><br />
        <%= builder.text_field :score %>
    </p>
<% …
Run Code Online (Sandbox Code Playgroud)

ruby ruby-on-rails ruby-on-rails-3.2

5
推荐指数
1
解决办法
5328
查看次数

使用Java创建命名的临时文件

我希望能够在Java中创建一个临时文本文件以在屏幕上显示,但是使用File.createTempFile()并不能让我对其名称进行足够的控制.

这有什么想法?

java file

4
推荐指数
1
解决办法
1504
查看次数

在R中将重音转换为ASCII

我正在尝试将特殊字符转换为R中的ASCII.我在这个问题中尝试使用Hadley的建议:

stringi::stri_trans_general('Jos\xe9', 'latin-ascii')
Run Code Online (Sandbox Code Playgroud)

但我得到了"乔斯".我正在使用stringi v1.1.1.

我正在运行Mac.我运行Windows机器的朋友似乎得到了"Jose"的理想结果.

知道发生了什么事吗?

unicode r diacritics transliteration stringi

1
推荐指数
1
解决办法
1092
查看次数