小编Fra*_*nch的帖子

分类编码之前或之后的标准化?

我正在研究回归算法,在这种情况下k-NearestNeighbors预测产品的某个价格。

所以我有一个训练集,它只有一个具有 4 个可能值的分类特征。我已经使用一对 k 分类编码方案处理了它,这意味着现在我的 Pandas DataFrame 中还有 3 个列,其中 0/1 取决于存在的值。

DataFrame 中的其他特征主要是距离,如纬度 - 位置和价格的经度,都是数字。

我应该标准化(具有零均值和单位方差的高斯分布)并在分类编码之前或之后归一化吗?

我认为在编码后进行归一化可能是有益的,这样在测量邻居之间的距离时,每个特征对估计器来说都与其他特征一样重要,但我不太确定。

machine-learning linear-regression scikit-learn sklearn-pandas one-hot-encoding

6
推荐指数
1
解决办法
6593
查看次数

Seaborn解决方案的色相barplot

我在Jupyter笔记本上有以下DataFrame,该笔记本使用seaborn的小节图进行绘制:

    day_index   avg_duration    trips
0       0         708.852242    114586
1       1         676.702190    120936
2       2         684.572677    118882
3       3         708.925340    117868
4       4         781.767476    108036
5       5         1626.575057   43740
6       6         1729.155673   37508

daysOfWeek = ['Monday', 'Tuesday', 'Wednesday', 'Thursday\n', \
'Friday', 'Saturday', 'Sunday']

plt.figure(figsize=(16,10));
sns.set_style('ticks')
ax = sns.barplot(data=dfGroupedAgg, \
                 x='day_index', \
                 y='avg_duration', \
                 hue='trips', \
                 palette=sns.color_palette("Reds_d", n_colors=7, desat=1))

ax.set_xlabel("Week Days", fontsize=18, alpha=0.8)
ax.set_ylabel("Duration (seconds)", fontsize=18, alpha=0.8)
ax.set_title("Week's average Trip Duration", fontsize=24)
ax.set_xticklabels(daysOfWeek, fontsize=16)
ax.legend(fontsize=15)
sns.despine()
plt.show()
Run Code Online (Sandbox Code Playgroud)

情节A: …

python data-visualization matplotlib pandas seaborn

5
推荐指数
2
解决办法
4902
查看次数

收到的JSON有效负载无效.未知名称click_action

所以我目前正在开发一个PWA.

我现在正在使用推送通知,我已经能够通过以下非常简单的JSON结构接收背景和前景通知.

{
  "message":{
    "token":"aValidToken",
    "notification": {
      "title": "New Content!",
      "body": "A new video has been uploaded."
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

我还能够在其中添加包含其他信息的数据成员,并且仍然可以获得通知而不会带来任何不便.

现在的问题是,如果我想将另一个成员添加到JSON,例如click_action,我发布以下内容:

{
  "message":{
    "token":"aValidToken",
    "notification": {
      "title": "New Content!",
      "body": "A new video has been uploaded.",
      "click_action":"https://www.google.com.ar/"
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

{
    "error": {
        "code": 400,
        "message": "Invalid JSON payload received. Unknown name \"click_action\" at 'message.notification': Cannot find field.",
        "status": "INVALID_ARGUMENT",
        "details": [
            {
                "@type": "type.googleapis.com/google.rpc.BadRequest",
                "fieldViolations": [
                    {
                        "field": "message.notification",
                        "description": "Invalid …
Run Code Online (Sandbox Code Playgroud)

json push-notification service-worker progressive-web-apps firebase-cloud-messaging

5
推荐指数
1
解决办法
8316
查看次数

React Native 左对齐图标和文本居中

我是 React Native 的新手,我正在尝试做一些非常简单的事情:

我想创建以下组件:

一个可触摸的亮点,其图像左对齐,文本相对于 Touchable 居中。

我尝试了很多选项,例如向文本添加填充或边距,但这只会使按钮更大,而且似乎不是最干净的方法。

这是我到目前为止所得到的:

class App extends React.Component {
  constructor(props) {
    super(props);
  }

  render() {
    return (
      <View style={styles.appContainer}>
        <TouchableHighlight onPress={() => {}} style={styles.button}>
          <View style={styles.btnContainer}>
            <Image source={require('./assets/ic_logout.png')} style={styles.icon} />
            <Text style={styles.btnText}>Log out</Text>
          </View>
        </TouchableHighlight>
      </View>
    )
  }
}

const styles = StyleSheet.create({
  appContainer: {
    flex: 1,
    backgroundColor: 'lightgreen',
    alignItems: 'center',
    justifyContent: 'center'
  },
  btnContainer: {
    backgroundColor: '#1d2aba',
    paddingHorizontal: 60,
    paddingVertical: 10,
    flexDirection: 'row',
    alignItems: 'center',
    borderRadius: 5
  },
  button: {
    borderRadius: …
Run Code Online (Sandbox Code Playgroud)

android ios reactjs react-native touchablehighlight

3
推荐指数
1
解决办法
8009
查看次数

pyspark RDD将行扩展为多行

我在pyspark中有以下RDD,我相信这应该很简单,但是无法弄清楚:

information = [ (10, 'sentence number one'),
                (17, 'longer sentence number two') ]

rdd = sc.parallelize(information)
Run Code Online (Sandbox Code Playgroud)

我需要应用一个转换,将RDD转换为:

[ ('sentence', 10),
  ('number', 10),
  ('one', 10),
  ('longer', 17),
  ('sentence', 17),
  ('number', 17),
  ('two', 17) ]
Run Code Online (Sandbox Code Playgroud)

基本上将句子键扩展为多行,并将单词作为键.

我想避免使用SQL.

python apache-spark rdd pyspark

2
推荐指数
1
解决办法
2682
查看次数