小编The*_*odo的帖子

在整个x_data上还是仅在train_data上对Keras fit_to_text更好?

我有一个带有文本列的数据框。我将它们分成x_trainx_test

我的问题是,最好Tokenizer.fit_on_text()在整个x数据集上使用Keras的功能x_train

像这样:

tokenizer = Tokenizer()
tokenizer.fit_on_texts(x_data)
Run Code Online (Sandbox Code Playgroud)

要么

tokenizer.fit_on_texts(x_train)        # <- fixed typo
tokenizer.texts_to_sequences(x_train)
Run Code Online (Sandbox Code Playgroud)

有关系吗?我也必须x_test稍后再进行标记化,所以我可以只使用相同的标记化器吗?

python tokenize keras

8
推荐指数
1
解决办法
936
查看次数

如何放大箱线图?

在此输入图像描述

如何在 jupyter 中放大箱线图?我找不到任何允许我这样做的可选参数。特别是使用seaborn。

python pandas seaborn jupyter figsize

5
推荐指数
1
解决办法
9160
查看次数

根据pandas中的另一个Column和Row填写NaN值

我有这样一个DF:

Name      Food      Year_eaten      Month_eaten

Maria     Rice        2014               3
Maria     Rice        2015              NaN
Maria     Rice        2016              NaN
Jack      Steak       2011              NaN
Jack      Steak       2012               5
Jack      Steak       2013              NaN
Run Code Online (Sandbox Code Playgroud)

我希望输出看起来像这样:

Name      Food      Year_eaten      Month_eaten

Maria     Rice        2014               3
Maria     Rice        2015               3
Maria     Rice        2016               3
Jack      Steak       2011               5
Jack      Steak       2012               5
Jack      Steak       2013               5
Run Code Online (Sandbox Code Playgroud)

我想根据这个条件填写NaN:

If the row's Name, Food is the same and the Year's are consecutive:
     Fill the NaN's with the Month_eaten corresponding to …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

5
推荐指数
1
解决办法
33
查看次数

如何删除字符之间的空格而不删除数据框中的所有空格?

假设我有一个像这样的数据框:

ID    Name       Description
0     Manny      V e  r y calm
1     Joey       Keen and a n a l y t i c a l
2     Lisa       R a s h and careless
3     Ash        Always joyful
Run Code Online (Sandbox Code Playgroud)

我想删除列中每个字母之间的所有空格Description,而不完全删除单词之间的所有必要空格。

Pandas 有一个简单的方法吗?

python dataframe pandas

3
推荐指数
1
解决办法
1285
查看次数

如何在Python中展平RDD?

我有一个垃圾邮件数据集,它具有以下数据类型:

\n\n

pyspark.rdd.PipelinedRDD

\n\n

当我这样做时spams.take(3),我得到:

\n\n

[["Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. Text FA to 87121 to receive entry question(std txt rate)T&C\'s apply 08452810075over18\'s"],\n [\'WINNER!! As a valued network customer you have been selected to receivea \xc2\xa3900 prize reward! To claim call 09061701461. Claim code KL341. Valid 12 hours only.\'],\n [\'Had your mobile 11 months or more? U R entitled to Update to the latest colour mobiles with …

python pyspark

2
推荐指数
1
解决办法
2116
查看次数

标签 统计

python ×5

pandas ×3

dataframe ×2

figsize ×1

jupyter ×1

keras ×1

pyspark ×1

seaborn ×1

tokenize ×1