我正在尝试编写序列以在keras中对RNN进行排序.我使用我从网上理解的内容编写了这个程序.我首先表征然后将文本转换的文本成序列和填充,以形成特征变量X.获得目标变量Y,首先将x向左移动然后填充它.最后,我将我的功能和目标变量提供给了我的LSTM模型.
这是我为此目的用keras编写的代码.
from keras.preprocessing.text import Tokenizer,base_filter
from keras.preprocessing.sequence import pad_sequences
from keras.models import Sequential
from keras.layers import Dense, Activation,Dropout,Embedding
from keras.layers import LSTM
def shift(seq, n):
n = n % len(seq)
return seq[n:] + seq[:n]
txt="abcdefghijklmn"*100
tk = Tokenizer(nb_words=2000, filters=base_filter(), lower=True, split=" ")
tk.fit_on_texts(txt)
x = tk.texts_to_sequences(txt)
#shifing to left
y = shift(x,1)
#padding sequence
max_len = 100
max_features=len(tk.word_counts)
X = pad_sequences(x, maxlen=max_len)
Y = pad_sequences(y, maxlen=max_len)
#lstm model
model = Sequential()
model.add(Embedding(max_features, 128, …Run Code Online (Sandbox Code Playgroud) python neural-network keras recurrent-neural-network sequence-to-sequence
我试图char-rnn在keras中编写一个文本为此目的,我必须首先将文本转换为序列,然后填充序列.但是我在实施这一步骤时遇到了很多麻烦.我相信它是因为我对这个函数(pad_sequence)本身的倾斜或缺乏理解.我试图谷歌它并没有找到任何好的教程,他们在keras 文档也没有太多解释.
谁能告诉我怎么样和什么是 pad_sequence什么?为什么我们应该在喂食之前填充序列(这里是字符级别).
请以此文为例?
在我在波士顿布莱根妇女医院的诊所接受诊断患有前列腺癌的50岁男子.他接受了一种新的手术来移除他的前列腺,后来接受了集中的辐射以试图根除任何剩余的癌症.不幸的是,一年后他的病就复发了.但经过两次新疗法后,他的癌症现在出现了问题.如果他的癌症确实蔓延,许多其他治疗方法 - 包括许多甚至还未上市的治疗方法 - 都可能使他的癌症恢复正常.