小编Nik*_*dra的帖子

将一个段落标记为句子,然后将其转换为NLTK中的单词

我试图将整个段落输入到我的文字处理器中,先将其分成句子然后再分成单词.

我尝试了以下代码,但它不起作用,

    #text is the paragraph input
    sent_text = sent_tokenize(text)
    tokenized_text = word_tokenize(sent_text.split)
    tagged = nltk.pos_tag(tokenized_text)
    print(tagged)
Run Code Online (Sandbox Code Playgroud)

但这不起作用,给我错误.那么如何将段落标记为句子然后单词呢?

一个示例段落:

这件事似乎压倒了这只小黑褐色的狗,使他受伤了.他在孩子脚下绝望地沉了下去.当重复一击,伴随着幼稚的句子中的警告,他转过身来,以一种特殊的方式握住他的爪子.在他的耳朵和眼睛的同时,他向孩子祈祷.

**警告:**这只是来自互联网的随机文本,我不拥有上述内容.

python nltk

31
推荐指数
3
解决办法
5万
查看次数

无法构建apk:方法引用的数量不能超过64K

我一直在尝试为我的应用程序构建apk文件,但是,我收到错误:方法引用的数量不能超过64K.

这是错误,

错误:.dex文件中的方法引用数不能超过64K.请访问https://developer.android.com/tools/building/multidex.html,了解如何解决此问题

错误:任务':app:transformClassesWithDexForDebug'的执行失败.

com.android.build.api.transform.TransformException:com.android.ide.common.process.ProcessException:java.util.concurrent.ExecutionException:com.android.ide.common.process.ProcessException:org.gradle.process. internal.ExecException:进程'命令'C:\ Program Files\Java\jdk1.7.0_15\bin\java.exe''以非零退出值2结束

这是我的gradle文件,

apply plugin: 'com.android.application'

android {
compileSdkVersion 23
buildToolsVersion "23.0.3"

defaultConfig {
    applicationId "nikhilraghavendra.hopper"
    minSdkVersion 21
    targetSdkVersion 23
    versionCode 1
    versionName "1.0"
}
buildTypes {
    release {
        shrinkResources true
        minifyEnabled true
        useProguard true
        proguardFiles getDefaultProguardFile('proguard-android.txt'),
                'proguard-rules.pro'
    }
}
packagingOptions {
    exclude 'META-INF/LICENSE'
    exclude 'META-INF/LICENSE-FIREBASE.txt'
    exclude 'META-INF/NOTICE'
}
}

dependencies {
compile fileTree(dir: 'libs', include: ['*.jar'])
testCompile 'junit:junit:4.12'
compile 'com.android.support:appcompat-v7:23.2.1'
compile 'com.android.support:design:23.2.1'
compile 'com.google.android.gms:play-services-identity:8.4.0'
compile 'com.firebase:firebase-client-android:2.3.1'
compile 'com.android.support:cardview-v7:23.2.1'
compile 'com.google.android.gms:play-services:8.4.0'
} …
Run Code Online (Sandbox Code Playgroud)

android gradle apk

27
推荐指数
3
解决办法
5万
查看次数

使用NLTK生成双字母组

我试图生成一个给定句子的二元组列表,例如,如果我输入,

    To be or not to be
Run Code Online (Sandbox Code Playgroud)

我希望程序生成

     to be, be or, or not, not to, to be
Run Code Online (Sandbox Code Playgroud)

我尝试了以下代码,但只是给了我

<generator object bigrams at 0x0000000009231360>
Run Code Online (Sandbox Code Playgroud)

这是我的代码:

    import nltk
    bigrm = nltk.bigrams(text)
    print(bigrm)
Run Code Online (Sandbox Code Playgroud)

那我怎么得到我想要的?我想要一个上面的单词组合列表(be,be或be,not to,to).

python nltk n-gram

13
推荐指数
2
解决办法
3万
查看次数

EOFError:压缩文件在到达流结束标记之前结束-MNIST数据集

运行时出现以下错误mnist = input_data.read_data_sets("MNIST_data", one_hot = True)

EOFError:压缩文件在到达流结束标记之前结束

即使当我手动提取文件并将其放置在MNIST_data目录中时,该程序仍在尝试下载文件,而不是使用提取的文件。

当我使用WinZip(手动方式)提取文件时,WinZip告诉我文件已损坏。

我该如何解决这个问题?

我什至无法加载数据集,但仍然必须调试程序本身。请帮忙。

我点安装了Tensorflow,所以我没有Tensorflow示例。所以我去了GitHub获取input_data文件并保存在与我的目录相同的目录中main.py。该错误仅与.gz文件有关。该程序无法解压缩它。

runfile('C:/ Users / Nikhil / Desktop / Tensor Flow / tensf.py',wdir ='C:/ Users / Nikhil / Desktop / Tensor Flow')重新加载的模块:input_data提取MNIST_data / train-images-idx3-ubyte .gz C:\ Users \ Nikhil \ Anaconda3 \ lib \ gzip.py:274:VisibleDeprecationWarning:将ndim> 0的数组转换为索引将导致将来返回self._buffer.read(size)Traceback(最近通话):

运行文件中的文件“”,第1行('C:/ Users / Nikhil / Desktop / Tensor Flow / tensf.py',wdir ='C:/ Users / Nikhil / Desktop / Tensor Flow')

文件“ C:\ Users \ Nikhil \ …

python tensorflow

6
推荐指数
2
解决办法
2万
查看次数

预期的形状(无,8),但有阵形(8,1)

我有以下代码,

from keras.models import Sequential
from keras.layers import Dense
import numpy as np

# load dataset
dataset = np.loadtxt("data.csv", delimiter=",")
# split into input (X) and output (Y) variables
X = dataset[:, 0:8]
Y = dataset[:, 8]
# create model
model = Sequential()
model.add(Dense(8, activation="relu", input_dim=8, kernel_initializer="uniform"))
model.add(Dense(12, activation="relu", kernel_initializer="uniform"))
model.add(Dense(1, activation="sigmoid", kernel_initializer="uniform"))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# Fit the model
model.fit(X, Y, epochs=150, batch_size=10,  verbose=2)
# calculate predictions
test = np.array([6,148,72,35,0,33.6,0.627,50])
predictions = model.predict(test)
# round predictions …
Run Code Online (Sandbox Code Playgroud)

python keras

5
推荐指数
1
解决办法
4488
查看次数

无法在C ++中打印数组

我无法使以下代码正常工作。

#include <iostream>

using namespace std;

void neuron(double inputs[])
{
    for (int i = 0; i < sizeof(inputs); i++) {
        cout<<inputs[i];
    }
}

int main()
{
    double inputs[] = {10,12,12};
    neuron(inputs);
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

我想将数组传递给函数neuron,然后打印元素。我做不到。该代码给了我垃圾值。此代码有什么问题?

c++ arrays

0
推荐指数
1
解决办法
122
查看次数

将嵌套列表和普通列表组合到字典中

假设我有两个列表,其中一个是嵌套列表,另一个是普通列表,如何将它们组合成字典?

[[1, 3, 5], [4, 6, 9]] # Nested list

[45, 32] # Normal list

{(1, 3, 5): 45, (4, 6, 9): 32} # The dictionary
Run Code Online (Sandbox Code Playgroud)

我试过这个,但它给了我一个错误,

dictionary = dict(zip(l1, l2)))
print(dictionary)
Run Code Online (Sandbox Code Playgroud)

python dictionary list

0
推荐指数
1
解决办法
66
查看次数

标签 统计

python ×5

nltk ×2

android ×1

apk ×1

arrays ×1

c++ ×1

dictionary ×1

gradle ×1

keras ×1

list ×1

n-gram ×1

tensorflow ×1