__builtin__\r我正在尝试在 python3.6 中加载(复制的)pickle 对象,但这样做时出现导入错误。
with open('FilePath/FileName.pkl', "rb") as file:
file = pickle.load(file)
Run Code Online (Sandbox Code Playgroud)
Run Code Online (Sandbox Code Playgroud)--------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython-input-36-b39fbab9bab4> in <module>() 1 with open('FilePath/FileName.pkl', "rb") as file: ----> 2 file = pickle.load(file) ModuleNotFoundError: No module named '__builtin__\r'
当我在 python 2.7 中尝试相同的操作时,我再次收到模块的导入错误__builtin__:
Run Code Online (Sandbox Code Playgroud)--------------------------------------------------------------------------- ImportError Traceback (most recent call last) <ipython-input-3-12ac6524bf1a> in <module>() 1 with open('FilePath/FileName.pkl', "rb") as file: ----> 2 file = pickle.load(file) /Users/manasa.bulusu/anaconda2/lib/python2.7/pickle.pyc in load(file) 1382 1383 def load(file): -> 1384 return Unpickler(file).load() 1385 1386 def …
我有一个充满文本文档的文件夹,其中的文本需要加载到单个列表变量中。
列表的每个索引,都应该是每个文档的全文。
到目前为止,我有这段代码,但效果不佳。
dir = os.path.join(current_working_directory, 'FolderName')
file_list = glob.glob(dir + '/*.txt')
corpus = [] #-->my list variable
for file_path in file_list:
text_file = open(file_path, 'r')
corpus.append(text_file.readlines())
text_file.close()
Run Code Online (Sandbox Code Playgroud)
有一个更好的方法吗?
编辑:read_csv用文本阅读功能 ( readlines())替换了 csv阅读功能 ( )。
我有一个具有唯一标识符和其他功能的数据集。看起来像这样
Run Code Online (Sandbox Code Playgroud)ID LenA TypeA LenB TypeB Diff Score Response 123-456 51 M 101 L 50 0.2 0 234-567 46 S 49 S 3 0.9 1 345-678 87 M 70 M 17 0.7 0
我把它分成训练和测试数据。我试图从训练数据训练的分类器中将测试数据分为两类。我想要训练和测试数据集中的标识符,以便我可以将预测映射回 IDs。
有没有一种方法可以像我们在 Azure ML Studio 或 SAS 中所做的那样,将标识符列分配为 ID 或非预测变量?
我正在使用DecisionTreeClassifier来自 Scikit-Learn 的。这是我的分类器代码。
from sklearn import tree
clf = tree.DecisionTreeClassifier()
clf = clf.fit(traindata, trainlabels)
Run Code Online (Sandbox Code Playgroud)
如果我只是将 ID 包含到 中traindata,则代码会引发错误:
ValueError: invalid literal for float(): 123-456