小编Min*_*inu的帖子

Pickle ImportError：没有名为 builtin 的模块

__builtin__\r我正在尝试在 python3.6 中加载（复制的）pickle 对象，但这样做时出现导入错误。

with open('FilePath/FileName.pkl', "rb") as file:
    file = pickle.load(file)

Run Code Online (Sandbox Code Playgroud)

---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
<ipython-input-36-b39fbab9bab4> in <module>()
      1 with open('FilePath/FileName.pkl', "rb") as file:
----> 2     file = pickle.load(file)

ModuleNotFoundError: No module named '__builtin__\r'

Run Code Online (Sandbox Code Playgroud)

当我在 python 2.7 中尝试相同的操作时，我再次收到模块的导入错误__builtin__：

---------------------------------------------------------------------------

ImportError                               Traceback (most recent call last)
<ipython-input-3-12ac6524bf1a> in <module>()
      1 with open('FilePath/FileName.pkl', "rb") as file:
----> 2     file = pickle.load(file)

/Users/manasa.bulusu/anaconda2/lib/python2.7/pickle.pyc in load(file)
   1382 
   1383 def load(file):
-> 1384     return Unpickler(file).load()
   1385 
   1386 def …

Run Code Online (Sandbox Code Playgroud)

python module importerror

Min*_*inu

lucky-day

5
推荐指数

1
解决办法

5337
查看次数

如何将文件夹中的多个文本文件加载到python列表变量中

我有一个充满文本文档的文件夹，其中的文本需要加载到单个列表变量中。

列表的每个索引，都应该是每个文档的全文。

到目前为止，我有这段代码，但效果不佳。

dir = os.path.join(current_working_directory, 'FolderName')
file_list = glob.glob(dir + '/*.txt')
corpus = [] #-->my list variable
for file_path in file_list:
    text_file = open(file_path, 'r')
    corpus.append(text_file.readlines()) 
    text_file.close()

Run Code Online (Sandbox Code Playgroud)

有一个更好的方法吗？

编辑：read_csv用文本阅读功能 ( readlines())替换了 csv阅读功能 ( )。

python

Min*_*inu

2021 02-16

3
推荐指数

1
解决办法

2万
查看次数

将预测映射回 ID - Python Scikit Learn DecisionTreeClassifier

我有一个具有唯一标识符和其他功能的数据集。看起来像这样

ID      LenA TypeA LenB TypeB Diff Score Response
123-456  51   M     101  L     50   0.2   0
234-567  46   S     49   S     3    0.9   1
345-678  87   M     70   M     17   0.7   0

Run Code Online (Sandbox Code Playgroud)

我把它分成训练和测试数据。我试图从训练数据训练的分类器中将测试数据分为两类。我想要训练和测试数据集中的标识符，以便我可以将预测映射回 IDs。
有没有一种方法可以像我们在 Azure ML Studio 或 SAS 中所做的那样，将标识符列分配为 ID 或非预测变量？

我正在使用DecisionTreeClassifier来自 Scikit-Learn 的。这是我的分类器代码。

from sklearn import tree

clf = tree.DecisionTreeClassifier()
clf = clf.fit(traindata, trainlabels)

Run Code Online (Sandbox Code Playgroud)

如果我只是将 ID 包含到中traindata，则代码会引发错误：

ValueError: invalid literal for float(): 123-456

python classification decision-tree scikit-learn valueerror

Min*_*inu

lucky-day

3
推荐指数

1
解决办法

4698
查看次数

标签统计

python ×3

classification ×1

decision-tree ×1

importerror ×1

module ×1

scikit-learn ×1

valueerror ×1

Pickle ImportError：没有名为 __builtin__ 的模块

如何将文件夹中的多个文本文件加载到python列表变量中

将预测映射回 ID - Python Scikit Learn DecisionTreeClassifier

标签 统计

小编Min_inu的帖子

Pickle ImportError：没有名为 builtin 的模块

标签统计