我想修改scikit-lern实现的ROC曲线,所以我尝试了以下方法:
from sklearn.metrics import roc_curve, auc
false_positive_rate, recall, thresholds = roc_curve(y_test, prediction[:, 1])
roc_auc = auc(false_positive_rate, recall)
plt.title('Receiver Operating Characteristic')
plt.plot(false_positive_rate, recall, 'b', label='AUC = %0.2f' % roc_auc)
plt.legend(loc='lower right')
plt.plot([0, 1], [0, 1], 'r--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.0])
plt.ylabel('Recall')
plt.xlabel('Fall-out')
plt.show()
Run Code Online (Sandbox Code Playgroud)
这是输出:
Traceback (most recent call last):
File "/Users/user/script.py", line 62, in <module>
false_positive_rate, recall, thresholds = roc_curve(y_test, prediction[:, 1])
IndexError: too many indices for array
Run Code Online (Sandbox Code Playgroud)
然后从上一个问题我尝试了这个:
false_positive_rate, recall, thresholds = roc_curve(y_test, prediction)
Run Code Online (Sandbox Code Playgroud)
得到了这个追溯:
/usr/local/lib/python2.7/site-packages/sklearn/metrics/metrics.py:705: DeprecationWarning: elementwise …Run Code Online (Sandbox Code Playgroud) 我有两个这样的txt文件:txt1:
Foo
Foo
Foo
Foo
Run Code Online (Sandbox Code Playgroud)
TXT2:
Bar
Bar
Bar
Bar
Run Code Online (Sandbox Code Playgroud)
如何在左侧和右侧的新文件中连接它们,让我们这样说:
Bar Foo
Bar Foo
Bar Foo
Bar Foo
Run Code Online (Sandbox Code Playgroud)
我尝试了以下方法:
folder = ['/Users/user/Desktop/merge1.txt', '/Users/user/Desktop/merge2.txt']
with open('/Users/user/Desktop/merged.txt', 'w') as outfile:
for file in folder:
with open(file) as newfile:
for line in newfile:
outfile.write(line)
Run Code Online (Sandbox Code Playgroud) 我想创建一个接收两个路径的GUI(一个完整的.txt文件目录和从前面提到的文件夹的文件创建的新.csv文件的目标).
我在调用函数时遇到问题munge():
action = tk.Button(win, text="To .csv",command=munge(input_directory,output_directory))
Run Code Online (Sandbox Code Playgroud)
然而,这个例外提出了:
/usr/local/Cellar/python/2.7.10_2/Frameworks/Python.framework/Versions/2.7/bin/python2.7 /Users/user/PycharmProjects/script.py
Traceback (most recent call last):
File "/Users/user/PycharmProjects/script.py", line 82, in <module>
action = tk.Button(win, text="To .csv", command=munge(input_directory,output_directory))
File "/Users/user/PycharmProjects/script.py", line 39, in munge
test = tuple(retrive(directory))
File "/Users/user/PycharmProjects/script.py", line 31, in retrive
for filename in sorted(glob.glob(os.path.join(directory_path, '*.txt'))):
File "/usr/local/Cellar/python/2.7.10_2/Frameworks/Python.framework/Versions/2.7/lib/python2.7/posixpath.py", line 70, in join
elif path == '' or path.endswith('/'):
AttributeError: StringVar instance has no attribute 'endswith'
Process finished with exit code 1
Run Code Online (Sandbox Code Playgroud)
如何在Button小部件的帮助下正确调用上述功能?我试图设置变量的名称,如此处所示的问题,但它没有奏效.
更新
然后从这个问题的答案,我尝试了以下内容:
action …Run Code Online (Sandbox Code Playgroud) 如何以编程方式使用 google 文档以编程方式从 pdf 文件中提取文本?我都知道还有其他选择,但是,我很好奇是否可以将谷歌文档用于此类目的。
我如何用nltk snowballstemer来阻止以下列表中的所有西班牙语单词?这是我试过的:
# coding=utf-8
from sklearn.feature_extraction.text import CountVectorizer
import nltk.stem
vectorizer= CountVectorizer(min_df=1)
opinion = ["""
Hola compis!
No sabÌa como se ponÌa una lavadora hasta que conocÌ
esta y es que es muy sencilla de utilizar! Todo un gustazo
cuando estamos aprendiendo para emanciparnos, que si nos
ponen facilidad con las tareas de la casa pues mejor que mejor.
Antes de esta tenÌamos otra de la marca Otsein, de estas
que van incluidas en el mobiliario y adem·s era de …Run Code Online (Sandbox Code Playgroud) 我正在使用具有以下结构的大型dataframe列:
在:
df1 = pd.DataFrame({'A': [0,0,0,1,2,0,1,0,1,2,3,4,5,6,7]})
Run Code Online (Sandbox Code Playgroud)
日期:
A
0 0
1 0
2 0
3 1
4 2
5 0
6 1
7 0
8 1
9 2
10 3
11 4
12 5
13 6
14 7
Run Code Online (Sandbox Code Playgroud)
如您所见,A是一个从0到n的有序序列.这表示我的数据中的订单.例如:
A
2 0
3 1
4 2
5 0
Run Code Online (Sandbox Code Playgroud)
让我们取一块df1(从索引2到5),在列A中0代表开头,2代表序列的结尾.另一方面,如果没有连续数字(例如0),则表示该序列结束.因此,我的问题是如何有效地生成一个新列(例如id),该列符合以下数字顺序的唯一键或数字A:
A id
0 0 -> begin and ends 1
1 …Run Code Online (Sandbox Code Playgroud) python ×6
numpy ×2
python-2.7 ×2
file ×1
glob ×1
google-docs ×1
matplotlib ×1
nlp ×1
nltk ×1
pandas ×1
python-3.x ×1
scikit-learn ×1
string ×1
tkinter ×1