我正在使用libsvm做一个项目,我正在准备我的数据来使用lib.如何将CSV文件转换为LIBSVM兼容数据?
CSV文件:https: //github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/data/iris.csv
在频率问题中:
如何将其他数据格式转换为LIBSVM格式?
这取决于您的数据格式.一种简单的方法是在libsvm matlab/octave接口中使用libsvmwrite.以UCI机器学习库中的CSV(逗号分隔值)文件为例.我们下载SPECTF.train.标签位于第一列.以下步骤以libsvm格式生成文件.
matlab> SPECTF = csvread('SPECTF.train'); % read a csv file
matlab> labels = SPECTF(:, 1); % labels from the 1st column
matlab> features = SPECTF(:, 2:end);
matlab> features_sparse = sparse(features); % features must be in a sparse matrix
matlab> libsvmwrite('SPECTFlibsvm.train', labels, features_sparse);
The tranformed data are stored in SPECTFlibsvm.train.
Alternatively, you can use convert.c to convert CSV format to libsvm format.
Run Code Online (Sandbox Code Playgroud)
但我不想使用matlab,我使用python.
我也使用JAVA找到了这个解决方案
任何人都可以推荐一种解决这个问题的方法吗?
我正在尝试绘制直方图。
plt.bar([1,2,3], [4,5,6],color="r",align="center")
Run Code Online (Sandbox Code Playgroud)
我不想在轴的开头绘制零。这种荒谬的做法。
plt.yticks(range(len([1,2,3])),["None"]+[1,2,3])
Run Code Online (Sandbox Code Playgroud)
有什么好的方法可以做到这一点吗?
我试图通过提供一种不同的和手动的方式来计算平均值和标准,为这个问题编写解决方案.
a= ["Apple","Banana","Cherry","Apple"]
b= [3,4,7,3]
c= [5,4,1,4]
d= [7,8,3,7]
import pandas as pd
df = pd.DataFrame(index=range(4), columns=list("ABCD"))
df["A"]=a
df["B"]=b
df["C"]=c
df["D"]=d
Run Code Online (Sandbox Code Playgroud)
然后,我创建了一个没有重复的A列表.然后我通过每次项目分组并计算解决方案来完成这些项目.
import numpy as np
l= list(set(df.A))
df.groupby('A', as_index=False)
listMean=[0]*len(df.C)
listSTD=[0]*len(df.C)
for x in l:
s= np.mean(df[df['A']==x].C.values)
z= [index for index, item in enumerate(df['A'].values) if x==item ]
for i in z:
listMean[i]=s
for x in l:
s= np.std(df[df['A']==x].C.values)
z= [index for index, item in enumerate(df['A'].values) if x==item ]
for i in z:
listSTD[i]=s …Run Code Online (Sandbox Code Playgroud) 如何在热图中指定颜色.在此示例中,数据是4个值中唯一的一个{0,1,2,3}
Index= ['aaa', 'bbb', 'ccc', 'ddd', 'eee']
Cols = ['A', 'B', 'C', 'D']
data= [[ 0, 3, 1, 1],[ 0, 1, 1, 1],[ 0, 1, 2, 1],[ 0, 2, 1, 2],[ 0, 1, 1, 1]]
print data
df = pd.DataFrame(data, index=Index, columns=Cols)
heatmap = plt.pcolor(np.array(data))
plt.colorbar(heatmap)
plt.show()
Run Code Online (Sandbox Code Playgroud)
如何以表示颜色的方式指定这些颜色= {0:'green',1:'red',2:'black',3:'yellow'}
自学者在这里.
我正在构建一个预测事件的Web应用程序.
让我们考虑一下这个简单的例子.
X = [[0], [1], [2], [3]]
y = [0, 0, 1, 1]
from sklearn.neighbors import KNeighborsClassifier
neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(X, y)
print(neigh.predict([[1.1]]))
Run Code Online (Sandbox Code Playgroud)
neigh当我输入新值时,如何保持状态,就像neigh.predict([[1.2]])我不需要重新训练模型一样.有没有好的做法,或暗示开始解决问题?
有没有一种简单的方法来确定变量是列表,字典还是其他?基本上,我得到的对象可能是任何一种类型,我需要能够分辨出两者之间的区别。
在Python中,我们有“ Type()”,“ Typeof()”
scala> val c: String = "Hello world"
Run Code Online (Sandbox Code Playgroud)
有什么方法可以确定:Typeof(c)打印:字符串
我试图使用3D条形图绘制此数据集
B A freq
1 2003 2
1 2003 2
2 2008 1
2 2007 2
2 2007 2
3 2004 1
1 2004 3
1 2004 3
1 2004 3
Run Code Online (Sandbox Code Playgroud)
我在这里写了代码.
data = pandas.DataFrame({'A':[2003,2003,2008,2007,2007,2004,2004,2004,2004] , 'B': [1,1,2,2,2,3,1,1,1] ,'C': [2,2,1,2,2,1,3,3,3] })
fig = plt.figure()
ax = plt.axes(projection='3d')
# put 0s on the y-axis, and put the y axis on the z-axis
#ax.plot(data.A.values, data.B.values,data.freq.values, marker='o', linestyle='--', color="blue", label='ys=0, zdir=z')
xpos= range(len( data.A.values))
ypos= range(len( data.B.values))
zpos= range(len( data.freq.values))
ax.bar3d(xpos, ypos, zpos, …Run Code Online (Sandbox Code Playgroud) 有人可以使用javascript显示/隐藏跨度的方法吗
document.getElementById("test").style.display= 'visible';
document.getElementById("test").style.display= 'block';
Run Code Online (Sandbox Code Playgroud)
在HTML代码中
<span id='test' ..
Run Code Online (Sandbox Code Playgroud)
我该如何克服这个问题。有什么我应该考虑的吗?
更新 我有一个像这样的类,我想强迫鼠标悬停在它上面。
<div id="test" class="tooltip effect">
<div id="second" href="#"> .. </div>
Run Code Online (Sandbox Code Playgroud)
在CSS上:
tooltip{..}
effect{..}
effect:hover{..}
Run Code Online (Sandbox Code Playgroud)
除了您的代码,我尝试过的另一种选择是
document.getElementById("test").onmouseover = test.hover;
Run Code Online (Sandbox Code Playgroud)
我用这种方式安装了OpenCV
#After downloading OpenCV-3.0, in the directory:
echo "#define GTEST_USE_OWN_TR1_TUPLE 1" | cat > temp1
cat modules/ts/include/opencv2/ts/ts_gtest.h > temp2
cat temp1 temp2 > modules/ts/include/opencv2/ts/ts_gtest.h
mkdir build
cd build
cmake .. -Wno-dev
make -j8 && sudo make install
#Update your bash_profile:
~$ echo "export PYTHONPATH=/usr/local/lib/python2.7/site-packages/:$PYTHONPATH" >>
~/.bash_profile
#Close and open the Terminal
#Open python console and try to import cv2 to test if everything works
~$ python import cv2
Run Code Online (Sandbox Code Playgroud)
版本不稳定并且出错我想卸载它以避免在使用brew安装opencv时出现问题,我应该删除文件夹吗?
这就是我做的事情
cd build
make uninstall
-- Uninstalling "/usr/local/share/OpenCV/3rdparty/lib/libippicv.a"
CMake Error at …Run Code Online (Sandbox Code Playgroud) 我正在尝试制作列表的所有可能组合。喜欢:
l= [1,4,6,8,11,13]
combL = [ [1],[4],[6],[8],[11],[13],[1,4], .. ]
Run Code Online (Sandbox Code Playgroud)
我试着用
itertools.combinations(l, len(l))
Run Code Online (Sandbox Code Playgroud)
但它没有成功。Python 上的任何函数都可以做到这一点?
我有包含地点的geojson文件。始终“停放:0”。
'type': 'Feature',
'properties': {
...// Other fields
'latitude': -74.0121613846062,
'longitude': 40.7043040747924,
'parking': 0 }
Run Code Online (Sandbox Code Playgroud)
我想从另一个csv文件数据集更新它。
-------------------------------------------
latitude + Longitude + Possible_parking
-------------------------------------------
-74.012161 40.804 -1
Run Code Online (Sandbox Code Playgroud)
-1:无法停车
1:可能停车
我想更新geojson文件。
data = pd.read_csv("data/_all.csv")
geojson_in = open('data/input.json', 'r')
tracts_geojson = json.load(geojson_in)
geojson_in.close()
# For each record in the geojson file, add location information
for i, r in enumerate(tracts_geojson['features']):
for x in range(len(data.latitude.values)):
if ((r['properties']['latitude']==data["latitude"][x]) and (r['properties']['longitude']== data["longitude"][x])):
r['properties']['parking'] = str(data['Possible_parking'][x])
Run Code Online (Sandbox Code Playgroud)
我正在使用的脚本的问题是它花费了很长时间(现在+24小时)。我不想直接将csv文件转换为json,因为input.json包含我在CSV文件中找不到的其他信息。
有什么pythonic方法可以更快地做到这一点?
我想了解如何在Java中汇总项目列表的字段.
假设我有这段代码:
Person p1 = new Person("someone", 13, 1.55);
Person p2 = new Person("Jack", 14, 1.39);
Person p3 = new Person("John", 10, 1.39);
List<Person> personsList = Arrays.asList(p1, p2, p3);
Run Code Online (Sandbox Code Playgroud)
我试过sum这样,但它不起作用:
int sum = personsList.sum(p[2]);
Run Code Online (Sandbox Code Playgroud) python ×8
matplotlib ×3
pandas ×3
csv ×2
java ×2
algorithm ×1
heatmap ×1
javascript ×1
json ×1
libsvm ×1
macos ×1
opencv ×1
scala ×1
scikit-learn ×1