小编use*_*649的帖子

使用python将CSV文件转换为LIBSVM兼容数据文件

我正在使用libsvm做一个项目,我正在准备我的数据来使用lib.如何将CSV文件转换为LIBSVM兼容数据？

CSV文件:https: //github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/data/iris.csv

在频率问题中:

如何将其他数据格式转换为LIBSVM格式？

这取决于您的数据格式.一种简单的方法是在libsvm matlab/octave接口中使用libsvmwrite.以UCI机器学习库中的CSV(逗号分隔值)文件为例.我们下载SPECTF.train.标签位于第一列.以下步骤以libsvm格式生成文件.

matlab> SPECTF = csvread('SPECTF.train'); % read a csv file
matlab> labels = SPECTF(:, 1); % labels from the 1st column
matlab> features = SPECTF(:, 2:end); 
matlab> features_sparse = sparse(features); % features must be in a sparse matrix
matlab> libsvmwrite('SPECTFlibsvm.train', labels, features_sparse);
The tranformed data are stored in SPECTFlibsvm.train.
Alternatively, you can use convert.c to convert CSV format to libsvm format.

Run Code Online (Sandbox Code Playgroud)

但我不想使用matlab,我使用python.

我也使用JAVA找到了这个解决方案

任何人都可以推荐一种解决这个问题的方法吗？

python java csv libsvm

use*_*649

2016 01-04

5
推荐指数

2
解决办法

1万
查看次数

我们如何隐藏轴 matplotlib 中的第一个零

我正在尝试绘制直方图。

plt.bar([1,2,3], [4,5,6],color="r",align="center")

Run Code Online (Sandbox Code Playgroud)

我不想在轴的开头绘制零。这种荒谬的做法。

plt.yticks(range(len([1,2,3])),["None"]+[1,2,3])

Run Code Online (Sandbox Code Playgroud)

有什么好的方法可以做到这一点吗？

python matplotlib

use*_*649

2014 12-17

4
推荐指数

1
解决办法

4312
查看次数

使用Groupby Pandas DataFrame手动计算STD

我试图通过提供一种不同的和手动的方式来计算平均值和标准,为这个问题编写解决方案.

我按照问题中的描述创建了数据框

a= ["Apple","Banana","Cherry","Apple"]
b= [3,4,7,3]
c= [5,4,1,4]
d= [7,8,3,7]

import pandas as pd
df =  pd.DataFrame(index=range(4), columns=list("ABCD"))

df["A"]=a
df["B"]=b
df["C"]=c
df["D"]=d

Run Code Online (Sandbox Code Playgroud)

然后,我创建了一个没有重复的A列表.然后我通过每次项目分组并计算解决方案来完成这些项目.

import numpy as np

l= list(set(df.A))

df.groupby('A', as_index=False)
listMean=[0]*len(df.C)
listSTD=[0]*len(df.C)

for x in l:
    s= np.mean(df[df['A']==x].C.values)
    z= [index for index, item in enumerate(df['A'].values) if x==item ]
    for i in z:
        listMean[i]=s

for x in l:
    s=  np.std(df[df['A']==x].C.values)
    z= [index for index, item in enumerate(df['A'].values) if x==item ]
    for i in z:
        listSTD[i]=s …

Run Code Online (Sandbox Code Playgroud)

python algorithm pandas

use*_*649

2017 05-23

2
推荐指数

1
解决办法

1227
查看次数

自定义matplotlib中的颜色 - 热图

如何在热图中指定颜色.在此示例中,数据是4个值中唯一的一个{0,1,2,3}

Index= ['aaa', 'bbb', 'ccc', 'ddd', 'eee']
Cols = ['A', 'B', 'C', 'D']

data= [[ 0, 3, 1, 1],[ 0, 1, 1, 1],[ 0, 1, 2, 1],[ 0, 2, 1, 2],[ 0, 1, 1, 1]]
print data
df = pd.DataFrame(data, index=Index, columns=Cols)
heatmap = plt.pcolor(np.array(data))
plt.colorbar(heatmap)
plt.show()

Run Code Online (Sandbox Code Playgroud)

如何以表示颜色的方式指定这些颜色= {0:'green',1:'red',2:'black',3:'yellow'}

python data-visualization matplotlib heatmap

use*_*649

2014 12-20

2
推荐指数

1
解决办法

4097
查看次数

如何避免重新训练机器学习模型

自学者在这里.

我正在构建一个预测事件的Web应用程序.

让我们考虑一下这个简单的例子.

X = [[0], [1], [2], [3]]
y = [0, 0, 1, 1]
from sklearn.neighbors import KNeighborsClassifier
neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(X, y) 

print(neigh.predict([[1.1]]))

Run Code Online (Sandbox Code Playgroud)

neigh当我输入新值时,如何保持状态,就像neigh.predict([[1.2]])我不需要重新训练模型一样.有没有好的做法,或暗示开始解决问题？

python machine-learning scikit-learn

use*_*649

lucky-day

2
推荐指数

2
解决办法

1258
查看次数

检查Scala变量类型的最佳方法是什么？

有没有一种简单的方法来确定变量是列表，字典还是其他？基本上，我得到的对象可能是任何一种类型，我需要能够分辨出两者之间的区别。

在Python中，我们有“ Type（）”，“ Typeof（）”

scala> val c: String = "Hello world"

Run Code Online (Sandbox Code Playgroud)

有什么方法可以确定：Typeof（c）打印：字符串

scala

use*_*649

lucky-day

1
推荐指数

1
解决办法

2662
查看次数

如何在3D hist python/matplotlib中自定义轴

我试图使用3D条形图绘制此数据集

  B    A   freq
  1  2003     2
  1  2003     2
  2  2008     1
  2  2007     2
  2  2007     2
  3  2004     1
  1  2004     3
  1  2004     3
  1  2004     3

Run Code Online (Sandbox Code Playgroud)

我在这里写了代码.

  data = pandas.DataFrame({'A':[2003,2003,2008,2007,2007,2004,2004,2004,2004] , 'B': [1,1,2,2,2,3,1,1,1] ,'C': [2,2,1,2,2,1,3,3,3] })
        fig = plt.figure()
        ax = plt.axes(projection='3d')
        # put 0s on the y-axis, and put the y axis on the z-axis

        #ax.plot(data.A.values, data.B.values,data.freq.values, marker='o', linestyle='--', color="blue", label='ys=0, zdir=z')
        xpos= range(len( data.A.values))
        ypos= range(len( data.B.values))
        zpos= range(len( data.freq.values))

        ax.bar3d(xpos, ypos, zpos, …

Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

use*_*649

2014 04-12

1
推荐指数

1
解决办法

1584
查看次数

如何使用JavaScript显示/隐藏范围

有人可以使用javascript显示/隐藏跨度的方法吗

 document.getElementById("test").style.display= 'visible';
 document.getElementById("test").style.display= 'block';

Run Code Online (Sandbox Code Playgroud)

在HTML代码中

<span id='test' ..

Run Code Online (Sandbox Code Playgroud)

我该如何克服这个问题。有什么我应该考虑的吗？

更新我有一个像这样的类，我想强迫鼠标悬停在它上面。

<div id="test" class="tooltip effect">
        <div id="second" href="#"> .. </div>

Run Code Online (Sandbox Code Playgroud)

在CSS上：

tooltip{..}
effect{..}
effect:hover{..}

Run Code Online (Sandbox Code Playgroud)

除了您的代码，我尝试过的另一种选择是

document.getElementById("test").onmouseover = test.hover;

Run Code Online (Sandbox Code Playgroud)

我应该将悬浮类重写为另一个名称类，还是应该调整代码？

javascript

use*_*649

2018 05-31

1
推荐指数

1
解决办法

1万
查看次数

如何在mac中卸载OpenCV

我用这种方式安装了OpenCV

#After downloading OpenCV-3.0, in the directory:
echo "#define GTEST_USE_OWN_TR1_TUPLE 1" | cat > temp1
cat modules/ts/include/opencv2/ts/ts_gtest.h > temp2
cat temp1 temp2 > modules/ts/include/opencv2/ts/ts_gtest.h
mkdir build
cd build
cmake .. -Wno-dev
make -j8 && sudo make install
#Update your bash_profile:
~$ echo "export PYTHONPATH=/usr/local/lib/python2.7/site-packages/:$PYTHONPATH" >>
~/.bash_profile
#Close and open the Terminal
#Open python console and try to import cv2 to test if everything works
~$ python import cv2

Run Code Online (Sandbox Code Playgroud)

版本不稳定并且出错我想卸载它以避免在使用brew安装opencv时出现问题,我应该删除文件夹吗？

这就是我做的事情

cd build
 make uninstall
-- Uninstalling "/usr/local/share/OpenCV/3rdparty/lib/libippicv.a"
CMake Error at …

Run Code Online (Sandbox Code Playgroud)

macos opencv

use*_*649

2015 02-15

1
推荐指数

2
解决办法

2万
查看次数

使列表元素的所有可能组合 - 使用 python

我正在尝试制作列表的所有可能组合。喜欢：

l= [1,4,6,8,11,13]

combL = [ [1],[4],[6],[8],[11],[13],[1,4], ..  ]

Run Code Online (Sandbox Code Playgroud)

我试着用

itertools.combinations(l, len(l))

Run Code Online (Sandbox Code Playgroud)

但它没有成功。Python 上的任何函数都可以做到这一点？

python

use*_*649

2014 03-18

0
推荐指数

1
解决办法

192
查看次数

如何以快速方式使用Python向json添加信息

我有包含地点的geojson文件。始终“停放：0”。

'type': 'Feature', 
'properties': {
 ...// Other fields
'latitude': -74.0121613846062,
'longitude': 40.7043040747924,
'parking': 0 }

Run Code Online (Sandbox Code Playgroud)

我想从另一个csv文件数据集更新它。

-------------------------------------------
 latitude    + Longitude + Possible_parking 
-------------------------------------------
-74.012161      40.804        -1

Run Code Online (Sandbox Code Playgroud)

-1：无法停车

1：可能停车

我想更新geojson文件。

data = pd.read_csv("data/_all.csv")

geojson_in = open('data/input.json', 'r')
tracts_geojson = json.load(geojson_in)
geojson_in.close()


# For each record in the geojson file, add location information
for i, r in enumerate(tracts_geojson['features']):
    for x in range(len(data.latitude.values)):
        if ((r['properties']['latitude']==data["latitude"][x]) and (r['properties']['longitude']== data["longitude"][x])):
            r['properties']['parking'] = str(data['Possible_parking'][x])

Run Code Online (Sandbox Code Playgroud)

我正在使用的脚本的问题是它花费了很长时间（现在+24小时）。我不想直接将csv文件转换为json，因为input.json包含我在CSV文件中找不到的其他信息。

有什么pythonic方法可以更快地做到这一点？

python csv json pandas

use*_*649

lucky-day

0
推荐指数

1
解决办法

83
查看次数

用Java汇总列表的字段

我想了解如何在Java中汇总项目列表的字段.

假设我有这段代码:

Person p1 = new Person("someone", 13, 1.55);
Person p2 = new Person("Jack", 14, 1.39);
Person p3 = new Person("John", 10, 1.39);

List<Person> personsList = Arrays.asList(p1, p2, p3);

Run Code Online (Sandbox Code Playgroud)

我试过sum这样,但它不起作用: