小编rya*_*lon的帖子

没有二进制文件的gitignore

如何在git使用该.gitignore文件时忽略二进制文件?

例:

$ g++ hello.c -o hello
Run Code Online (Sandbox Code Playgroud)

"hello"文件是二进制文件.可以git忽略这个文件吗?

git gitignore

131
推荐指数
11
解决办法
6万
查看次数

从Python形状多边形中提取点/坐标

如何获取/提取定义shapely多边形的点?谢谢!

形状多边形的示例

from shapely.geometry import Polygon

# Create polygon from lists of points
x = [list of x vals]
y = [list of y vals]

polygon = Polygon(x,y)
Run Code Online (Sandbox Code Playgroud)

python polygon shapely

49
推荐指数
5
解决办法
5万
查看次数

使用NumPy的loadtxt()和genfromtxt的'dtype'有哪些可用的数据类型?

有哪些可用的numpy.loadtxtnumpy.genfromtxt用于导入具有不同数据类型的表数据,有哪些可用的缩写(例如i32表示整数)?

这篇文章演示了条件的使用,如果有人可能会详细说明,我很好奇.

python numpy

42
推荐指数
2
解决办法
7万
查看次数

使用pandas.DataFrame.to_csv()按列输出不同的精度?

是否可以为Python pandas包方法pandas.DataFrame.to_csv打印的每个列专门指定一个浮点精度?

背景

如果我有一个pandas如下排列的数据框:

In [53]: df_data[:5]
Out[53]: 
    year  month  day       lats       lons  vals
0   2012      6   16  81.862745 -29.834254   0.0
1   2012      6   16  81.862745 -29.502762   0.1
2   2012      6   16  81.862745 -29.171271   0.0
3   2012      6   16  81.862745 -28.839779   0.2
4   2012      6   16  81.862745 -28.508287   0.0
Run Code Online (Sandbox Code Playgroud)

有一个float_format选项可用于指定精度,但这会在打印时将该精度应用于数据框的所有列.

当我这样使用时:

df_data.to_csv(outfile, index=False,
                   header=False, float_format='%11.6f')
Run Code Online (Sandbox Code Playgroud)

我得到以下内容,其中vals给出了不准确的精度:

2012,6,16,  81.862745, -29.834254,   0.000000
2012,6,16,  81.862745, -29.502762,   0.100000
2012,6,16,  81.862745, -29.171270,   0.000000
2012,6,16,  81.862745, …
Run Code Online (Sandbox Code Playgroud)

python csv floating-point numpy pandas

30
推荐指数
4
解决办法
3万
查看次数

机器学习中的参数,特征和类之间的差异

我是机器学习和自然语言处理的新手.

我总是在这三个术语之间感到困惑?

根据我的理解:

class:我们的模型输出的各种类别.鉴于人的姓名,确定他/她是男性还是女性?

让我们说我正在使用朴素贝叶斯分类器.

我的功能和参数是什么?

此外,上述单词的一些别名可以互换使用.

谢谢

terminology machine-learning

18
推荐指数
3
解决办法
1万
查看次数

从三个1D numpy数组中填充2D numpy数组

有产生从无序坐标点的值的2D阵列(即,不是所有LONS和/或拉特被升序或降序),而不使用循环的有效方式?

示例数据

lats = np.array([45.5,45.5,45.5,65.3,65.3,65.3,43.2,43.2,43.2,65.3])
lons = np.array([102.5,5.5,116.2,102.5,5.5,116.2,102.5,5.5,116.2,100])
vals = np.array([3,4,5,6,7,7,9,1,0,4])
Run Code Online (Sandbox Code Playgroud)

示例输出
每列代表一个唯一的经度(102.5,5.5,116.2和100),每列代表一个唯一的纬度(45.5,65.3,&43.2).

([ 3, 4, 5, NaN],
 [ 6, 7, 7, 4],
 [ 9, 1, 0, NaN])
Run Code Online (Sandbox Code Playgroud)

虽然,它不是那么直接,因为我不一定知道每个lon或lat有多少重复确定阵列的形状.

更新:
我的问题数据排列不正确.我现在已经安排好了,所以它们都是唯一的对,还有一个额外的数据点来演示当NaN存在时如何安排数据.

python numpy

8
推荐指数
1
解决办法
2966
查看次数

如何在Windows中退出阻塞的accept()调用?

accept()在一个等待连接请求的线程中有一个阻塞调用.当应用程序即将关闭时,我想发信号正在等待accept()正常退出的线程.我在Winsock的文档中发现我可以为send()和设置超时值recv(),但我不能这样做accept().

我已经读过我可以使套接字无阻塞并使用select(),并传递超时值select(),但我正在寻找阻塞套接字的解决方案.

c sockets winapi winsock

7
推荐指数
1
解决办法
868
查看次数

如何使用Fortran语句标签?

我正在研究用Fortran 95编写的模型,我完全不熟悉它.声明标签的概念似乎很奇怪,和我到目前为止只找到了解释,该标签可以由作者来任意决定,一般按10递增.

这些标签是否有任何实际用途,除了在声明结束时更容易选择?和一个普遍接受的标签如何标签.

standards fortran coding-style fortran77 conditional-statements

6
推荐指数
1
解决办法
4364
查看次数

切片pandas DataFrame,其中列的值存在于另一个数组中

我有pandas.DataFrame大量的数据.在一列中随机重复键.在另一个数组中,我有一个theys键的列表,我想从中切割出DataFrame来自其行中其他列的数据.

钥匙:

keys = numpy.array([1,5,7])
Run Code Online (Sandbox Code Playgroud)

数据:

 indx   a      b     c   d
    0   5   25.0  42.1  13
    1   2   31.7  13.2   1
    2   9   16.5   0.2   9
    3   7   43.1  11.0  10
    4   1   11.2  31.6  10
    5   5   15.6   2.8  11
    6   7   14.2  19.0   4
Run Code Online (Sandbox Code Playgroud)

DataFrame如果列a中的值与来自的值匹配,我想切片所有行keys.

期望的结果:

 indx   a      b     c   d
    0   5   25.0  42.1  13
    3   7   43.1  11.0  10
    4   1   11.2  31.6  10 …
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

6
推荐指数
1
解决办法
2796
查看次数

用 Python 计算 3D 多面体的体积?

我试图找出用 Python 计算 3D 多面体体积的最佳方法,我希望有一个简单的解决方案,但我似乎找不到。

示例多面体 示例多面体

我确实发现这篇文章描述了计算 3D 空间中平面多边形的面积,但这似乎没有帮助。

python spatial

5
推荐指数
1
解决办法
5225
查看次数