小编lst*_*tbl的帖子

re.finditer()为start和end方法返回相同的值

我在python中的re.finditer()方法遇到了一些麻烦.例如:

>>>sequence = 'atgaggagccccaagcttactcgatttaacgcccgcagcctcgccaaaccaccaaacacacca'
>>>[[m.start(),m.end()] for m in re.finditer(r'(?=gatttaacg)',sequence)]

out: [[22,22]]

Run Code Online (Sandbox Code Playgroud)

如您所见,start()和end()方法给出了相同的值.我之前注意到了这一点,并且最终使用了m.start()+len(query_sequence),而不是m.end(),但我很困惑为什么会发生这种情况.

python regex python-itertools

lst*_*tbl

lucky-day

6
推荐指数

1
解决办法

1205
查看次数

生成落在多边形内的经纬度坐标网格

我正在尝试将数据绘制到地图上。我想为特定城市的地图上的特定点生成数据（例如到一个或多个预先指定位置的运输时间）。

我在这里找到了纽约市的数据：https : //data.cityofnewyork.us/City-Government/Borough-Boundaries/tqmj-j8zm

看起来他们有一个可用的 shapefile。我想知道是否有一种方法可以在每个行政区的 shapefile 范围内对经纬度网格进行采样（可能使用 Shapely 包等）。

对不起，如果这是天真，我不是很熟悉处理这些文件——我这样做是作为一个有趣的项目来了解它们

python shapefile geo

lst*_*tbl

2020 02-28

3
推荐指数

1
解决办法

6105
查看次数

Python（scikit learn）lda 崩溃为单一维度

总的来说，我对 scikit learn 和机器学习非常陌生。

我目前正在设计一个 SVM 来预测特定的氨基酸序列是否会被蛋白酶切割。到目前为止，SVM 方法似乎运行得很好：

我想可视化两个类别（剪切和未剪切）之间的距离，因此我尝试使用线性判别分析，它类似于主成分分析，使用以下代码：

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
lda = LinearDiscriminantAnalysis(n_components=2)
targs = np.array([1 if _ else 0 for _ in XOR_list])
DATA = np.array(data_list)
X_r2 = lda.fit(DATA, targs).transform(DATA)
plt.figure()
for c, i, target_name in zip("rg", [1, 0],["Cleaved","Not Cleaved"]):
    plt.scatter(X_r2[targs == i], X_r2[targs == i], c=c, label=target_name)
plt.legend()
plt.title('LDA of cleavage_site dataset')

Run Code Online (Sandbox Code Playgroud)

然而，LDA 只给出一维结果

In: print X_r2[:5]
Out: [[ 6.74369996]
 [ 4.14254941]
 [ 5.19537896]
 [ 7.00884032]
 [ 3.54707676]]

Run Code Online (Sandbox Code Playgroud)

然而，PCA 分析将根据我输入的数据给出 2 个维度：

pca = PCA(n_components=2) …

Run Code Online (Sandbox Code Playgroud)

machine-learning scientific-computing scikit-learn

lst*_*tbl

2016 08-23

2
推荐指数

1
解决办法

3245
查看次数

标签统计

python ×2

geo ×1

machine-learning ×1

python-itertools ×1

regex ×1

scientific-computing ×1

scikit-learn ×1

shapefile ×1

re.finditer()为start和end方法返回相同的值

生成落在多边形内的经纬度坐标网格

Python（scikit learn）lda 崩溃为单一维度

标签 统计

小编lst_tbl的帖子

标签统计