我有一个熊猫数据帧.有一列,我们将其命名为:'col'此列的每个条目都是一个单词列表.['word1','word2'等]
如何使用nltk库有效地计算所有这些单词的引理?
import nltk
nltk.stem.WordNetLemmatizer().lemmatize('word')
Run Code Online (Sandbox Code Playgroud)
我希望能够在pandas数据集的一列中找到所有单元格的所有单词的引理.
我的数据类似于:
import pandas as pd
data = [[['walked','am','stressed','Fruit']],[['going','gone','walking','riding','running']]]
df = pd.DataFrame(data,columns=['col'])
Run Code Online (Sandbox Code Playgroud) 我有以下两个 numpy 数组:
a = array([400., 403., 406.]);
b = array([0.2,0.55,0.6]);
Run Code Online (Sandbox Code Playgroud)
现在我想创建一个字典,其中数组 a 作为键,b 作为相应的值:
dic = {
400: 0.2,
403: 0.55,
406: 0.6
}
Run Code Online (Sandbox Code Playgroud)
我怎么能做到这一点?
我试图制作一个" matplotlib蛋糕 ".;)
我有以下代码:它应该打印一个蓝色和一个红色矩形,除以绿色"涂层".
import matplotlib.pyplot as plt
def save_fig(layer):
# Hide the right and top spines
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
# Sacale axis
plt.axis('scaled')
fig.savefig(layer+'.pdf', dpi=fig.dpi)
fig.savefig(layer+'.jpeg', dpi=fig.dpi)
gap =10
fig, ax = plt.subplots()
rectangle_gap = plt.Rectangle((0-gap, 0), 500+2*gap, 100+gap, color ="green");
plt.gca().add_patch(rectangle_gap);
rectangle = plt.Rectangle((0, 0), 500, 100, color = "red");
plt.gca().add_patch(rectangle)
rectangle = plt.Rectangle((0, 100+gap), 500, 100, color = "blue");
plt.gca().add_patch(rectangle);
save_fig("test")
Run Code Online (Sandbox Code Playgroud)
正如您所看到的,输出正是我所期望的.好极了!但是,我玩了参数......
如果我将顶部蓝色矩形的宽度设置得很长,它会以某种方式进入绿色分隔涂层......
这是更改的代码(唯一改变的是顶部矩形的宽度,从500到5000):
gap =10
fig, ax = plt.subplots()
rectangle_gap = plt.Rectangle((0-gap, 0), 500+2*gap, 100+gap, color …
Run Code Online (Sandbox Code Playgroud) 我有大约30个SEM(扫描电子显微镜)图像:
你看到的是玻璃基板上的光刻胶柱.我想做的是获得x和y方向的平均直径以及x和y方向的平均周期.
现在,我不想手动进行所有测量,我想知道,如果有可能使用python和opencv自动化它?
编辑:我尝试了下面的代码,它似乎正在检测圆圈,但我真正需要的是椭圆,因为我需要x和y方向的直径.
......我还没看到如何获得规模呢?
import numpy as np
import cv2
from matplotlib import pyplot as plt
img = cv2.imread("01.jpg",0)
output = img.copy()
edged = cv2.Canny(img, 10, 300)
edged = cv2.dilate(edged, None, iterations=1)
edged = cv2.erode(edged, None, iterations=1)
# detect circles in the image
circles = cv2.HoughCircles(edged, cv2.HOUGH_GRADIENT, 1.2, 100)
# ensure at least some circles were found
if circles is not None:
# convert the (x, y) coordinates and radius of the circles …
Run Code Online (Sandbox Code Playgroud) 我有一个图片列表:
pictures = {im1,im2,im3,im4,im5,im6}
Run Code Online (Sandbox Code Playgroud)
在哪里
我想将图片分配给标签(1、2、3、4 等)
例如,这里的图片1到3属于标签1,图片4属于标签2,图片5属于标签3,图片6属于标签4。
-> label = {1,1,1,2,3,4}
由于我在标记图像时需要查看图像,因此我需要一种在标记图像时执行此操作的方法。我正在考虑创建一系列图像:
然后我通过单击属于相同标签的第一张和最后一张图片来定义范围,例如:
你怎么认为 ?这有可能吗?
我想为不同范围的图片分配不同的标签。
例如:当完成第一个标签的选择后,可以通过双击指示它 ,然后选择第二个标签范围,然后双击,然后选择第三个标签范围,然后双击,然后进行第四个标签范围的选择等。
不必通过双击来更改标签的选择,也可以只是按钮或您可能拥有的任何其他想法。
最后应该有标签列表。
如果我有一个使用 pylatex 设置的简单文档...
import pylatex as pl
geometry_options = {
"head": "1pt",
"margin": "0.2in",
"bottom": "0.2in",
"includeheadfoot": False}
doc = pl.Document(geometry_options=geometry_options)
doc.append("text")
Run Code Online (Sandbox Code Playgroud)
...如何在文本块后添加一定粗细的黑色水平分隔线?
我有一个 shapefile 数据集。有些道路(线)名称相同,但位置不同,互不相连。
这是我的 geopandas 数据文件中同名道路的图片:
如果距离高于阈值,我希望能够测量道路块(线串)之间的距离,以便能够重命名道路,这样每条道路都有自己唯一的名称。
因此,您知道如何找到线串之间的距离吗?
python ×6
image ×2
opencv ×2
pandas ×2
python-3.x ×2
dictionary ×1
geopandas ×1
interactive ×1
latex ×1
matplotlib ×1
pylatex ×1