小编Moo*_*dra的帖子

尽管添加了PATH,但似乎无法从命令行运行tesseract

我正在尝试添加tesseract以能够安装pytesseract。我使用Windows 7。

我将此路径添加到PATH环境变量中 C:\Program Files (x86)\Tesseract-OCR\tesseract.exe

从命令行(如果我运行)

tesseract DMTX_screenshot.png out 要么 tesseract

我越来越

tesseract is not recognized as an internal or external command.

这是我的环境变量一部分的复制粘贴:

C:\Program Files (x86)\Tesseract-OCR\tesseract.exe;C:\Users\Moondra\Anaconda_related\Anaconda\geckodriver.exe;

关于我可能做错了什么的任何想法?

谢谢。

windows tesseract python-3.x

5
推荐指数
3
解决办法
2万
查看次数

增加 Jupyter notebook 中某些单元格/一个 notebook 的字体大小

我想增加字体大小并为我在 Jupyter 笔记本中输出的文本添加粗体。但是,我只想更改该特定笔记本或该特定单元格的设置。(欢迎两种解决方案)

我看到大多数线程显示如何配置我假设是全局更改的 .css 文件?

如何更改 ipython 笔记本中的字体

但是我想要一个单元一个单元的控制或者只是那个特定的笔记本。

作为一个示例,我的单元格输出如下:

Killing C.I.A. Informants, China Crippled U.S. Spying https://www.nytimes.com/2017/05/20/world/asia/china-cia-spies-espionage.html

我想让第一句话(标题)加粗。

谢谢你。

编辑:尝试在此循环中使用降价方法。

for i in today_links:
    if i[0] == '':
        del (i)
    else:
        Markdown('**{}**  \n{}'.format(i[0], i[1]))
Run Code Online (Sandbox Code Playgroud)

today_links 是元组列表

[('Killing C.I.A. Informants, China Crippled U.S. Spying',
  'https://www.nytimes.com/2017/05/20/world/asia/china-cia-spies-espionage.html'),
 ('How Rollbacks at Pruitt’s E.P.A. Are a Boon to Oil and Gas',
  'https://www.nytimes.com/2017/05/20/business/energy-environment/devon-energy.html'),
Run Code Online (Sandbox Code Playgroud)

不知道为什么它在循环中不起作用。

谢谢你。

python-3.x jupyter-notebook

5
推荐指数
1
解决办法
1万
查看次数

Python虚拟机(CPython)是否将字节码转换为机器语言?

对于PVM如何获取CPU执行字节码指令,我有些困惑。我在StackOverflow上的某个地方读过,它没有将字节码转换为机器码,(可惜,我现在找不到线程)。

它是否已经对大量的预编译机器指令进行了硬编码,以根据字节码运行/选择其中之一?

谢谢。

python

5
推荐指数
2
解决办法
868
查看次数

使用re.sub和多次替换仅替换捕获的组

下面只是我创建的一个简单示例。

string = 'I love sleeping. I love singing. I love dancing.'
pattern =re.compile(r'I love (\w+)\.')
Run Code Online (Sandbox Code Playgroud)

我只想用re.sub替换(\ w +)部分。
这个问题分为两个部分:

我想替换(\ w +),而不必借助组来捕获其余文本。

所以我不想做这样的事情:

pattern =re.compile(r'(I) (love) (\w+)\.')
re.sub(pattern, r'/1 /2 swimming', string)
Run Code Online (Sandbox Code Playgroud)

因为这在处理大量文本和可选组时可能不可靠。

第二部分:

由于我将有3个匹配项,因此是否可以使用re.sub馈入列表,该列表将为每个匹配项在列表中进行迭代,并相应地生成sub。换句话说,我希望列表中的每个项目都['Swimming, Eating, Jogging']与匹配项(例如zip方法)同步并进行替换。

因此输出应该是这样的(即使单个总输出也可以:

'I love Swimming'
'I love Eating'
'I love Jogging'
Run Code Online (Sandbox Code Playgroud)

python regex

5
推荐指数
1
解决办法
1259
查看次数

Seaborn的histrogram bin宽度没有扩展到bin标签

这是我上一个问题的另一个问题.我通过以下代码使用facetgrid打印直方图.

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt

titanic = sns.load_dataset("titanic")
g= sns.FacetGrid(titanic, col ='survived', size = 3, aspect = 2)
g.map(plt.hist, 'age', color = 'r'), plt.show()
plt.show()
Run Code Online (Sandbox Code Playgroud)

我让seaborn决定垃圾箱标签/值,这就是我想出的

在此输入图像描述

我注意到条形本身并没有一直延伸到标签.所以0-10标签中的第一个条似乎延伸到大约8,而不是完全延伸到10.做一个快速value_count(除非我弄错了),表明第一个条实际上只包括出现到8岁.

然后,我尝试通过此代码更改要包含的容器数量:

g.map(plt.hist, 'age', bins =8, color = 'r'), plt.show()
Run Code Online (Sandbox Code Playgroud)

但左边的图表仍然没有看到. 在此输入图像描述

python matplotlib histogram seaborn

4
推荐指数
1
解决办法
2506
查看次数

numpy从三个元素中获取not min或max元素

我有一个三维数组:

 y = np.random.randint(1,5 ,(50,50,3))
Run Code Online (Sandbox Code Playgroud)

我想计算第三个轴上的最大值和最小值(3个元素),然后除以剩余的数字/元素.

所以像这样:

x = (np.max(y, axis =2) - 2*np.min(y, axis =2))/the third number
Run Code Online (Sandbox Code Playgroud)

我不知道如何获得第三个数字.需要注意的是,第三个数字有可能等于最小值或最大值:

例如(5,5,1)

python numpy

4
推荐指数
2
解决办法
87
查看次数

在 Google Cloud Platform 中为 Keras ML 训练读取存储在桶中的数据的理想方法?

这是我第一次尝试在云中训练模型,我正在努力解决所有的小问题。我将训练数据存储在谷歌云平台内的存储桶中 gs://test/train ,数据集大约为 100k。目前,数据根据其标签分布在不同的文件夹中。

我不知道访问数据的理想方式。通常在Keras我使用,ImageDataGeneratorflow_from_directory它自动创建一个发电机,我可以喂到我的模型。

谷歌云平台是否有诸如 Python 之类的函数?

如果不是,通过生成器访问数据的理想方式是什么,以便我可以将其提供给 Keras model.fit_generator

谢谢你。

python google-cloud-platform keras tensorflow

4
推荐指数
1
解决办法
1950
查看次数

如何使用Python访问存储区GCS子文件夹中的文件?

from google.cloud import storage
import os
bucket = client.get_bucket('path to bucket')
Run Code Online (Sandbox Code Playgroud)

上面的代码将我连接到存储桶,但是我正在努力连接存储桶中的特定文件夹。

我正在尝试此代码的变体,但没有运气:

blob = bucket.get_blob("training/bad")
blob = bucket.get_blob("/training/bad")
blob = bucket.get_blob("path to bucket/training/bad")
Run Code Online (Sandbox Code Playgroud)

我希望能够访问不良子文件夹中的图像列表,但似乎无法这样做。尽管阅读了文档,但我什至不完全了解blob是什么,并且根据教程对其进行了介绍。

谢谢。

python-3.x google-cloud-storage google-cloud-platform

4
推荐指数
2
解决办法
1020
查看次数

X 轴未与条形图中的条正确对齐(seaborn)

我的图表最终看起来像这样:

在此输入图像描述

我获取了原始的泰坦尼克号数据集并分割了一些列,并通过以下代码创建了一个新的数据框。

Cabin_group = titanic[['Fare', 'Cabin', 'Survived']] #selecting certain columns from dataframe
Cabin_group.Cabin = Cabin_group.Cabin.str[0] #cleaning the Cabin column
Cabin_group = Cabin_group.groupby('Cabin', as_index =False).Survived.mean()
Cabin_group.drop([6,7], inplace = True) #drop Cabin G and T as instances are too low
Cabin_group['Status']= ('Poor', 'Rich', 'Rich', 'Medium', 'Medium', 'Poor') #giving each Cabin a status value.
Run Code Online (Sandbox Code Playgroud)

所以我的新数据框“Cabin_group”最终看起来像这样:

  Cabin  Survived  Status
0     A  0.454545    Poor
1     B  0.676923    Rich
2     C  0.574468    Rich
3     D  0.652174  Medium
4     E  0.682927  Medium
5     F  0.523810    Poor
Run Code Online (Sandbox Code Playgroud)

这是我尝试绘制数据框的方法 …

matplotlib pandas seaborn

3
推荐指数
1
解决办法
6709
查看次数

将每个批次或每个时期的验证准确性输出到控制台(Keras)

我正在使用ImageDataGeneratorflow_from_directory生成我的数据,并使用model.fit_generator来拟合数据。

默认情况下,仅输出训练数据集的准确性。似乎没有选择将验证准确性输出到终端。

这是我的代码的相关部分:

#train data generator


print('Starting Preprocessing')

train_datagen = ImageDataGenerator(preprocessing_function = preprocess)

train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size = (img_height, img_width),
batch_size = batch_size, 
class_mode = 'categorical')  #class_mode = 'categorical'


#same for validation
val_datagen = ImageDataGenerator(preprocessing_function = preprocess)

validation_generator = val_datagen.flow_from_directory(
        validation_data_dir,
        target_size = (img_height, img_width),
        batch_size=batch_size,
        class_mode='categorical')





########################Model Creation###################################

#create the base pre-trained model
print('Finished Preprocessing, starting model creating \n')
base_model = InceptionV3(weights='imagenet', include_top=False)
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, …
Run Code Online (Sandbox Code Playgroud)

python neural-network deep-learning keras

3
推荐指数
2
解决办法
6591
查看次数