小编Moo*_*dra的帖子

尽管添加了PATH，但似乎无法从命令行运行tesseract

我正在尝试添加tesseract以能够安装pytesseract。我使用Windows 7。

我将此路径添加到PATH环境变量中 C:\Program Files (x86)\Tesseract-OCR\tesseract.exe

从命令行（如果我运行）

tesseract DMTX_screenshot.png out 要么 tesseract

我越来越

tesseract is not recognized as an internal or external command.

这是我的环境变量一部分的复制粘贴：

C:\Program Files (x86)\Tesseract-OCR\tesseract.exe;C:\Users\Moondra\Anaconda_related\Anaconda\geckodriver.exe;

关于我可能做错了什么的任何想法？

谢谢。

windows tesseract python-3.x

Moo*_*dra

lucky-day

5
推荐指数

3
解决办法

2万
查看次数

增加 Jupyter notebook 中某些单元格/一个 notebook 的字体大小

我想增加字体大小并为我在 Jupyter 笔记本中输出的文本添加粗体。但是，我只想更改该特定笔记本或该特定单元格的设置。（欢迎两种解决方案）

我看到大多数线程显示如何配置我假设是全局更改的 .css 文件？

如何更改 ipython 笔记本中的字体

但是我想要一个单元一个单元的控制或者只是那个特定的笔记本。

作为一个示例，我的单元格输出如下：

Killing C.I.A. Informants, China Crippled U.S. Spying https://www.nytimes.com/2017/05/20/world/asia/china-cia-spies-espionage.html

我想让第一句话（标题）加粗。

谢谢你。

编辑：尝试在此循环中使用降价方法。

for i in today_links:
    if i[0] == '':
        del (i)
    else:
        Markdown('**{}**  \n{}'.format(i[0], i[1]))

Run Code Online (Sandbox Code Playgroud)

today_links 是元组列表

[('Killing C.I.A. Informants, China Crippled U.S. Spying',
  'https://www.nytimes.com/2017/05/20/world/asia/china-cia-spies-espionage.html'),
 ('How Rollbacks at Pruitt’s E.P.A. Are a Boon to Oil and Gas',
  'https://www.nytimes.com/2017/05/20/business/energy-environment/devon-energy.html'),

Run Code Online (Sandbox Code Playgroud)

不知道为什么它在循环中不起作用。

谢谢你。

python-3.x jupyter-notebook

Moo*_*dra

2017 05-23

5
推荐指数

1
解决办法

1万
查看次数

Python虚拟机（CPython）是否将字节码转换为机器语言？

对于PVM如何获取CPU执行字节码指令，我有些困惑。我在StackOverflow上的某个地方读过，它没有将字节码转换为机器码，（可惜，我现在找不到线程）。

它是否已经对大量的预编译机器指令进行了硬编码，以根据字节码运行/选择其中之一？

谢谢。

python

Moo*_*dra

lucky-day

5
推荐指数

2
解决办法

868
查看次数

使用re.sub和多次替换仅替换捕获的组

下面只是我创建的一个简单示例。

string = 'I love sleeping. I love singing. I love dancing.'
pattern =re.compile(r'I love (\w+)\.')

Run Code Online (Sandbox Code Playgroud)

我只想用re.sub替换（\ w +）部分。
这个问题分为两个部分：

我想替换（\ w +），而不必借助组来捕获其余文本。

所以我不想做这样的事情：

pattern =re.compile(r'(I) (love) (\w+)\.')
re.sub(pattern, r'/1 /2 swimming', string)

Run Code Online (Sandbox Code Playgroud)

因为这在处理大量文本和可选组时可能不可靠。

第二部分：

由于我将有3个匹配项，因此是否可以使用re.sub馈入列表，该列表将为每个匹配项在列表中进行迭代，并相应地生成sub。换句话说，我希望列表中的每个项目都['Swimming, Eating, Jogging']与匹配项（例如zip方法）同步并进行替换。

因此输出应该是这样的（即使单个总输出也可以：

'I love Swimming'
'I love Eating'
'I love Jogging'

Run Code Online (Sandbox Code Playgroud)

python regex

Moo*_*dra

lucky-day

5
推荐指数

1
解决办法

1259
查看次数

Seaborn的histrogram bin宽度没有扩展到bin标签

这是我上一个问题的另一个问题.我通过以下代码使用facetgrid打印直方图.

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt

titanic = sns.load_dataset("titanic")
g= sns.FacetGrid(titanic, col ='survived', size = 3, aspect = 2)
g.map(plt.hist, 'age', color = 'r'), plt.show()
plt.show()

Run Code Online (Sandbox Code Playgroud)

我让seaborn决定垃圾箱标签/值,这就是我想出的

我注意到条形本身并没有一直延伸到标签.所以0-10标签中的第一个条似乎延伸到大约8,而不是完全延伸到10.做一个快速value_count(除非我弄错了),表明第一个条实际上只包括出现到8岁.

然后,我尝试通过此代码更改要包含的容器数量:

g.map(plt.hist, 'age', bins =8, color = 'r'), plt.show()

Run Code Online (Sandbox Code Playgroud)

但左边的图表仍然没有看到.

python matplotlib histogram seaborn

Moo*_*dra

2016 11-08

4
推荐指数

1
解决办法

2506
查看次数

numpy从三个元素中获取not min或max元素

我有一个三维数组:

 y = np.random.randint(1,5 ,(50,50,3))

Run Code Online (Sandbox Code Playgroud)

我想计算第三个轴上的最大值和最小值(3个元素),然后除以剩余的数字/元素.

所以像这样:

x = (np.max(y, axis =2) - 2*np.min(y, axis =2))/the third number

Run Code Online (Sandbox Code Playgroud)

我不知道如何获得第三个数字.需要注意的是,第三个数字有可能等于最小值或最大值:

例如(5,5,1)

python numpy

Moo*_*dra

lucky-day

4
推荐指数

2
解决办法

87
查看次数

在 Google Cloud Platform 中为 Keras ML 训练读取存储在桶中的数据的理想方法？

这是我第一次尝试在云中训练模型，我正在努力解决所有的小问题。我将训练数据存储在谷歌云平台内的存储桶中 gs://test/train ，数据集大约为 100k。目前，数据根据其标签分布在不同的文件夹中。

我不知道访问数据的理想方式。通常在Keras我使用，ImageDataGenerator用flow_from_directory它自动创建一个发电机，我可以喂到我的模型。

谷歌云平台是否有诸如 Python 之类的函数？

如果不是，通过生成器访问数据的理想方式是什么，以便我可以将其提供给 Keras model.fit_generator

谢谢你。

python google-cloud-platform keras tensorflow

Moo*_*dra

lucky-day

4
推荐指数

1
解决办法

1950
查看次数

如何使用Python访问存储区GCS子文件夹中的文件？

from google.cloud import storage
import os
bucket = client.get_bucket('path to bucket')

Run Code Online (Sandbox Code Playgroud)

上面的代码将我连接到存储桶，但是我正在努力连接存储桶中的特定文件夹。

我正在尝试此代码的变体，但没有运气：

blob = bucket.get_blob("training/bad")
blob = bucket.get_blob("/training/bad")
blob = bucket.get_blob("path to bucket/training/bad")

Run Code Online (Sandbox Code Playgroud)

我希望能够访问不良子文件夹中的图像列表，但似乎无法这样做。尽管阅读了文档，但我什至不完全了解blob是什么，并且根据教程对其进行了介绍。

谢谢。

python-3.x google-cloud-storage google-cloud-platform

Moo*_*dra

lucky-day

4
推荐指数

2
解决办法

1020
查看次数

X 轴未与条形图中的条正确对齐（seaborn）

我的图表最终看起来像这样：

我获取了原始的泰坦尼克号数据集并分割了一些列，并通过以下代码创建了一个新的数据框。

Cabin_group = titanic[['Fare', 'Cabin', 'Survived']] #selecting certain columns from dataframe
Cabin_group.Cabin = Cabin_group.Cabin.str[0] #cleaning the Cabin column
Cabin_group = Cabin_group.groupby('Cabin', as_index =False).Survived.mean()
Cabin_group.drop([6,7], inplace = True) #drop Cabin G and T as instances are too low
Cabin_group['Status']= ('Poor', 'Rich', 'Rich', 'Medium', 'Medium', 'Poor') #giving each Cabin a status value.

Run Code Online (Sandbox Code Playgroud)

所以我的新数据框“Cabin_group”最终看起来像这样：

  Cabin  Survived  Status
0     A  0.454545    Poor
1     B  0.676923    Rich
2     C  0.574468    Rich
3     D  0.652174  Medium
4     E  0.682927  Medium
5     F  0.523810    Poor

Run Code Online (Sandbox Code Playgroud)

这是我尝试绘制数据框的方法 …

matplotlib pandas seaborn

Moo*_*dra

2021 04-13

3
推荐指数

1
解决办法

6709
查看次数

将每个批次或每个时期的验证准确性输出到控制台（Keras）

我正在使用ImageDataGenerator和flow_from_directory生成我的数据，并使用model.fit_generator来拟合数据。

默认情况下，仅输出训练数据集的准确性。似乎没有选择将验证准确性输出到终端。

这是我的代码的相关部分：

#train data generator


print('Starting Preprocessing')

train_datagen = ImageDataGenerator(preprocessing_function = preprocess)

train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size = (img_height, img_width),
batch_size = batch_size, 
class_mode = 'categorical')  #class_mode = 'categorical'


#same for validation
val_datagen = ImageDataGenerator(preprocessing_function = preprocess)

validation_generator = val_datagen.flow_from_directory(
        validation_data_dir,
        target_size = (img_height, img_width),
        batch_size=batch_size,
        class_mode='categorical')





########################Model Creation###################################

#create the base pre-trained model
print('Finished Preprocessing, starting model creating \n')
base_model = InceptionV3(weights='imagenet', include_top=False)
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, …

Run Code Online (Sandbox Code Playgroud)

python neural-network deep-learning keras

Moo*_*dra

2017 12-23

3
推荐指数

2
解决办法

6591
查看次数