小编Mic*_*cka的帖子

这是什么(cid:51)在pdf2txt的输出中?

所以我试图从pdf文件中提取文本,我需要它的位置,宽度,高度,字体.

我尝试了很多,但最有用和最完整的解决方案看起来是PDFMiner,在这种情况下,更确切地说是pdf2txt.py.

我已经按照文档和示例进行操作,并尝试Learn More使用以下命令从我的pdf中提取文本:

pdf2txt.py -Y normal -t xml -o buttons.xml buttons.pdf
Run Code Online (Sandbox Code Playgroud)

输出buttons.xml看起来像这样:

<?xml version="1.0" encoding="utf-8" ?>
  <pages>
      <page id="1" bbox="0.000,0.000,799.900,449.944" rotate="0">
      <textbox id="0" bbox="164.979,213.240,247.680,235.944">
          <textline bbox="164.979,213.240,247.680,235.944">
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="164.979,213.240,178.978,235.944" size="22.704">(cid:51)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="173.280,213.240,187.278,235.944" size="22.704">(cid:76)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="181.315,213.240,195.313,235.944" size="22.704">(cid:72)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="189.350,213.240,203.348,235.944" size="22.704">(cid:89)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="194.795,213.240,208.793,235.944" size="22.704">(cid:85)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="203.096,213.240,217.094,235.944" size="22.704">(cid:3)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="206.987,213.240,220.986,235.944" size="22.704">(cid:52)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="219.684,213.240,233.682,235.944" size="22.704">(cid:86)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="228.237,213.240,242.235,235.944" size="22.704">(cid:89)</text>
              <text font="KZNUUP+HelveticaNeue-Bold" bbox="233.682,213.240,247.680,235.944" size="22.704">(cid:76)</text>
              <text></text>
          </textline>
          </textbox>
          <textgroup bbox="164.979,213.240,419.659,235.944"> …
Run Code Online (Sandbox Code Playgroud)

python xml pdf-parsing

11
推荐指数
1
解决办法
2904
查看次数

Google Cloud Function 内存不足错误没有意义

问题:

您知道一种方法来实际监控 GCF (Node.js 8) 使用了多少内存吗?
您对 Node.js 8 的 Google Cloud Functions(甚至本地)内存分析有什么建议吗?

语境:

我部署了一个具有 128MB 内存的 Google Cloud Function (NodeJS),过去运行得很好。

今天,它没有说“ Error: memory limit exceeded.”。

GCP 告诉我该函数使用的内存不超过 58MiB,但当它使用 128MB 时,它会失败并出现内存错误。

我感到失落和有缺陷,因为:

  1. 它曾经有效,从那以后我没有改变任何事情。
  2. 在监控内存消耗方面我似乎不能相信谷歌

  3. 该函数的“详细信息”屏幕显示其消耗不超过 58MiB。 功能的“详细信息”屏幕

  4. 我在监控中创建的仪表板以便监控它显示相同的值。 仪表板的屏幕截图
  5. 但它因内存限制而失败。 函数的日志

我已经看过这个问题Memory profiler for Google cloud function? ,但 Stackdriver Profiler 似乎不适用于 GCF(根据文档

out-of-memory node.js google-cloud-functions

6
推荐指数
1
解决办法
4286
查看次数

如何在 CQL 中对日期时间进行算术运算

我的目标是从现在开始删除固定的时间()。所以我总是能得到最后五分钟,或者最后五个小时。

我怎样才能实现它?

cassandra 的文档说:

可以在时间戳或日期中添加 (+) 或减去 (-) 持续时间以创建新的时间戳或日期。例如:
SELECT * FROM myTable WHERE t = '2017-01-01' - 2d
将选择 2016 年最后 2 天内值为 t 的所有记录。

里面cqlshshow version;给了我:

[cqlsh 5.0.1 | Cassandra 3.11.0 | CQL spec 3.4.4 | Native protocol v4]
Run Code Online (Sandbox Code Playgroud)

我用下表进行测试:

cqlsh:> CREATE TABLE t (
    ...   ts        timestamp,
    ...   PRIMARY KEY (ts)
    ... )
    ... WITH compression = {'class': 'LZ4Compressor'}
    ... AND gc_grace_seconds = 60;
Run Code Online (Sandbox Code Playgroud)

以下查询有效:

SELECT (float)1.55 FROM t WHERE (ts <= …
Run Code Online (Sandbox Code Playgroud)

cql cassandra cql3 cqlsh cassandra-3.0

5
推荐指数
1
解决办法
3368
查看次数

过滤范围日期弹性搜索

这就是我的数据的样子

{
  "name": "thename",
  "openingTimes": {
    "monday": [
      {
        "start": "10:00",
        "end": "14:00"
      },
      {
        "start": "19:00",
        "end": "02:30"
      }
    ]
  }
}
Run Code Online (Sandbox Code Playgroud)

我想查询这个文件说,opened on monday between 13:00 and 14:00.
我尝试过这个过滤器,但它没有返回我的文档:

{
  "filter": {
    "range": {
      "openingTimes.monday.start": {
        "lte": "13:00"
      },
      "openingTimes.monday.end": {
        "gte": "14:00"
      }
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

如果我只是说opened on monday at 13:00,它有效:

{
  "filter": {
    "range": {
      "openingTimes.monday.start": {
        "lte": "13:00"
      }
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

甚至closing on monday from 14:00,也是有效的:

{
  "filter": …
Run Code Online (Sandbox Code Playgroud)

date range filter elasticsearch

3
推荐指数
1
解决办法
5932
查看次数

调用sub时需要excel错误424对象

我花了几个小时查看我的代码,但我无法弄清楚出了什么问题.

我一直得到这个424错误,因为我没有明显的理由.这是我的一段代码.

我只想将行作为参数提供给mySub来处理它.

Option Explicit

Private Sub mySub(row As Range)
    Debug.Print ("mySub") ' not printed
    Dim line As Collection

    Set line = New Collection
End Sub

Private Sub CalcClients()
    Dim data_sheet As Worksheet
    Dim last_row As Long
    Dim last_col As String
    Dim line As Long
    Dim cols As Range
    Dim row As Range

    Set data_sheet = Worksheets("DATA")
    Let last_row = data_sheet.Range("A1").End(xlDown).row
    Let last_col = Col_Letter(data_sheet.Range("A1").End(xlToRight).column)
    Set cols = data_sheet.Range("A2:" & last_col & last_row)

    For Each row In cols.Rows
        ' type_name(row) …
Run Code Online (Sandbox Code Playgroud)

excel vba

3
推荐指数
2
解决办法
5347
查看次数

哈希has_key?句法

我有三个哈希:

a = {key:"value"}
b = {"key"=>"value"}
c = {:key=>"value"}
Run Code Online (Sandbox Code Playgroud)

而这些结果:

a.has_key?("key") # => false
b.has_key?("key") # => true
c.has_key?("key") # => false
Run Code Online (Sandbox Code Playgroud)

我的问题是:

  • 为什么?这是什么行为?
  • 我如何获得a,b并使用相同的语法c返回true所有这些?

ruby syntax hash

2
推荐指数
1
解决办法
9131
查看次数

Rails - 在link_to'删除'中用图像替换文本

我试图改变的基本代码片段是:

<%= link_to 'Delete', post, method: :delete, data: { confirm: 'Are you sure?' } %>
Run Code Online (Sandbox Code Playgroud)

我的问题是:是否可以替换文本"删除"以显示与原始代码执行相同操作的图像?即用"X"图像替换"删除"

我试过了:

<%= link_to 'img src="path_to_image"', post, method: :delete, data: { confirm: 'Are you sure?' } %>
Run Code Online (Sandbox Code Playgroud)

是不是真的期望上面的代码工作,但我想我会试一试.正如预期的那样,它返回"a href ="path_to_image""代替'删除'

还以为我应该补充一下

rails -v
Rails 4.1.0
Run Code Online (Sandbox Code Playgroud)

methods action ruby-on-rails ruby-on-rails-4

2
推荐指数
1
解决办法
925
查看次数