小编Ste*_*veS的帖子

从润滑日期时间对象中提取时间（HMS）？

我有以下日期时间：

t <- "2018-05-01 23:02:50 UTC"

我想将其拆分为时间和日期。

当我申请 date(t) 我得到日期部分。但是当我使用 lubridate 的hms,parse_date_time和其他函数来执行此操作时，"HMS"我会得到NA.

我已经在 SOF 上检查了其他答案，但由于某种原因，它给了我NA。

请教如何提取。

我想了解为什么：

strftime(t, format="%H:%M:%S")

Run Code Online (Sandbox Code Playgroud)

会做的工作，但我在我丢失lubridate::hms或parse_date_time？

r date lubridate

Ste*_*veS

2018 07-06

11
推荐指数

3
解决办法

7331
查看次数

错误：RPC 失败；curl 55 从 R Studio 推送到 GIT 时，请求的 URL 返回错误：401

我无法从 R Studio 推送，并且不断收到错误消息：

错误：RPC 失败；curl 55 请求的 URL 返回错误：401

致命：远端意外挂断

致命：远端意外挂断

一切都是最新的

github git-push rstudio rstudio-server

Ste*_*veS

2020 06-20

8
推荐指数

2
解决办法

8011
查看次数

是否有任何 NER 模型可以识别名字和姓氏而不仅仅是 PERSON？

给定一组字符串，例如：

"John Doe"
"Doe John"
"Albert Green"
"Greenshpan David"

...

Run Code Online (Sandbox Code Playgroud)

我想运行一个能够识别名字和姓氏的 NER 模型。我使用的所有英文模型（Spacy、NLTK 等）都给了我 PERSON 实体。

请问有没有已经训练好的模型？

期望的输出：

{"John": "First Name", "Doe": "Last Name"}
{"Doe": "Last Name", "John": "First Name"}
{"Albert": "First Name", "Green": "Last Name"}
{"Greenshpan": "Last Name", "David": "First Name"}

Run Code Online (Sandbox Code Playgroud)

nlp named-entity-recognition nltk python-3.x spacy

Ste*_*veS

2022 03-14

7
推荐指数

1
解决办法

2332
查看次数

如何传递/读取 PIL.JpegImagePlugin.JpegImageFile 对象？

我有一个 PDF 文件，已将其转换为 jpeg。我得到的是图像列表：

[<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FF46CDC10>,
 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6651750>,
 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657450>,
 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657550>,
 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657650>,
 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657790>]

Run Code Online (Sandbox Code Playgroud)

我需要将它们分别传递到我的 AWS Textract 管道以提取表和文本。

问题是我无法传递这些对象，它们不是我可以打开的文件。请告知如何读取/加载此类对象？

image with-statement python-imaging-library python-3.x

Ste*_*veS

lucky-day

5
推荐指数

1
解决办法

1万
查看次数

将 dict 转换为数据帧，其中每个值都重复键？

给定一个字典：

{1: [1,2,3,4,5], 2: [55,22,112]}

Run Code Online (Sandbox Code Playgroud)

我想构建一个数据框：

Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点？我正在尝试玩，pd.DataFrame.from_dict()但这似乎不是正确的方法。还尝试运行字典，并创建一个具有与值列表长度相同的键的列表。有什么有效的方法可以做到这一点吗？

PS 有时它会是一个数据帧作为值：

{0: pd.DataFrame({'id': {0: 3}})}

Run Code Online (Sandbox Code Playgroud)

dictionary dataframe python-3.x pandas

Ste*_*veS

2022 02-22

5
推荐指数

1
解决办法

835
查看次数

如何将列表整数和字符串连接成一个字符串？

我有以下变量：

a = [1, 2, 3]
b = "de"  # <-- not a (usual) list !
c = 5     # <-- not a list !
d = [4, 5, 23, 11, 5]
e = ["dg", "kuku"]

Run Code Online (Sandbox Code Playgroud)

现在我想将所有内容连接a, b, c, d, e到一个列表：

[1, 2, 3, "de", 5, 4, 5, 23, 11, 5, "dg", "kuku"]

Run Code Online (Sandbox Code Playgroud)

我已经尝试过itertools.chain，但没有成功。请告知我如何进行串联？

python list concatenation

Ste*_*veS

2022 05-18

5
推荐指数

1
解决办法

709
查看次数

R中带有lambda函数的mutate_at？

我有一个100列的数据框。每列代表一个概率值。

我想在那里缩放并使用以下转换：

df <- df %>%
      mutate_at(vars(specific_columns), 
                funs(function(x) {((x - min(x)) / (max(x) - min(x)))}))

Run Code Online (Sandbox Code Playgroud)

但这不起作用，也不会产生我想要的输出。

例如，样本数据为：

col1        col2        col3        col4        col5        
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754 
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000 
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000 
0.028985507 0.028985507 0.028985507 0.028985507 0.028985507 
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000 
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754 
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754 
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000 
0.010989011 0.010989011 0.010989011 0.010989011 0.010989011 
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000

Run Code Online (Sandbox Code Playgroud)

错误：

mutate_impl（.data，点）中的错误：列col1是不受支持的类型函数

scaling r dataframe dplyr

Ste*_*veS

lucky-day

4
推荐指数

1
解决办法

697
查看次数

不会像在R中那样解析19位数字

我在字符数组中的JSON中有以下数字:

[1544018118438041139,162.0,38.0,0.023529414,1.0,2131230815,1]

library(jsonlite)
fromJSON(
  '[1544018118438041139,162.0,38.0,0.023529414,1.0,2131230815,1]'
)

Run Code Online (Sandbox Code Playgroud)

收益:

[1] 1544018118438041088.000000000000000000000
162.000000000000000000000 38.000000000000000000000 [4] 0.023529413999999998497
1.000000000000000000000 2131230815.000000000000000000000 [7] 1.000000000000000000000

我想让它返回正确的确切时间(大号:1544018118438041139)

请告知如何使其工作.

json r numeric biginteger

Ste*_*veS

2018 12-11

4
推荐指数

1
解决办法

93
查看次数

处理非常大的expand.grid？

我给了31个二进制变量,为简单起见,我们称之为 x_1, ..., x_31.

每个X_i = c(0, 1).

我需要构建一个选项树.我已经使用expand.grid但我的服务器抛出一个错误:

错误:无法分配大小为16.0 Gb的向量.

我知道我可以sparsify这样但我怎么能处理大尺寸？

使用sparsify提供相同的错误消息,但使用8 Gb.

请指教.

r sparse-matrix

Ste*_*veS

lucky-day

3
推荐指数

1
解决办法

320
查看次数

如何使用 Python 3 从 S3 获得的 OpenCV 读取图像？

我的 S3 存储桶文件夹中有一堆图像。

我有一个来自 S3 ( img_list)的键列表，我可以读取和显示图像：

key = img_list[0]
bucket = s3_resource.Bucket(bucket_name)
img = bucket.Object(key).get().get('Body').read()

Run Code Online (Sandbox Code Playgroud)

我有一个功能：

def image_from_s3(bucket, key):

    bucket = s3_resource.Bucket(bucket)
    image = bucket.Object(key)
    img_data = image.get().get('Body').read()

    return Image.open(io.BytesIO(img_data))

Run Code Online (Sandbox Code Playgroud)

现在我想要的是使用 OpenCV 读取图像，但出现错误：

key = img_list[0]
bucket = s3_resource.Bucket(bucket_name)
img = bucket.Object(key).get().get('Body').read()
cv2.imread(img)


SystemError                               Traceback (most recent call last)
<ipython-input-13-9561b5237a85> in <module>
      2 bucket = s3_resource.Bucket(bucket_name)
      3 img = bucket.Object(key).get().get('Body').read()
----> 4 cv2.imread(img)

SystemError: <built-in function imread> returned NULL without setting an error

Run Code Online (Sandbox Code Playgroud)

请建议如何以正确的方式阅读它？

opencv amazon-s3 amazon-web-services python-3.x boto3

Ste*_*veS

2021 01-27

3
推荐指数

1
解决办法

3739
查看次数