我有以下日期时间:
t <- "2018-05-01 23:02:50 UTC"
我想将其拆分为时间和日期。
当我申请 date(t) 我得到日期部分。但是当我使用 lubridate 的hms
,parse_date_time
和其他函数来执行此操作时,"HMS"
我会得到NA
.
我已经在 SOF 上检查了其他答案,但由于某种原因,它给了我NA
。
请教如何提取。
我想了解为什么:
strftime(t, format="%H:%M:%S")
Run Code Online (Sandbox Code Playgroud)
会做的工作,但我在我丢失lubridate::hms
或parse_date_time
?
我无法从 R Studio 推送,并且不断收到错误消息:
错误:RPC 失败;curl 55 请求的 URL 返回错误:401
致命:远端意外挂断
致命:远端意外挂断
一切都是最新的
给定一组字符串,例如:
"John Doe"
"Doe John"
"Albert Green"
"Greenshpan David"
...
Run Code Online (Sandbox Code Playgroud)
我想运行一个能够识别名字和姓氏的 NER 模型。我使用的所有英文模型(Spacy、NLTK 等)都给了我 PERSON 实体。
请问有没有已经训练好的模型?
期望的输出:
{"John": "First Name", "Doe": "Last Name"}
{"Doe": "Last Name", "John": "First Name"}
{"Albert": "First Name", "Green": "Last Name"}
{"Greenshpan": "Last Name", "David": "First Name"}
Run Code Online (Sandbox Code Playgroud) 我有一个 PDF 文件,已将其转换为 jpeg。我得到的是图像列表:
[<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FF46CDC10>,
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6651750>,
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657450>,
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657550>,
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657650>,
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1700x2200 at 0x7F0FE6657790>]
Run Code Online (Sandbox Code Playgroud)
我需要将它们分别传递到我的 AWS Textract 管道以提取表和文本。
问题是我无法传递这些对象,它们不是我可以打开的文件。请告知如何读取/加载此类对象?
给定一个字典:
{1: [1,2,3,4,5], 2: [55,22,112]}
Run Code Online (Sandbox Code Playgroud)
我想构建一个数据框:
key_id ids
1 1
1 2
1 3
1 4
1 5
2 55
2 22
2 112
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?我正在尝试玩,pd.DataFrame.from_dict()
但这似乎不是正确的方法。还尝试运行字典,并创建一个具有与值列表长度相同的键的列表。有什么有效的方法可以做到这一点吗?
PS 有时它会是一个数据帧作为值:
{0: pd.DataFrame({'id': {0: 3}})}
Run Code Online (Sandbox Code Playgroud) 我有以下变量:
a = [1, 2, 3]
b = "de" # <-- not a (usual) list !
c = 5 # <-- not a list !
d = [4, 5, 23, 11, 5]
e = ["dg", "kuku"]
Run Code Online (Sandbox Code Playgroud)
现在我想将所有内容连接a, b, c, d, e
到一个列表:
[1, 2, 3, "de", 5, 4, 5, 23, 11, 5, "dg", "kuku"]
Run Code Online (Sandbox Code Playgroud)
我已经尝试过itertools.chain
,但没有成功。请告知我如何进行串联?
我有一个100列的数据框。每列代表一个概率值。
我想在那里缩放并使用以下转换:
df <- df %>%
mutate_at(vars(specific_columns),
funs(function(x) {((x - min(x)) / (max(x) - min(x)))}))
Run Code Online (Sandbox Code Playgroud)
但这不起作用,也不会产生我想要的输出。
例如,样本数据为:
col1 col2 col3 col4 col5
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000
0.028985507 0.028985507 0.028985507 0.028985507 0.028985507
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754
0.014492754 0.014492754 0.014492754 0.014492754 0.014492754
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000
0.010989011 0.010989011 0.010989011 0.010989011 0.010989011
0.000000000 0.000000000 0.000000000 0.000000000 0.000000000
Run Code Online (Sandbox Code Playgroud)
错误:
mutate_impl(.data,点)中的错误:列
col1
是不受支持的类型函数
我在字符数组中的JSON中有以下数字:
[1544018118438041139,162.0,38.0,0.023529414,1.0,2131230815,1]
library(jsonlite)
fromJSON(
'[1544018118438041139,162.0,38.0,0.023529414,1.0,2131230815,1]'
)
Run Code Online (Sandbox Code Playgroud)
收益:
[1] 1544018118438041088.000000000000000000000
162.000000000000000000000 38.000000000000000000000 [4] 0.023529413999999998497
1.000000000000000000000 2131230815.000000000000000000000 [7] 1.000000000000000000000
我想让它返回正确的确切时间(大号:1544018118438041139)
请告知如何使其工作.
我给了31个二进制变量,为简单起见,我们称之为
x_1, ..., x_31
.
每个X_i = c(0, 1)
.
我需要构建一个选项树.我已经使用expand.grid但我的服务器抛出一个错误:
错误:无法分配大小为16.0 Gb的向量.
我知道我可以sparsify
这样但我怎么能处理大尺寸?
使用sparsify
提供相同的错误消息,但使用8 Gb
.
请指教.
我的 S3 存储桶文件夹中有一堆图像。
我有一个来自 S3 ( img_list
)的键列表,我可以读取和显示图像:
key = img_list[0]
bucket = s3_resource.Bucket(bucket_name)
img = bucket.Object(key).get().get('Body').read()
Run Code Online (Sandbox Code Playgroud)
我有一个功能:
def image_from_s3(bucket, key):
bucket = s3_resource.Bucket(bucket)
image = bucket.Object(key)
img_data = image.get().get('Body').read()
return Image.open(io.BytesIO(img_data))
Run Code Online (Sandbox Code Playgroud)
现在我想要的是使用 OpenCV 读取图像,但出现错误:
key = img_list[0]
bucket = s3_resource.Bucket(bucket_name)
img = bucket.Object(key).get().get('Body').read()
cv2.imread(img)
SystemError Traceback (most recent call last)
<ipython-input-13-9561b5237a85> in <module>
2 bucket = s3_resource.Bucket(bucket_name)
3 img = bucket.Object(key).get().get('Body').read()
----> 4 cv2.imread(img)
SystemError: <built-in function imread> returned NULL without setting an error
Run Code Online (Sandbox Code Playgroud)
请建议如何以正确的方式阅读它?