小编Fly*_*kle的帖子

R中的前向和后向填充数据帧

我有一个数据框,数据如下

Col1    Col2 
20      NA    
25      NA     
15      NA
NA      10
NA      15
Run Code Online (Sandbox Code Playgroud)

等等......我希望重塑它如下

Col1     Col2
20        10
25        10
15        10
15        10
15        15
Run Code Online (Sandbox Code Playgroud)

基本上向前或向后填充具有第一个非NA值的NA值.我尝试了在R中的一组行中向前和向后进行最后一次因子观察的变体,但是无法使其工作......提前感谢!

r

9
推荐指数
1
解决办法
5458
查看次数

熊猫重新排列数据框

我有一个数据框如下:

Honda [edit]
Accord (4 models)
Civic  (4 models)
Pilot  (3 models)
Toyota [edit]
Prius  (4 models)
Highlander (3 models)
Ford [edit]
Explorer (2 models)
Run Code Online (Sandbox Code Playgroud)

我希望重塑它,以便得到如下结果的2列数据框:

 Honda     Accord
 Honda     Civic
 Honda     Pilot
 Toyota    Prius
 Toyota    Highlander
Run Code Online (Sandbox Code Playgroud)

等等.我试过str.split尝试在编辑之间分割,但没有成功.任何建议都非常感谢!Python新手在这里...如果之前已经解决过这么道歉.谢谢!

到目前为止我试过了

     maker=car['T'].str.extract('(.*\[edit\])', expand=False).str.replace('\[edit\]',"")
Run Code Online (Sandbox Code Playgroud)

这给了我制造商的名单:本田,丰田和福特.然而,我一直在寻找一种方法来提取制造商之间的模型来创建2 col DF.

python pandas

5
推荐指数
2
解决办法
4054
查看次数

在 macOS 上安装 data.table

我需要在 macOS 11.1 上安装 data.table 1.12.0(特别是)。

\n

我收到错误:

\n
clang: error: unsupported option \'-fopenmp\'\nmake: *** [assign.o] Error 1\n
Run Code Online (Sandbox Code Playgroud)\n

我已按照https://github.com/Rdatatable/data.table/wiki/Installation#openmp-enabled-compiler-for-mac中的说明进行操作,但仍然无法使其正常工作。\nR 3.6.1。

\n

我还尝试了 R CMD 安装并得到了相同的错误:

\n
R CMD install data.table_1.12.0.tar.gz \n* installing to library \xe2\x80\x98/Users/XXX/Library/R/3.6/library\xe2\x80\x99\n* installing *source* package \xe2\x80\x98data.table\xe2\x80\x99 ...\n** package \xe2\x80\x98data.table\xe2\x80\x99 successfully unpacked and MD5 sums checked\n** using staged installation\n** libs\nclang -I"/Library/Frameworks/R.framework/Resources/include" -DNDEBUG   -isysroot /Library/Developer/CommandLineTools/SDKs/MacOSX.sdk -I/usr/local/include -fopenmp -fPIC  -Wall -g -O2  -c assign.c -o assign.o\nclang: error: unsupported option \'-fopenmp\'\nmake: *** [assign.o] Error 1\nERROR: compilation failed for package …
Run Code Online (Sandbox Code Playgroud)

macos r data.table

4
推荐指数
1
解决办法
3361
查看次数

SQL:内连接和计数不同

我有两个格式如下的表

Users:


UserID    Name   State
100       ABC    Active
200       DEF    Active
300       GHI    Inactive


Transactions:

UserID    TransactionDate     TransactionType   Amount
100       2020-01-01           Gas               100
100       2020-01-01           Grocery            50
100       2020-05-01           Grocery            20
200       2020-01-01           Gas                50
200       2020-01-01           Gas                15
300       2020-05-01           Grocery            20

Run Code Online (Sandbox Code Playgroud)

我想得到如下结果:

TransactionType        Count
Gas                     3
Grocery                 2
Run Code Online (Sandbox Code Playgroud)

本质上,我只想选择来自Active表的用户Users,并为这些用户计算表中发生的事务数Transactions。我是一个 sql 新手,尝试了一些连接和计数,但没有成功,知道如何让它工作吗?谢谢!

sql

2
推荐指数
1
解决办法
209
查看次数

python将dict转换为JSON

我有以下格式的python字典

{'status': ['Done'], 'urgency': 1, 'text': {'shorttext': 'Short Text', 'longtext': 'Long Text'}, 'startdate': '2019-03-03', 'enddate': '2019-03-03'}

Run Code Online (Sandbox Code Playgroud)

当我使用json_dumps转换为json时

obj=json_dumps(dict)
print(obj)

'{"status": ["Done"], "urgency": 1, "text": {"shorttext": "Short Text", "longtext": "Long Text"}, "startdate": "2019-03-03", "enddate": "2019-03-03"}'

Run Code Online (Sandbox Code Playgroud)

现在,当我尝试使用request.post调用以以下格式将有效负载发布到api时

requests.post(url, headers, json=obj)

Run Code Online (Sandbox Code Playgroud)

我收到以下错误

no String-argument constructor/factory method to deserialize from String value (\'{"status": ["Done"], "urgency": 1, "text": {"shorttext": "Short Text", "longtext": "Long Text"}, "startdate": "2019-03-03", "enddate": "2019-03-03"}'\)
Run Code Online (Sandbox Code Playgroud)

关于什么可能导致此的任何输入?我怀疑是有效载荷包含在其中,但不确定。谢谢!

python

0
推荐指数
1
解决办法
45
查看次数

S3 列出存储桶中子文件夹中的所有文件

我有一个 s3 存储桶,其中的文件位于文件夹结构下,就像folder1/folder2 我只想列出文件夹结构下的文件并迭代 Sagemaker Jupyter 笔记本中的文件一样。

我怎样才能实现这个目标?我尝试了用 boto3 列出存储桶内容中的说明,但只能递归地在顶层列出。但我只想在文件夹级别列出。

我也尝试了下面的代码片段

import boto3
s3 = boto3.resource('s3')
my_bucket = s3.Bucket('bucketname/folder1/folder2')
for my_bucket_object in my_bucket.objects.all():
    print(my_bucket_object)
Run Code Online (Sandbox Code Playgroud)

并得到以下错误

ParamValidationError: Parameter validation failed:
Invalid bucket name...
Run Code Online (Sandbox Code Playgroud)

目前使用Python 3.9。谢谢!

amazon-s3 amazon-web-services jupyter

-2
推荐指数
1
解决办法
3205
查看次数

标签 统计

python ×2

r ×2

amazon-s3 ×1

amazon-web-services ×1

data.table ×1

jupyter ×1

macos ×1

pandas ×1

sql ×1