小编meg*_*egv的帖子

如何过滤R数据帧中唯一的列组合

我试图从R中的数据帧中过滤掉一部分列的副本.

我有兴趣过滤session,first和last的唯一组合.以下是我的数据

                        session       first     last            city
1  9cf571c8faa67cad2aa9ff41f3a26e38     cat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a   caleb     amos                
3  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
4  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5 charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d  carrie mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705    fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a  aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37  andrew    price       yorkville
Run Code Online (Sandbox Code Playgroud)

filtering r unique

26
推荐指数
1
解决办法
4万
查看次数

使用R中的状态缩写和特征频率创建USA的热图

我想创建一张美国地图(可能是热图)来显示各州之间某种特征的频率.我不确定使用什么包或我的数据是否是正确的形式.我的数据在表格中

tf
 AB  AK  AL  AN  AR  AZ  CA  CO  CT  DC  DE  EN  FL  GA  HI  IA  ID  IL  IN  KS 
  1  21  31   1  12  56 316  53  31  16   7   1 335  63  11  42  29  73  40  2
Run Code Online (Sandbox Code Playgroud)

在大多数情况下,我的缩写是美国(除了少数加拿大实例).在地图上以图形方式显示此内容的最佳建议方法是什么?

现在我如何获得每种颜色少于50的粒度?

在此输入图像描述

dictionary r heatmap

8
推荐指数
2
解决办法
7538
查看次数

通过在R中加载.rda文件获取数据帧的名称

我正在尝试在r中加载一个.rda文件,这是一个保存的数据帧.我不记得它的名字.

我试过了

a<-load("al.rda")
Run Code Online (Sandbox Code Playgroud)

然后我不会让我做任何事情.我收到了错误

Error:object 'a' not found
Run Code Online (Sandbox Code Playgroud)

我也尝试过使用=符号.

如何加载此.rda文件以便我可以使用它?

我用负载("al.rda")重新调整了R,我知道得到以下错误

Error: C stack usage is too close to the limit
Run Code Online (Sandbox Code Playgroud)

load r rda dataframe

6
推荐指数
3
解决办法
1万
查看次数

删除字符串长度大于n的所有行

我有一个数据框m,我想删除f_name列的条目大于3的所有行.我假设我可以使用类似的东西

m <- m[-grep("nchar(m$f_name)>3", m$f_name]
Run Code Online (Sandbox Code Playgroud)

grep r dataframe

6
推荐指数
3
解决办法
5105
查看次数

将 pymupdf fitz 对象作为 pdf 保存到 s3

我正在尝试使用 lambda 裁剪 pdf 并将其保存到具有相同名称的 s3 中。我在数据类型为 fitz.fitz.page 时收到错误

import os
import json
import boto3
from urllib.parse import unquote_plus
import fitz, sys
from io import BytesIO

OUTPUT_BUCKET_NAME = os.environ["OUTPUT_BUCKET_NAME"]
OUTPUT_S3_PREFIX = os.environ["OUTPUT_S3_PREFIX"]
SNS_TOPIC_ARN = os.environ["SNS_TOPIC_ARN"]
SNS_ROLE_ARN = os.environ["SNS_ROLE_ARN"]


def lambda_handler(event, context):

    textract = boto3.client("textract")
    if event:
        file_obj = event["Records"][0]
        bucketname = str(file_obj["s3"]["bucket"]["name"])
        filename = unquote_plus(str(file_obj["s3"]["object"]["key"]))
        
        doc = fitz.open()
        s3 = boto3.resource('s3')
        obj = s3.Object(bucketname, filename)
        fs = obj.get()['Body'].read()
        pdf=fitz.open("pdf", stream=BytesIO(fs))
        #pdf.close()
        
        
        rect=fitz.Rect(0.0, 0.0, 595.0, 842.0)
        #page = pdf[0]
        page1 = …
Run Code Online (Sandbox Code Playgroud)

python pdf amazon-s3 aws-lambda pymupdf

5
推荐指数
1
解决办法
2070
查看次数

如何在Eclipse中查看.py

我刚刚在我的机器上安装了eclipse,想要修改.py文件.我尝试打开文件,但我找不到错误应用程序.我需要安装什么以及如何安装它.我在网上搜索过,没有找到任何明确的指示.我正在使用Java Eclipse SDK.

我试图在Windows机器上用Eclipse打开文件.py.我得到的错误是"找不到应用程序".

python eclipse

4
推荐指数
1
解决办法
4309
查看次数

从R中的数据框中删除重复列组合

我想从以下数据中删除sessionid,qf和qn的重复组合

               sessionid             qf        qn         city
1  9cf571c8faa67cad2aa9ff41f3a26e38     cat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a   caleb     amos                
3  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
4  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5 charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d  carrie mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705    fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a  aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37  andrew    price       yorkville 
Run Code Online (Sandbox Code Playgroud)

我将数据读入data.frame并将其称为mydata.Heree是我到目前为止的代码,但我需要知道如何正确地对data.frame进行排序.其次删除sessionid,qf和qn的重复组合.最后用qf列中的直方图字符绘制图形

sortDATA<-function(name)
{
#sort the code by session Id, first name, then last name
sort1.name <- name[order("sessionid","qf","qn") , ]
#create a vector of length …
Run Code Online (Sandbox Code Playgroud)

r dataframe ignore-duplicates

4
推荐指数
1
解决办法
2万
查看次数

使用配置单元在组中出错

我使用以下代码并得到以下错误

      select d.searchpack,d.context, d.day,d,txnid,d.config, c.sgtype from ds3resultstats d join       
     context_header c on (d.context=c.contextid) where (d.day>='2012-11-15' and d.day<='2012-11-25' and  c.sgtype='Tickler' and d.config like 
'%people%') GROUP BY d.context limit 10;
        FAILED: Error in semantic analysis: line 1:7 Expression Not In Group By Key d
Run Code Online (Sandbox Code Playgroud)

我猜我正在错误地使用该组

hive

4
推荐指数
1
解决办法
4876
查看次数

R hist 与 geom_hist 断点

我在 R 中使用 geom_hist 和 histogram 使用相同的断点,但我得到了不同的图形。我进行了快速搜索,有没有人知道定义中断是什么以及为什么它们会有所不同

这些会产生两个不同的图。

set.seed(25)
data <- data.frame(Mos=rnorm(500, mean = 25, sd = 8))
data$Mos<-round(data$Mos)    

pAge <- ggplot(data, aes(x=Mos))
pAge + geom_histogram(breaks=seq(0, 50, by = 2))
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

hist(data$Mos,breaks=seq(0, 50, by = 2))
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明 谢谢

r graph ggplot2

4
推荐指数
1
解决办法
2156
查看次数

如何在R中从命令行保存直方图

我试图将直方图保存到我的虚拟机R中的文件.

我使用以下R代码:

> pdf("graph1.pdf")
> hist(nchar(as.character(m1$qf)),main="First name search 11-14 and 11-15",
  xlab="length of     name")
> dev.off()
null device 
      1 
Run Code Online (Sandbox Code Playgroud)

我收到了回复: null device 1

如果我只是hist(nchar(as.character(m1$qf)),main="First name search 11-14 and 11-15",xlab="length of name")在命令行中运行,我会看到正确的直方图.

但是当保存到pdf时,我得到的东西看起来像这样:

ET
BT
/F2 1 Tf 0.00 12.00 -12.00 0.00 41.76 160.01 Tm (500000) Tj
ET
BT
/F2 1 Tf 0.00 12.00 -12.00 0.00 41.76 249.50 Tm (1000000) Tj
ET
BT
/F2 1 Tf 0.00 12.00 -12.00 0.00 41.76 342.32 Tm (1500000) Tj
ET
Q q 59.04 …
Run Code Online (Sandbox Code Playgroud)

r save virtual-machine histogram

3
推荐指数
2
解决办法
2万
查看次数

如果城市列单元格为空,则R中的Grep将删除整行

我有以下R数据帧mydata

                       session      first     last            city
1  9cf571c8faa67cad2aa9ff41f3a26e38    cat+rat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a      caleb     amos                
3  2ad41134cc285bcc06892fd68a471cd7 daniel+joe  folkers                
4  2ad41134cc285bcc06892fd68a471cd7 daniel+joe  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5    charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e          j    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e          j    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d   carr%ie% mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705       fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a     aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37     andrew    price       yorkville
Run Code Online (Sandbox Code Playgroud)

删除城市空白的所有行的正确代码是什么?

grep r dataframe

2
推荐指数
1
解决办法
2953
查看次数

如何从包含特定列中的符号的data.frame中删除行

我想从命名mydata列中first包含"+" 的数据框中删除所有行.在R中对此有什么正确的命令?

这是我的数据帧的样子:

session                              first     last           city
1  9cf571c8faa67cad2aa9ff41f3a26e38     cat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a caleb+joey amos                
3  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
4  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5 charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e j+henry    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e j+henry    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d  carrie mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705    fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a  aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37  andrew    price       yorkville
Run Code Online (Sandbox Code Playgroud)

symbols r dataframe

1
推荐指数
1
解决办法
6539
查看次数