警告:因子包含隐式 NA

Rom*_*n B 2 r missing-data na shiny

我是 R 和 Shiny 的新手,我正在尝试使用 ggplot2 创建一个交互式绘图。当用户选中复选框时,他可以访问多选字段来自定义绘图。

原始数据框包含标识为"N/A"inPublisherYearcolumn 的缺失值。我删除了包含 NAs 的行,complete.cases所以它不应该有任何 NA 剩下。

我运行我的应用程序:好的。我进入默认情节:好的。我选中复选框:Warning: Factor 'Publisher' contains implicit NA, consider using 'forcats::fct_explicit_na'

我想删除这个警告,至少理解它。如果您有任何其他评论,请这样做:我的目标是变得更好。

应用程序R:

df<-read.csv("vgsales.csv")
df$Year[df$Year=="N/A"]<-NA
df$Year<-factor(df$Year)
df$Publisher[df$Publisher=="N/A"]<-NA
df$Publisher<-factor(df$Publisher)
df<-df[complete.cases(df),]

pubSales<-na.omit(df
    %>% group_by(Publisher, Year) 
    %>% summarise(Global_Sales=sum(Global_Sales))
)
pubSales<-pubSales[order(pubSales$Year),]

top5Pub<-head(unique(pubSales[order(-pubSales$Global_Sales),]$Publisher),5)

ui <- navbarPage("Video Games Sales",
    tabPanel("Publishers",
        mainPanel(
            titlePanel(
                title = "Publishers sales"
            ),
            sidebarPanel(
                radioButtons(
                    "pubOptions",
                    "Options",
                    c("Top 5 Publishers"="topFivePub",
                      "Custom Publishers"="customPub"),
                    selected="topFivePub"
                ),
                uiOutput("customPubUI")
            ),
            mainPanel(
                plotOutput("pubPlot")
            ),
            width=12
        )
    )
)

server <- function(input, output, session) {

    output$customPubUI<-renderUI({
        if(input$pubOptions=="customPub"){
            selectInput(
                "selectedPub",
                "Editeurs",
                pubSales$Publisher,
                multiple=TRUE
            )
        }
    })

    output$pubSales<-renderTable(pubSales)
    output$pubPlot<-renderPlot({
        ggplot()+
            if(input$pubOptions=="customPub"){
                geom_line(
                    data=pubSales[pubSales$Publisher %in% input$selectedPub,],
                    aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
                )
            }else{
                geom_line(
                    data=pubSales[pubSales$Publisher %in% top5Pub,],
                    aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
                )
            }
    })

}

shinyApp(ui, server)
Run Code Online (Sandbox Code Playgroud)

小智 6

弹出警告是因为 NA 不是因子中的一个级别。它只是失踪了。该警告提醒您在因子中存在一个“隐藏”级别,当您对因子执行操作时不会显示该级别。

例如,一个基本因素:

a.factor <- as.factor(c('a', 'b', 'c', NA))
Run Code Online (Sandbox Code Playgroud)

当我们在快速表格中打印或汇总时只有 3 个级别:

> print(a.factor)
[1] a    b    c    <NA>
Levels: a b c

> table(a.factor)
a.factor
a b c 
1 1 1 
Run Code Online (Sandbox Code Playgroud)