Gerando intervalos de predição para mais de 1 modelo linear em R?

0

Pergunta

Eu estou tentando gerar a previsão de intervalos usando a função de prever() para um novo conjunto de dados, mas em mais do que um modelo que eu tenho gerado para um conjunto de dados. Eu sou relativamente inexperiente no uso de lapply, mas a figura deve ser útil neste processo:

#Calling in my libraries:
library(dplyr)

#Creating dataset:

DNase <- DNase

#Generating models, one for each "Run" in DNAse:
model_dna <- DNase %>% 
  group_by(Run) %>% 
  do(model_dna_group = lm(log(density) ~ log(conc), data = .)) %>%   ungroup()

#Creating a new data set to be used to generate predictions:
new_dna <- as.data.frame(DNase$conc) %>% 
  mutate(conc = DNase$conc * 2) %>% select(conc)

#Attempting to apply predict to these models for a new data frame:
new_dna_w_predictions <- lapply(
                           X = model_dna, 
                           FUN = predict, 
                           newdata = new_dna, 
                           interval = "prediction", 
                           level = 0.9
                          )

No entanto, isso atrai o seguinte erro:

Erro em obter(como.caractere(DIVERSÃO), mode = "função", ambi = ambi) : objeto 'model_dna' do modo de 'função' não foi encontrado

Eu não sou certo como melhor estruturar este lapply função, especialmente, quando estão sendo usados em mais de um modelo. Há geralmente uma maneira mais limpa abordagem?

dplyr lm model predict
2021-11-19 15:33:36
2

Melhor resposta

1

Aqui você tem um completo tidyverse solução:

# Calling in my libraries:
library(dplyr)
library(purrr)

# Creating dataset:
DNase <- DNase

# Creating a new data set to be used to generate predictions:
new_dna <- DNase %>% transmute(conc = conc * 2)  # simplified

# Generating models, one for each "Run" in DNAse:
model_dna <- DNase %>% 
  group_by(Run) %>% 
  summarise(model_dna_group = list(lm(log(density) ~ log(conc))))
  
model_dna
#> # A tibble: 11 x 2
#>    Run   model_dna_group
#>    <ord> <list>         
#>  1 10    <lm>           
#>  2 11    <lm>           
#>  3 9     <lm>           
#>  4 1     <lm>           
#>  5 4     <lm>           
#>  6 8     <lm>           
#>  7 5     <lm>           
#>  8 7     <lm>           
#>  9 6     <lm>           
#> 10 2     <lm>           
#> 11 3     <lm>


# Run predictions
model_dna %>%
  group_by(Run) %>% 
  summarise(map(model_dna_group, predict, newdata = new_dna, interval = "prediction", level = 0.9) %>% map_dfr(as_tibble),
            .groups = "drop")

#> # A tibble: 1,936 x 4
#>    Run       fit    lwr    upr
#>    <ord>   <dbl>  <dbl>  <dbl>
#>  1 10    -2.16   -2.48  -1.85 
#>  2 10    -2.16   -2.48  -1.85 
#>  3 10    -1.33   -1.64  -1.03 
#>  4 10    -1.33   -1.64  -1.03 
#>  5 10    -0.918  -1.22  -0.617
#>  6 10    -0.918  -1.22  -0.617
#>  7 10    -0.503  -0.804 -0.201
#>  8 10    -0.503  -0.804 -0.201
#>  9 10    -0.0873 -0.392  0.217
#> 10 10    -0.0873 -0.392  0.217
#> # ... with 1,926 more rows

Criado em 2021-11-19 pelo reprex pacote (v2.0.0)

Aviso:

  • depois de dplyr 1.0 você não precisa usar do mais para este tipo de casos
  • com map e map_dfr você pode calcular as suas previsões e ajuste-los muito bem em seu tibble
2021-11-19 18:05:38
1

O seu objeto model_dna é um dado.quadro (mais precisamente: um tibble), que contém o lm-objetos em sua segunda coluna "model_dna_group".

No lapply-chamada deverá consultar a coluna, e não todo o quadro de dados. Lapply tenta usar predict nas colunas do quadro de dados, em vez de o lm-objetos dentro da segunda coluna.

Para editar a sua chamada como funciona:

new_dna_w_predictions <- lapply(
                           X = model_dna$model_dna_group, 
                           FUN = predict, 
                           newdata = new_dna, 
                           interval = "prediction", 
                           level = 0.9
                          )
2021-11-19 17:22:23

Em outros idiomas

Esta página está em outros idiomas

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................