R - write_parquet em loop

0

Pergunta

fwrite é um loop longo de muitos .csv arquivos no diretório de trabalho mas quando eu escrevo uma .parquet ele substitui cada vez.

Eu tentei várias abordagens, basicamente, eu estou tentando usar o nome de arquivo de eu manter a .csv nome do arquivo conforme mostrado abaixo, sem substituí-lo.

rm(list = ls())
gc()

# Set up environment #
require("data.table")
require("arrow")

# Set directory to data, define files #
setwd("E:/TransferComplete/07/")

files <- list.files(pattern = "csv")

for (i in files){  setwd("E:/TransferComplete/07/")
loopStart <- Sys.time()
  
  bb <- fread(i,header = TRUE,sep = ",", data.table = FALSE, stringsAsFactors = FALSE,
                select = c("x","y","z"))
  gc()
  
  
  write_parquet(bb,
  'E:/P/i.parquet')
  
  
  loopEnd <- Sys.time()
  loopTime <- round(as.numeric(loopEnd) - as.numeric(loopStart), 0)
}
csv loops parquet r
2021-11-23 23:08:00
2

Melhor resposta

1

Substituir esta

write_parquet(bb,
  'E:/P/i.parquet')

para esta

write_parquet(bb,paste0('E:/P/',i,'.parquet'))
2021-11-24 00:31:37
1

Você estava muito perto de sua pergunta. Quando você está escrevendo o .parquet, você precisa separar o i quando gravar o arquivo ou o loop vai continuar escrevendo um arquivo chamado i.parquet.

write_parquet(bb,paste0('E:/P/',i,'.parquet'))
2021-11-24 00:40:17

Em outros idiomas

Esta página está em outros idiomas

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................