Reciclar uma BERT Modelo

0

Pergunta

Eu tenho treinado BERT modelo usando pytorch para cerca de um milhão de dados de texto para uma tarefa de classificação. Depois de testar este modelo com dados para eu obter Falsos Positivos e Falsos Negativos. Agora eu quero voltar a treinar o modelo existente apenas com FN e FP. Eu não quero acrescentar a combinação de teclas FN e FP para o conjunto de dados existentes e, em seguida, treinar o modelo inteiro de novo. Como faço para treinar este bert somente o modelo com estas FN e Fp sobre o previosuly treinados modelo.

1

Melhor resposta

0

Sem saber o código para o seu trem de loop, a idéia deve ser algo como após o treinamento:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

Se você quiser algo mais específico, você vai ter que fornecer o código de seu atual trem loop.

2021-11-23 12:46:43

obrigado pelo feedback. Mas eu quero manter uma versão do modelo, pois nós treiná-lo a cada semana, temos o modelo de versão. E também a iteração de um milhão de registos vai ter um monte de tempo. Eu estava pensando em carregar a versão anterior do arquivo bin(v1).0) e, em seguida, treinar isso com apenas novos pontos de dados para criar uma outra versão v2.0
Patricia

Você pode querer esclarecer a sua pergunta para o estado. No entanto, ao fazer o controle de versão não remove a necessidade de acompanhar os resultados dos pontos de dados após o treinamento, exigindo um único loop sobre o trem de dados após o treinamento é feito. Você precisa determinar o que o "novo relatório" são, depois de tudo.
Kroshtan

Em outros idiomas

Esta página está em outros idiomas

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................