Várias Instâncias de um Mesmo Objeto na Imagem, a Detecção de objetos Usando a CNN

Question 1

Novo NN s. A CNN pode ser treinado para detectar um único objeto em uma imagem. No entanto, o que se qualquer imagem em um conjunto de dados pode conter qualquer n # de objetos. Isto não representa um problema para CNNs como a saída densa camada deve ser de um tamanho fixo? Como você resolveria esse problema?

Por exemplo: Vamos dizer que eu aleatoriamente amostrados 2 imagens neste conjunto. Imagem 1 tem 2 objetos e imagem 2 tem 5 objetos. O y rótulo para img1 deverá conter a caixa delimitadora coordenadas para 2 objetos; y rótulo para img2 deve conter as coordenadas para 5 objetos -- muito maior do y do vetor de img1.

Uma solução possível? :

Eu teria de encontrar a imagem com o maior número de objetos (designar este valor como M). Vamos também dizer que um objeto tem 4 coordenadas. Se M = 5, eu precisaria de um vetor y de 20. Se uma imagem tem 1 objeto, o y do vetor deve conter de 4 valores diferentes de zero E 16 de zero valores. Os 4 valores de zero representam as coordenadas e os 16 valores zero representam as coordenadas dos outros objetos não-existentes.

Question 2

A forma básica de fazer várias objeto de classificação está usando a segmentação. Isto é feito através da segmentação da imagem de entrada para várias sub-áreas e alimentação de cada área para a rede neural.

No entanto, este é um método muito básico e agora existem muitos algoritmos avançados que fazer a segmentação automaticamente.

Geralmente, vários classificação de objetos é abordada em duas etapas: Primeiro, a região proposta de algoritmo para adivinhar quais as partes da imagem que contém o objeto.

O segundo é um algoritmo para classificar a proposta de regiões.

img origem

Reda El Hail · Answer 1 · 2021-11-21T05:58:06

A forma básica de fazer várias objeto de classificação está usando a segmentação. Isto é feito através da segmentação da imagem de entrada para várias sub-áreas e alimentação de cada área para a rede neural.

No entanto, este é um método muito básico e agora existem muitos algoritmos avançados que fazer a segmentação automaticamente.

Geralmente, vários classificação de objetos é abordada em duas etapas: Primeiro, a região proposta de algoritmo para adivinhar quais as partes da imagem que contém o objeto.

O segundo é um algoritmo para classificar a proposta de regiões.

img origem

Algo como o mais Rápido do R-CNN efectua a segmentação usando RPN para extrair características que considere relevantes? É o meu entendimento esta correto? Além disso, qual seria o y do vetor parecer dado que existem variável de previsão de etiquetas para as imagens.

Várias Instâncias de um Mesmo Objeto na Imagem, a Detecção de objetos Usando a CNN

Pergunta

Melhor resposta

Em outros idiomas

Esta página está em outros idiomas

Popular nesta categoria

Perguntas populares nesta categoria