Projeto METAPKLot

Aprendizado de Máquina Aplicado em Cidades Inteligentes

Este projeto tem como objetivo propor novas técnicas que aproveitam o uso de câmeras para aprimorar a gestão automatizada do tráfego em cidades inteligentes por meio de aprendizado de máquina. Ele aborda questões como a detecção automática de vagas de estacionamento, a identificação de áreas congestionadas com veículos e a geração de informações relevantes, como o tempo de utilização de infraestruturas viárias específicas em áreas urbanas.

As soluções desenvolvidas neste projeto poderiam, por exemplo, auxiliar na orientação dos motoristas para a vaga de estacionamento mais próxima disponível, economizando tempo e combustível. Além disso, essas soluções abrem a possibilidade de criar novas oportunidades de negócios, como cobrança automatizada com base na duração que um veículo ocupa uma vaga de estacionamento específica.

Principais Tecnologias

Aprendizado Profundo, Segmentação por Instância, Processamento de Imagem e Dispositivos IoT.

Equipe do Projeto

RESULTADOS ATUAIS

Mapeamento automatizado do layout de áreas de estacionamento

Nosso método, conforme apresentado na IEEE SMC 2023, tem a capacidade de identificar automaticamente áreas de estacionamento por meio de câmeras, totalmente livre de intervenção humana. Isso nos permite mapear e monitorar posteriormente essas regiões dentro de cidades inteligentes com um esforço mínimo.

A inovação central deste trabalho é o método denominado GraphSpot. Diferente de abordagens tradicionais que buscam linhas pintadas no chão, nossa técnica utiliza uma rede de segmentação por instância para detectar veículos e gerar um ‘Mapa de Calor’ baseado na ocorrência. O sistema é capaz de aprender todo o layout do estacionamento observando apenas um único dia de operação, identificando as áreas onde veículos permanecem estacionados com frequência e desenhando automaticamente os limites das vagas. Os testes mostraram uma precisão de até 95,6% (AP25), sendo eficaz até mesmo em estacionamentos sem demarcação visível ou com ocupação irregular.

As soluções desenvolvidas neste projeto poderiam, por exemplo, auxiliar na orientação dos motoristas para a vaga de estacionamento mais próxima disponível, economizando tempo e combustível. Além disso, essas soluções abrem a possibilidade de criar novas oportunidades de negócios, como cobrança automatizada com base na duração que um veículo ocupa uma vaga de estacionamento específica.

No vídeo abaixo, você pode observar o sistema em ação, empregando uma fusão de redes de segmentação por instância e processamento de imagem para processar automaticamente imagens de um dia típico de trabalho. Esse processo permite uma compreensão abrangente do layout da área.

Definindo a Melhor Estratégia: Modelos Únicos vs. Ensembles

Um dos desafios fundamentais na criação de sistemas de monitoramento escaláveis é a capacidade de generalização: o sistema deve funcionar imediatamente em um novo estacionamento sem a necessidade de ser retreinado com dados locais (cenário cross-dataset). O objetivo é viabilizar soluções ‘plug-and-play’ (ready-to-use), que possam ser instaladas em novas câmeras e começar a operar sem a onerosa tarefa de anotação manual de dados e retreinamento específico para cada novo local.

Nesta pesquisa, apresentada na ICMLA 2023, investigamos se a melhor estratégia para este problema seria o uso de Ensembles (conjuntos de múltiplos modelos tomando decisão em grupo) ou Modelos Únicos robustos.

Os resultados foram surpreendentes e definiram o rumo das pesquisas seguintes do laboratório:

A Diversidade é Chave: A diversidade dos dados de treinamento (como os encontrados no dataset PKLot) mostrou-se mais importante do que a complexidade da arquitetura do modelo.
Eficiência: Contrariando a intuição de que “mais modelos são melhores”, um Modelo Único (MobileNetV3) superou as estratégias de Ensemble, alcançando uma acurácia média de 95,5% em cenários desconhecidos.

Essa descoberta permitiu focar esforços na otimização de modelos leves e únicos para dispositivos de borda, base para os trabalhos de destilação de conhecimento.

Otimizando Classificação de Vagas de Estacionamento: Destilação de Modelos

Nesta pesquisa, são exploradas soluções para otimizar a classificação de imagens em aplicações de cidades inteligentes, como o monitoramento de vagas de estacionamento. O envio de grandes volumes de dados para servidores centrais representa um desafio crítico para a infraestrutura urbana: estima-se que uma rede com 1.000 câmeras possa gerar um tráfego de cerca de 35 gigabytes de dados por hora, exigindo equipamentos de rede complexos e caros. Para mitigar esse gargalo, a solução é processar os dados na própria borda (edge), enviando apenas informações leves para o servidor.

Para mitigar esse problema, os pesquisadores propuseram um modelo Teacher-Student, onde modelos Teacher (mais complexos) geram pseudo-rótulos para treinar versões Student (mais leves), que podem ser implementadas diretamente em dispositivos de borda.

Os resultados mostram que os modelos Student, mesmo com 26 vezes menos parâmetros, superaram os Teacher, alcançando 96,6% de precisão, tornando a abordagem mais eficiente e escalável para cidades inteligentes.

Um dado notável desta pesquisa é a validação da qualidade dos “pseudo-rótulos”: o modelo Student, treinado apenas com a supervisão do Teacher (sem humanos), atingiu uma performance praticamente idêntica (diferença de apenas 1,6%) à de um modelo hipotético treinado com dados perfeitamente rotulados (True Labels).

Um dos autores do artigo intitulado “Optimizing Parking Space Classification: Distilling Ensembles into Lightweight Classifiers”, publicado na ICMLA (IEEE 2024), apresentou um pouco do seu trabalho em vídeo no canal Bit Por Bit. Descubra mais no link abaixo.

Usando Redes Neurais Profundas para Quantificar o Tempo de Permanência em Estacionamentos

Este estudo propõe um método inovador para calcular o tempo de permanência de veículos em vagas de estacionamento, utilizando duas redes neurais profundas. O desafio aqui vai além de detectar a ocupação: é preciso realizar a re-identificação veicular, garantindo que o sistema saiba que o carro visto agora é o mesmo de horas atrás, apesar de mudanças na iluminação, sombras ou chuva. A primeira rede classifica se uma vaga está ocupada ou vazia, enquanto a segunda, uma rede Siamesa, verifica se o carro estacionado é o mesmo em imagens consecutivas. O sistema foi testado em um cenário cross-dataset, onde os modelos foram treinados em um conjunto de dados (PKLot) e validados em outro (CNRPark-EXT), sem usar amostras do estacionamento alvo durante o treinamento.

Os resultados mostraram que, com um classificador perfeito, o sistema atingiu 75% de previsões precisas, onde o tempo estimado coincidiu exatamente com o tempo real de permanência. No entanto, ao usar um classificador real, a precisão caiu para 49%, evidenciando que a qualidade do classificador inicial impacta significativamente o desempenho da rede Siamese. O erro médio absoluto (MAE) foi de 46 minutos para o PKLot e 54 minutos para o CNRPark-EXT.

A pesquisa conclui que a rede Siamesa é promissora para rastrear veículos ao longo do tempo, mas sua eficácia depende da precisão do classificador. Melhorias no classificador e no treinamento da rede Siamese podem aumentar a precisão do sistema, tornando-o viável para aplicações em cidades inteligentes, como detecção de carros abandonados ou estacionamento irregular.

O artigo intitulado “Using Deep Neural Networks to Quantify Parking Dwell Time” foi aceito na ICMLA (IEEE 2024).

Regularização em Redes Neurais com Reamostragem de Dados para Monitoramento Urbano Inteligente

Esse estudo propõe um novo método de regularização para redes neurais, voltado a aplicações de cidades inteligentes, como o gerenciamento de vagas de estacionamento. A técnica consiste em usar subconjuntos menores do dataset em mais época de treinamento, aplicando reamostragem dinâmica ao longo das épocas. Essa estratégia busca reduzir o overfitting e melhorar a generalização do modelo.

Foram conduzidos quatro experimentos com a arquitetura MobileNetV3-Small, utilizando os conjuntos de dados PKLot e CNRPark-EXT. O método permitiu reduzir em até 97% o número de imagens por época, mantendo acurácia média próxima de 89%.

Os resultados indicam que maior diversidade e volume de dados, como no PKLot, melhoram a robustez e reduzem o overfitting, enquanto conjuntos menores, como o CNRPark-EXT, tendem a ser mais suscetíveis a ele. Apesar disso, a reamostragem dinâmica demonstrou potencial para aumentar a eficiência e generalização em cenários com restrições computacionais.

A pesquisa conclui que o método de regularização proposto é promissor para aplicações de visão computacional em ambientes urbanos.

O artigo intitulado “Regularização em Redes Neurais com Reamostragem de Dados para Monitoramento Urbano Inteligente” foi publicado no Anais do Computer on the Beach 2025

Proposta de Modelos Leves para Classificação de Vagas de Estacionamentos em Cidades Inteligentes

Considerando o contexto de cidades inteligentes, especialmente no problema de classificação de vagas em vazia ou ocupada, o artigo aborda a necessidade de desenvolver modelos leves e eficientes, capazes de lidar com o grande volume de dados gerado por sistemas de monitoramento urbano.

O estudo sugeriu e investigou modificações na rede Hochuli, avaliando seu desempenho nos conjuntos de dados PKLot e CNRPark-EXT, com o objetivo de reduzir a complexidade do modelo sem comprometer significativamente a acurácia. A pesquisa propôs duas novas arquiteturas de redes neurais convolucionais: CustomNNSmall e CustomNNLarge, que reduziram o número de parâmetros em até 88 vezes e 34 vezes, respectivamente, em comparação à MobileNetV3-Large.

Os resultados demonstraram que, mesmo com essa drástica redução de parâmetros, as novas arquiteturas apresentaram apenas cerca de 2% menos acurácia média em relação à MobileNet. No caso da CustomNNSmall, a redução de parâmetros chegou a 88 vezes, com uma perda de apenas 1,8% de acurácia. Já a CustomNNLarge obteve resultados ainda mais consistentes, com alta estabilidade e precisão média de 95,9%, sendo uma alternativa promissora para aplicações em dispositivos de borda.

A pesquisa conclui que é possível diminuir significativamente o custo computacional mantendo alto desempenho, o que torna as redes propostas especialmente adequadas para sistemas embarcados e monitoramento urbano em larga escala.

O artigo intitulado “Proposta de Modelos Leves para Classificação de Vagas de Estacionamentos em Cidades Inteligentes” foi publicado no Anais do Computer on the Beach 2025

Investigando os problemas na diferenciação da ReLU no treinamento de modelos de Aprendizado Profundo

Nessa pesquisa, é investigado como os pontos de não diferenciabilidade em funções de ativação, em especial a ReLU, afetam o treinamento de redes neurais. Para essa análise, o trabalho compara o comportamento das redes Hochuli, e suas variações, com a MobileNetV3 em relação ao uso de funções não diferenciáveis, como a ReLU, Hardsigmoid e Hardswish e funções diferenciáveis, como a GELU, Sigmoid e Swish

O estudo mostra que a proporção entre a quantidade de ocorrências do ponto de não diferenciabilidade da ReLU sobre a quantidade total de chamadas à função de ativação é principalmente afetada pela profundidade da rede, ou seja, quanto mais profunda menor a incidência no ponto não diferenciável. Além disso, funções diferenciáveis oferecem uma convergência ligeiramente mais precoce, enquanto funções não diferenciáveis apresentam leve vantagem em velocidade de inferência. Os resultados reforçam que a escolha prática entre ReLU e alternativas diferenciáveis pode ser guiada mais por eficiência computacional do que por limitações teóricas de diferenciabilidade.

O artigo intitulado “Diferenciando o Não Diferenciável: Investigando os problemas na diferenciação da ReLU no treinamento de modelos de Aprendizado Profundo” foi publicado no Anais do Computer on the Beach 2025

Trabalhos de Conclusão de Curso

Trabalhos de Conclusão de Curso:

Nesse projeto foram gerados alguns trabalhos de conclusão de curso, além de dissertações de mestrado que estão em andamento. Dentre os trabalhos gerados, estão os seguintes:

Luza Alves, Paulo M. Otimizando a Classificação de Vagas de Estacionamento: Destilando Conjuntos em Modelos Leves. 2024. Link

Eckermann Cardoso, Erick. Impacto de Imagens Sintéticas na Classificação de Vagas de Estacionamento Usando Redes Neurais.Link

Projeto METAPKLot

Aprendizado de Máquina Aplicado em Cidades Inteligentes

Principais Tecnologias

Equipe do Projeto

Alceu de Souza Britto Jr.

Andre Hochul

Eduardo Cunha de Almeida

Luiz Eduardo S. de Oliveira

Paulo R. Lisboa de Almeida

Bruno Aquiles

Luan Kujavski

Marcelo Ribas

Heloísa Mendes

Paulo Mateus Luza

Nadia Luana Lobkov

Thamiris Yamate Fischer

Pietro Comin