Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/97997
Title: Computer Vision on the Edge
Other Titles: Visão computacional em Edge.
Authors: Semitela, António Filipe Correia
Orientador: Arrais, Joel Perdiz
Keywords: Visão Computacional; Deteção de Objectos; Redes Neuronais de Convolução; Redes Neuronais Profundas; Computer Vision; Deep Neural Networks; Convolution Neural Networks; Object Detection
Issue Date: 17-Nov-2021
Serial title, monograph or event: Computer Vision on the Edge
Place of publication or event: Ubiwhere
Abstract: Dado o crescimento ao longo dos anos nas capacidades de processamento de CPU e GPU eos avanços feitos na área de Deep Learning, é possível desenvolver modelos e arquiteturasde visão computacional mais complexos. Algoritmos de visão computacional estão presentese em execução em vários dispositivos e dispositivos do nosso dia-à-dia, desde carrosautónomos até o reconhecimento facial em smartphones.O objetivo deste trabalho passa por implementar uma solução eficiente que, através do usode Redes Neuronais Convolucionais e técnicas de Deep Learning, seja capaz de identificar eclassificar veículos com bom desempenho. A solução deve ser capaz de correr num EdgeHardware Device a ser colocado no SmartLamppost da Ubiwhere, um poste de luz que podeconter diferentes módulos, como câmeras e edge nodes capazes de processar dados. Será útil em tarefas como contagem e classificação de veículos que passam por uma determinadaárea, usando o feed de vídeo das câmeras.Para atingir este objetivo, diferentes abordagens foram seguidas para desenvolver o modelofinal. Desde a criação e optimização de um modelo, para a utilização de modelos pré treinados. A escolha final foi de uma estrutura de One-Stage Detectors, otimizados paravelocidade em dispositivos móveis. Como resultado, o modelo final obteve bons resultadosque alcançaram 39.36 % de mAP no dataset COCO e bons valores de inferência nodispositivo de edge.Este documento também apresenta um estudo do estado da arte na detecção e classificaçãode objetos em geral e, especificamente, sobre os diferentes modelos de detecção de objetos mais adequados para a detecção em tempo real.
Given the growth over the years in CPU and GPU processing capabilities and the advancementsmade in Deep Learning, it is now possible to develop more complex ComputerVision models and architectures. As a result, Computer Vision algorithms are presentand running in multiple devices and objects of our daily lives, from self-driving cars tosmartphone facial recognition.The goal of the present work is to implement an efficient model that can identify andclassify cars with good performance through the use of Convolutional Neural Networksand Deep Learning techniques. The solution should run on an Edge Hardware Device tobe placed in Ubiwhere’s SmartLamppost. This lamppost can contain different modules,such as cameras and edge nodes capable of processing data. It will be useful in counting andclassifying vehicles passing through a certain area, using the video feed from the cameras.To achieve this goal, different approaches were followed to develop the final model, fromcreating and optimizing a model to using pre-trained models. The final choice was a OneStage Detectors structure, optimized for speed on edge devices. As a result, the finalmodel obtained good results that reached 39.36 % of mAP in the COCO dataset and goodinference values on the edge device.This document also presents a study of state of the art in detecting and classifying objectsin general, and specifically about the different object detection models more suited forreal-time detection and the concepts that were essential for the realization of this work.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/97997
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
2021_MasterThesis_AntonioSemitela.pdf8.66 MBAdobe PDFView/Open
Show full item record

Page view(s)

78
checked on Oct 8, 2024

Download(s)

84
checked on Oct 8, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons