Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114514
Title: Determination of the Operation Condition of Lubricating Oils in Diesel Engines
Other Titles: Determinação da Condição de Operação dos Óleos Lubrificantes em Motores Diesel
Authors: Malaguti, Roney Camargo
Orientador: Silva, Cristóvão
Lourenço, Nuno António Marques
Keywords: Aprendizagem máquina; Dados de Óleo Lubrificante; Frotas de Veículos Diesel; Manutenção Baseada no Estado; Condition Based Maintenance; Diesel-Powered Vehicle Fleets; Lubricating Oil Data; Machine Learning; -; -
Issue Date: 6-Jul-2023
Serial title, monograph or event: Determination of the Operation Condition of Lubricating Oils in Diesel Engines
Place of publication or event: Departamento de Engenharia Mecânica da Faculdade de Ciências e Tecnologia da Universidade de Coimbra
Abstract: Diagnosis and fault prediction processes based on real data are important tools in the Condition Based Maintenance (CBM) approach for diesel vehicle fleets. Companies are equipping their vehicle fleets with a large number of sensors, which allows the collection of large amounts of data about the current condition of each asset. This allows companies to invest efforts in the development of methods to accurately identify the state of wear and tear of a piece of equipment or system, making CBM more effective and reliable. For this type of equipment condition analysis there are several techniques currently available, depending on the type of data to be collected, cost, and the need or not to use external diagnostic interfaces to analyze the condition of the vehicle. Intelligent lubricant oil analysis is one of the possible techniques for determining the condition of equipment and is therefore an important tool for fleet managers to determine the condition of heavy diesel vehicles. Because it is a relatively low-cost technique that allows the manager a clear view of the equipment's condition from real-time data collection, in this work we will present an intelligent analysis of lubricant data from 5 different vehicles, evaluating whether the variables collected make it possible to determine the condition of the lubricants and the vehicles they are used on. To this end, we initially present a study on the issues that guide the development of this work, through a literature review that presents not only pertinent information about lubricants, but also the necessary information about real-time data capture interfaces and systems based on machine learning. After analyzing the literature, presenting the hardware for real-time data collection, we confirm the importance of the study of lubricants through the analysis of common faults of heavy diesel vehicles.From the knowledge acquired by reading and analyzing the literature, we begin the analysis and organization of the collected data. We start by analyzing the missing values of the variables, the need for data balancing, Principal Component Analysis (PCA) and correlation analysis on top of the collected data. This step, is called exploratory data analysis, is important for the development of the automatic condition determination system, as well as for evaluating the need for the inclusion of new variables designed from raw data for a better determination of this operating condition. Using a solid and organized database, we developed the first supervised machine learning model based on the Random Forest (RF) classifier to determine the operating condition of lubricating oil in diesel engines. The presented results show that the selected variables have the potential to determine the running state, and that they are strongly related to the condition of the lubricant. One of the variables designed is kinematic viscosity, which is shown to play a relevant role in characterizing the condition of the vehicle. This model presented Recall results of 95.90%, an Accuracy of 97.50%, and an F1 score of 96.70%.Finally, despite having results worthy of recognition for the initial model created from the RF algorithm, we still performed an in depth study using a diverse range of algorithms and different sets of features as input data. This analysis was conducted using cross-validation, and considered the following algorithms: Logistic Regression, Perceptron, Decision Tree Classifier, Random Forest Classifier, Gradient Boosting Classifier. With this validation it is possible to demonstrate that the proposed approach is able to successfully identify the operating conditions of lubricating oil, with the predictive model Gradient Boosting Classifier with 7 variables, obtaining a Recall result of 97.90%, an Accuracy of 98.80% and an F1 score of 97.90%, even better than the model initially chosen. The cross validation also allows to identify the best combination of variables for the model.
Os processos de diagnóstico e previsão de falhas baseados em dados reais são ferramentas importantes na abordagem de Manutenção Baseada na Condição (CBM) para frotas de veículos a diesel. As empresas estão a equipar as suas frotas de veículos com um grande número de sensores, o que permite a recolha de grandes quantidades de dados sobre o estado actual de cada activo. Isto permite às empresas investir esforços no desenvolvimento de métodos para identificar com precisão o estado de desgaste de um equipamento ou sistema, tornando a CBM mais eficaz e fiável. Para este tipo de análise do estado do equipamento existem várias técnicas actualmente disponíveis, dependendo do tipo de dados a recolher, do custo e da necessidade ou não de utilizar interfaces externas de diagnóstico para analisar o estado do veículo. A análise inteligente do óleo lubrificante é uma das técnicas possíveis para determinar o estado do equipamento e é, portanto, uma ferramenta importante para os gestores de frotas para determinar o estado dos veículos pesados a diesel. Como se trata de uma técnica de custo relativamente baixo que permite ao gestor uma visão clara do estado do equipamento a partir da recolha de dados em tempo real, neste trabalho apresentaremos uma análise inteligente dos dados de lubrificantes de 5 veículos diferentes, avaliando se as variáveis recolhidas permitem determinar o estado dos lubrificantes e dos veículos em que são utilizados. Para tal, apresentamos inicialmente um estudo sobre as questões que orientam o desenvolvimento deste trabalho, através de uma revisão bibliográfica que apresenta não só a informação pertinente sobre lubrificantes, mas também a informação necessária sobre interfaces e sistemas de recolha de dados em tempo real baseados na aprendizagem de máquinas. Após análise da literatura, apresentamos o hardware para recolha de dados em tempo real e confirmamos a importância do estudo de lubrificantes através da análise de falhas comuns de veículos pesados a diesel.A partir dos conhecimentos adquiridos através da leitura e análise da literatura, iniciamos a análise e organização dos dados recolhidos. Começamos por analisar os valores em falta das variáveis, a necessidade de equilíbrio dos dados, a Análise de Componentes Principais (PCA) e a análise de correlação, para além dos dados recolhidos. Esta etapa, denominada análise exploratória de dados, é importante para o desenvolvimento do sistema de determinação automática da condição, bem como para avaliar a necessidade de inclusão de novas variáveis concebidas a partir de dados em bruto para uma melhor determinação desta condição operacional. Utilizando uma base de dados sólida e organizada, desenvolvemos o primeiro modelo de aprendizagem supervisionada de máquinas baseado no classificador Random Forest (RF) para determinar o estado de funcionamento do óleo lubrificante em motores diesel. Os resultados apresentados mostram que as variáveis seleccionadas têm o potencial de determinar o estado de funcionamento e que estão fortemente relacionadas com o estado do lubrificante. Uma das variáveis concebidas é a viscosidade cinemática, que se mostra ter um papel relevante na caracterização do estado do veículo. Este modelo apresentou resultados de Recall de 95.90%, uma Precisão de 97.50%, e uma pontuação de F1 de 96.70%.Finalmente, apesar de termos resultados dignos de reconhecimento para o modelo inicial criado a partir do algoritmo RF, ainda realizámos um estudo aprofundado utilizando uma gama diversificada de algoritmos e diferentes conjuntos de variáveis como dados de entrada. Esta análise foi conduzida utilizando a validação cruzada, e considerou os seguintes algoritmos: Regressão Logística, Perceptron, Decision Tree Classifier, Random Forest Classifier, Gradient Boosting Classifier. Com esta validação é possível demonstrar que a abordagem proposta é capaz de identificar com sucesso as condições de funcionamento do óleo lubrificante, com o modelo preditivo Gradient Boosting Classifier com 7 variáveis, obtendo um resultado Recall de 97.90%, uma Precisão de 98.80% e uma pontuação F1 de 97.90%, ainda melhor do que o modelo inicialmente escolhido. A validação cruzada permite também identificar a melhor combinação de variáveis para o modelo.
Description: Tese de Doutoramento em Engenharia Mecânica apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/114514
Rights: openAccess
Appears in Collections:UC - Teses de Doutoramento

Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons