Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/33211
Title: Evolutionary computation systems for biological data analysis: Protein Family Class Prediction with Particle Swarm Optimization
Authors: Velho, Luana José Guardado Perpétuo 
Orientador: Pereira, Carlos
Dourado, António
Keywords: Engenharia biomédica; Bioquímica; Proteínas; Metabolismo; Computação; Terapia
Issue Date: Sep-2016
Serial title, monograph or event: Evolutionary computation systems for biological data analysis: Protein Family Class Prediction with Particle Swarm Optimization
Place of publication or event: Coimbra
Abstract: As proteínas são macromoléculas formadas por aminoácidos e possuem diversas funções bioquímicas. Consequentemente, estão presentes nas mais importantes reações metabólicas a nível celular. Assim sendo ao saber quais as principais funções de novas sequencias proteicas é possível controlar diversas vias metabólicas ou ainda reações especificas a certos estímulos, e assim é possível ter acesso a diferentes procedimentos com fins terapêuticos. Logo é essencial a criação de ferramentas computacionais capazes de identificar a funções bioquímicas e a aplicabilidade de proteínas conhecidas. Nesta tese é proposto um método de extração e seleção de atributos a partir da estrutura primária de proteínas de forma a aumentar a eficiência de previsão das suas classes de famílias. A extração de atributos consiste numa meticulosa e diferenciada análise de todas as possíveis subsequências de aminoácidos que podem estar presentes nas proteínas selecionadas. Para cada subsequência é atribuída um conjunto de diferentes valores com significância estatística conforme o seu comprimento, alta ou baixa frequência, e ainda a ordem em que os aminoácidos estão presentes de forma consecutiva ou não na proteína (Scoring). Já a seleção constitui na escolha das subsequências que apresentem os maiores valores em cada um dos parâmetros salientados anteriormente (MaxScoring) de forma a inicializar as partículas no Particle Swarm Optimization. Foram escolhidos dois conjuntos de proteínas, com características diferentes, sendo que em ambos foi possível provar que a nova metodologia consegue melhorar a classificação das classes de famílias de proteínas baseada em SVM quando comparada com outros métodos mais comuns. Os melhores resultados obtidos apresentam um valor médio de AUC acima de 0.80 e, nos dois conjuntos é observada uma melhoria acima de 10 % em relação ao de Amino Acid Composition (AAC) e de 20% quando comparado com Pseudo Amino Acid Composition (Pse-AAC) e Amphiphilic Pseudo Amino Acid Composition (Am-Pse-AAC).
URI: http://hdl.handle.net/10316/33211
Rights: openAccess
Appears in Collections:FCTUC Física - Teses de Mestrado
UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Dissertation_ Luana Velho_2016 .pdf2.82 MBAdobe PDFView/Open
Show full item record

Page view(s) 50

416
checked on Dec 5, 2022

Download(s)

266
checked on Dec 5, 2022

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.