Here you can find some projects that I am currently working on.
(in italian)
PROPOSTE DI TESI
Si segnala la possibilita' di svolgere tesi di laurea specialistica
nell'ambito delle attivita' di ricerca del Laboratorio di Bioinformatica Strutturale.
Gli argomenti proposti sono fortemente collegati con l'attivita' di rierca del gruppo
e si collocano all'interno di collaborazioni internazionali con centri di ricerca come
l'IBM Research Center T.J. Watson e altre universita' come la New York University e il Georgia Institute of Techology.
Il seguente elenco non e' da considerarsi esaustivo, ulteriori argomenti possono essere concordati.
- Sviluppo di algoritmi per la costruzione di alberi filogenetici e/o reti migratorie a partire da sequenze biologiche, studiando le variazione genetiche in esse contenute. GenoGraphic Project
- Classificazione di sequenze utilizzando tecniche di Machine Learning basate su sequenze con errori.
- Confronto di superfici proteiche con tecniche di Computer Vision.
Utilizzando la trasformata nota come Spherical Harmonic, studiare particolare porzioni della
superficie di una proteina. Questa trasformata puo' essere usata per confrontare
e ricercare superfici simili in proteine diverse.
- Sviluppo di algoritmi per la scoperta di motivi con errori da due gruppi di sequenze.
I motivi devono comparire in un insieme di sequenze (positive examples) e non devono essere presenti nel secondo insieme (negative examples).
- Studio di approcci alternativi alla compressione dati. Analisi delle prestazioni di BZip,
uno dei piu' performanti algortimi esistenti, e della trasformata Burrows-Wheeler.
Migliorare le prestazioni di BZip agendo sul processo di compressione e modificando
la trasformata BW.
- Sviuppo di algoritmi per l'estrazione di pattern BASE (cioe' indipendenti).
Questi pattern sono legati ad importanti problemi teorici i cui upperbound e lowerbound
sono di particolare interesse.
- Studio della distribuzione statistica di pattern ripetuti in famiglie proteiche e DNA.
Sviluppo di una metodologia per l'analisi della significativita' statistica dei risultati (p-value).
Analisi dell'accurattezza e dello Z-Score in funzione dei parametri utilizzati.
Clustering dei dati al fine di suddividere in classi di equivalenza famiglie proteiche.