Here you can find some projects that I am currently working on.
(in italian)

PROPOSTE DI TESI

Si segnala la possibilita' di svolgere tesi TRIENNALI e MAGISTRALI nell'ambito di ricerca Bioinformatica e Biologia Computazionale.
Gli argomenti proposti sono fortemente collegati con la ricerca e si collocano all'interno di collaborazioni internazionali con centri di ricerca e Universita':
l'IBM Research Center T.J. Watson, Georgia Institute of Techology, Universitat Politècnica de Catalunya, BarcelonaTech, Genome Institute of Singapore, Università di Trento etc..

Il seguente elenco non e' da considerarsi esaustivo, ulteriori argomenti possono essere concordati.
- Compressione di dati biologici, DNA reads, prodotti dai moderni sistemi di sequenziamento. Sequence Squeeze Competition

- Sviluppo di algoritmi efficienti per l'analisi ed il confronto di dati provenienti da sequenziatori di ultima generazione (Next-Generation Sequencing). Alcuni esempi di applicazioni sono:
Il clustering di sequenze di DNA DNA Read Clustering .
Confronto di Genomi sulla base dei dati ottenuti dal sequenziamento Assembly-free Genome Comparison .

- Classificazione di sequenze biologiche utilizzando tecniche di Machine Learning, Support Vector Machine, basate su pattern con errori. Un esempio di applicazione è il Metagenomic Binning.

- Sviluppo di algoritmi per il calcolo dell'Entropia di una sequenza biologica (DNA) e la successiva identificazione di regioni "importanti" dal punto di vista entropico. Entropic Profiler

- Sviluppo di algoritmi per la costruzione di alberi filogenetici e/o reti migratorie a partire da sequenze biologiche, studiando le variazione genetiche in esse contenute. Ultranet
GenoGraphic Project

- Confronto di superfici proteiche con tecniche di Computer Vision. Utilizzando la trasformata nota come Spherical Harmonic, studiare particolare porzioni della superficie di una proteina. Questa trasformata puo' essere usata per confrontare e ricercare velocemente superfici simili in proteine diverse.

- Sviluppo di algoritmi per la scoperta di pattern con errori da due gruppi di sequenze. I pattern devono comparire in un insieme di sequenze (positive examples) e non devono essere presenti nel secondo insieme (negative examples).

- Studio della distribuzione statistica di pattern ripetuti in famiglie proteiche e DNA. Sviluppo di una metodologia per l'analisi della significativita' statistica dei risultati (p-value). Analisi dell'accurattezza e dello Z-Score in funzione dei parametri utilizzati. Clustering dei dati al fine di suddividere in classi di equivalenza famiglie proteiche.