Home

L'elaborazione delle immagini e' uno dei miei principali campi di interesse. L'applicazione delle tecniche e' tra le piu' vaste che si possano pensare: robotica, medicina, sistemi real-time e multimedialita' sono solo alcune di queste.
Quello che segue puo' essere suddiviso in due principali aree; la prima riguarda le elaborazioni, il riconoscimento e l'analisi delle immagini indipendentemente dal contesto di applicazione mentre la seconda si indirizza maggiormente a particolari e specifici usi di alcune ed altre di queste tecniche.

Nella prima area descrivo e implemento tecniche con le quali e' possibile, a partire da immagini statiche o sequenze video, correggere eventuali errori di campionamento, riconoscere ed evidenziare i bordi (edge) degli oggetti presenti, stimare la distanza degli oggetti, modellare e ricreare analiticamente le luci di una scena, rilevare il moto degli oggetti, riconoscere e categorizzare oggetti presenti.

Nella seconda area sono presenti due studi che rientrano in piu' vasti progetti di ricerca: il primo riguarda una possibile tecnica per l'individuazione e la localizzazione di "testo" in sequenza video reali (televisione) ed e' stato svolto in un Intensive Program (IP2000) a cui ho partecipato a Lione in Francia. Il secondo e' indirizzato al riconoscimento di pedoni in sequenze video generate da due telecamere poste all'interno di un'automobile "autonoma" e rientra nel progetto ARGO dell'Universita' di Parma e Pavia in collaborazione con il Consiglio Nazionale delle Ricerche (CNR - Progetto Finalizzato Trasporti II).

 

Area 1 - Tecniche di elaborazione delle immagini -
Metodi per la correzione dell'errore sulle immagini & Edge Detection
Per risolvere il problema della correzione delle immagini dobbiamo utilizzare dei metodi locali ovvero metodi che tengono conto del peso di una zona relativamente ampia nell'intorno del pixel considerato. L'idea base di questi metodi č quella di cercare di uniformare il colore . Si cerca cioč il colore con piu "peso" nell'intorno del pixel considerato che verra' poi sostituito in quest'ultimo. Il modo di scegliere i "pesi" differenzia i metodi.
La seconda parte del do
cumento č rivolta allo studio e la valutazione di alcuni dei principali operatori di edge detection (rivelatori di contorno) e verranno presi in considerazione metodi differenziali del primo e del secondo ordine.

Stima della profondita' mediante immagini stereo
Da una singola immagine e' possibile ricavare una grande quantita' di dati tra cui la posizione spaziale di un oggetto. Diverse tecniche si basano sulla visione mono-oculare che fornisce una singola (tele)camera.
Tecniche piu avanzate e raffinate si basano invece sulla visione stereoscopica; in questa maniera si simula il comportamento dell'occhio umano che distingue le distanze prendendo informazioni mediante due punti di vista differenti. Se si volessero misurazioni ancora piu' accurate e' possibile introdurre un numero superiore di punti di vista. Nella trattazione prenderemo in considerazione esclusivamente il caso bi-oculare.

Modelli di Illuminazione
Una nuova possibilita' introdotta dall'utilizzo delle nuove tecnologie e' quella di poter costruire mondi virtuali che possono essere piu' o meno fantasiosi ma ad ogni modo, sempre con una stretta inerenza con le leggi fisiche del mondo reale. Un ruolo importante, nel tentativo di rendere il piu' verosimile possibile un oggetto sintetico, lo giocano le luci della scena e il modo in cui, a seconda del materiale e della posizione, gli oggetti riflettono i raggi luminosi.
In questo documento, come si puo immaginare, studieremo quali tecniche utilizzare per raggiungere questo scopo.
Negli anni, diversi algoritmi sono stati introdotti, dai piu' semplici e intuitivi ai piu' computazionalmente pesanti e realistici; studieremo i principi di queste tecniche partendo da una semplice superficie opaca e proseguendo considerando oggetti riflettenti per giungere infine al modello di Phong.

Rilevamento del moto mediante Optical Flow
Data una sequenza di immagini e' possibile ricavare una grande quantita' di informazioni spesso in maniera piu' semplice che non usando un'immagine "statica", come ad esempio rilevare un oggetto che si e' spostato o calcolarne la posizione spaziale.
Scopo di questo lavoro e' quello di rilevare il movimento degli oggetti in una scena attraverso la tecnica nota come optical flow.

Riconoscimento di forme : Trasformata di Hough
Nel campo dell'elaborazione delle immagini, e piu' specificatamente nel riconoscimento delle forme, e' importante considerare il contesto del problema: in un'applicazione OCR due simboli (N Z) devono risultare "diversi" (ed essere riconosciuti come le due distinte lettere 'Z' ed 'N') mentre, per un'applicazione industriale utilizzata su un robot d'assemblaggio, le due forme devono essere riconosciute come un unico oggetto ma disposto in due modi differenti. Una tecnica alternativa ad altre che verranno brevemente descritte e' basata sulla trasformata di Hough che permette il riconoscimento di segmenti, curve e forme prestabilite, e si basa sulla trasformazione di tutti i punti costituenti una immagine, in punti di un nuovo spazio detto spazio dei parametri.

 

Area 2 - Progetti -

Directional multiresolution detection and localisation of text in videos
Il contesto e' quello di sistemi per la ricerca di informazioni in grandi database per i network televisivi mondiali nei quali, il testo presente nei video digitali puo' contenere importanti informazioni per la loro catalogazione automatica e la successiva ricerca. E' ormai da parecchi anni infatti che le principali compagnie televisive mantengono imponenti database dei programmi trasmessi. Il problema da affrontare e' la creazione di un sistema intelligente di browsing che sia in grado, fornita in input una certa informazione, di ricercare ed estrapolare i video in cui tale informazione risiede.
Il testo (superimposto e non) presente in una trasmissione e' spesso molto significativo del contesto e per tale motivo si cerca di riconoscerlo ed estrarlo correttamente per essere archiviato assieme al video. Si prenda ad esempio al gioco del Lotto: come e' possibile sapere quando e' stata estratta una certa combinazione negli scorsi anni ? L'operatore dovrebbe visionare gran parte delle registrazioni in archivio; lo scopo e' quello di automatizzare tale processo in modo che il sistema stesso, all'atto della memorizzazione, elabori il video, estragga ed archivi il testo presente (nell'esempio la sequenza dei numeri).

Pedestrain Detection
Automatic Vehicle Driving (AVD) è un termine generico utilizzato per indicare l'insieme delle tecniche mirate ad automatizzare, totalmente o in parte, una o più mansioni di guida. Le diverse funzioni che possono venire automatizzate nella guida di un veicolo sono: la capacità di seguire la strada, di mantenere un'adeguata distanza di sicurezza tra i veicoli, di regolare la velocità di crociera in base alle condizioni di traffico ed alle caratteristiche della viabilità, di aiutare il conducente nel trovare la via ottimale per arrivare a destinazione, la mobilità, il parcheggio in situazioni urbane complesse. Non da meno sono fondamentali tecniche per il riconoscimento di ostacoli, della carreggiata, di altri veicoli, di motociclette e di pedoni. Questo lavoro focalizza l'attenzione sull'ultimo aspetto cioe' il riconoscimento dei pedoni nella scena ripresa da due telecamere poste a bordo del veicolo. Il lavoro rientra in un piu' vasto progetto accademico per il veicolo autonomo ARGO del quale, per un maggior approfondimento, rimando alla sua homepage.
Meccanica Cerebrale - La meccanizzazione della percezione visiva
"Questo scritto è un passo verso l'ambizioso scopo di comprendere il funzionamento del cervello, perlomeno nelle sue attività razionali, attraverso la sua meccanizzazione.
Pubblico, per il momento, solo una parte dello studio che ho svolto finora relativa alla simulazione della percezione visiva che, come spiegherò fin dalle prime pagine, ritengo l'argomento più importate di tutto il progetto. La simulazione avviene attraverso un modello del sistema visivo che combina le conoscenze della neurofisiologia e della pscicofisica . Ha quindi forti rampini nel reale e vuole essere Human-like." Sergio Beva