vault backup: 2025-01-04 16:30:37

This commit is contained in:
Marco Realacci 2025-01-04 16:30:37 +01:00
parent c4a223f25d
commit 89bdca19a6
8 changed files with 125 additions and 62 deletions

View file

@ -67,7 +67,7 @@ parallel combination of the two vectors:
- step 1: transform vectors in unitary vectors (dividing them by their L2 norm)
- step 2: weighted combination through the coefficient $\theta$, based on the lenght of X and Y
- we can then use X as the real part and Y as the imaginary part of the final vector
- **further feature processing:*
- **further feature processing:**
- using linear techniques like PCA, L-L expansion, LDA
##### Feature level fusion: CCA

View file

@ -210,9 +210,9 @@ Le rotazioni modificano l'LBP.
### Classificazioni di sistemi di riconoscimento facciale
- **Metodi basati sull'apparenza della faccia (global/holistic appearance methods):** PCA, LDA, alcune reti neurali. Utilizzano l'immagine per intero invece di concentrarsi solo su alcune regioni, non perdendo informazioni da subito. Svantaggi: danno la stessa importanza ad ogni pixel, necessitano di alta correlazione tra training e test set, non performano bene su grandi variazioni PIE.
- **Metodi basati su feature locali:** EBGM, LBP. Sono robusti a varianze di posizione in quanto vengono prima individuati i punti da cui estrarre le feature, e inoltre sono computazionalmente veloci. Come principale svantaggio hanno la scelta a priori dei punti da cui estrarre le feature, se non sono molto discriminativi le performance saranno pessime.
- **Sistemi basati su grafi:** a ogni faccia è associato un grafo, dove ogni nodo corrisponde a punti discriminativi della faccia. Ottimi dal punto di vista di variazioni di posizione e illuminazione. Train e test molto lunghi.
- **Sistemi basati su grafi:** a ogni faccia è associato un grafo, dove ogni nodo corrisponde a punti discriminativi della faccia. Ottimi dal punto di vista di variazioni di posizione e illuminazione. Train e test molto lunghi.
- **Sistemi basati su immagini termografiche o a infrarossi:** ottimi per quanto riguarda variazioni di illuminazione, però richiedono attrezzatura adeguata e la temperatura misurata varia in base allo stato del soggetto. Molto sensibili ai movimenti.
- **Reti neurali:** mirano a simulare il modo in cui funzionano i neuroni del cervello. Ogni neurone è rappresentato da una funzione matematica, approccio ideale: usare un neurone per pixel ma richiede tantissimi neuroni. Quindi spesso si usa una rete per estrarre feature dall'immagine / comprimere l'immagine e poi una rete per la recognition effettiva. Sono molto robuste ma richiedono un training set molto grande. Altri possibili problemi: overfitting, overtraining (non generalizza), diventano inefficienti all'aumentare del numero di soggetti nel database.
- **Reti neurali:** mirano a simulare il modo in cui funzionano i neuroni del cervello. Ogni neurone è rappresentato da una funzione matematica, approccio ideale: usare un neurone per pixel ma richiede tantissimi neuroni. Quindi spesso si usa una rete per estrarre feature dall'immagine / comprimere l'immagine e poi una rete per la recognition effettiva. Sono molto robuste ma richiedono un training set molto grande. Altri possibili problemi: overfitting (the network has the same dimension of the input), overtraining (non generalizza più), diventano inefficienti all'aumentare del numero di soggetti nel database.
###### Overfitting
Quando la rete ha troppi parametri rispetto alla dimensione dell'input.

View file

@ -58,7 +58,7 @@ Viene poi applicato $LBP^{u_{2}}_{8,1}$ sulla faccia normalizzata e la risultant
Vengono raccolti insieme gli istogrammi locali da 59 bin per ogni regione e viene prodotto l'istogramma finale, da 531 bin.
Viene fatta la stessa cosa con $LBP^{u_{2}}_{8,2}$ e $LBP^{u_{3}}_{8,2}$ e gli istogrammi vengono aggiunti all'istogramma finale da 531 bin. Infine l'istogramma viene dato in input alla SVM per la classificazione.
Viene fatta la stessa cosa con $LBP^{u_{2}}_{8,2}$ e $LBP^{u_{3}}_{16,2}$ e gli istogrammi vengono aggiunti all'istogramma finale da 531 bin. Infine l'istogramma viene dato in input alla SVM per la classificazione.
### Kose, Dugelay - Captured-Recaptured
basato su Rotation invariant LBP (LBPV) e DoG: