Domanda

Sono nuovo in questo campo, quindi per favore sii gentile con la terminologia. Nella carta originale; "Comprensione della difficoltà di allenamento di reti neurali profonde feedforward", Non capisco come si ottiene l'equazione 15, afferma che dando Eq 1:

$$ w_ {ij} sim u left [ - frac {1} { sqrt {n}}, frac {1} { sqrt {n}} destra] $$

dà origine alla varianza con la seguente proprietà:

$$ n*var [w] = 1/3 $$

dove $ n $ ha le dimensioni dello strato.

Come si ottiene quest'ultima equazione (15)?

Grazie!!

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top