Lstm параметрлер санын қалай есептейді?
Lstm параметрлер санын қалай есептейді?

Бейне: Lstm параметрлер санын қалай есептейді?

Бейне: Lstm параметрлер санын қалай есептейді?
Бейне: Совместное использование жестких параметров и совместное использование мягких параметров (многозадачное обучение в глубоком обучении) #Shorts 2024, Қараша
Anonim

Сонымен, сіздің құндылықтарыңызға сәйкес. Оны формулаға беру мынаны береді:->(n=256, m=4096), барлығы параметрлердің саны 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. саны салмақтар болып табылады 28 = 16 (бірлік_сан * бірлік_бірліктер) қайталанатын қосылымдар үшін + 12 (input_dim * сан_бірліктер) енгізу үшін.

Сондай-ақ, параметрлердің санын қалай табуға болады?

Кімге есептеу үйренуге болатын параметрлері мұнда бізге тек ені m, биіктік n пішініне көбейту және барлық осындай k сүзгілерін есепке алу ғана қалады. Сүзгілердің әрқайсысы үшін ығысу терминін ұмытпаңыз. Параметрлер саны CONV қабатында: ((m * n)+1)*k), әрбір сүзгіге қатысты ауытқу терминіне байланысты 1 қосылды.

Сол сияқты, Lstm-де қанша жасырын бірлік бар? Ан LSTM желі. Желіде бес кіріс бар бірлік , а жасырын қабат екіден тұрады LSTM жад блоктары және үш шығыс бірлік . Әрбір жад блогында төрт кіріс бар, бірақ бір ғана шығыс.

Кейіннен RNN параметрінің санын қалай табуға болады?

1 Жауап. W, U және V нысандарының барлық қадамдары ортақ RNN және бұл жалғыз параметрлері суретте сипатталған модельде. Демек параметрлер саны жаттығу кезінде үйрену керек = күңгірт(W)+dim(V)+dim(U). Сұрақтағы деректер негізінде бұл = n2+kn+nm.

Lstm неше қабаттан тұрады?

Жалпы, 2 қабаттар күрделірек ерекшеліктерді анықтау үшін жеткілікті екенін көрсетті. Көбірек қабаттар жақсырақ болуы мүмкін, бірақ жаттығу қиынырақ болуы мүмкін. Жалпы ереже бойынша – 1 жасырын қабат сияқты қарапайым есептермен жұмыс істеу және жеткілікті күрделі мүмкіндіктерді табу үшін екеуі жеткілікті.

Ұсынылған: