lstm分类模型_模型有哪两种

lstm分类模型_模型有哪两种介绍LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorizedLSTM(FLSTM)以及groupLSTM(GLSTM)。FLSTMFLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。LSTM模型简单介绍在LST…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

#介绍
LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorized LSTM(FLSTM)以及group LSTM(GLSTM)。
#FLSTM
FLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。
##LSTM模型简单介绍
在LSTM网络中,
这里写图片描述
其中 x t x_t xt表示输入, h t h_t ht表示cell state, c t c_t ct表示cell memory。
令cell gates(i,f,o,g)可以计算为:
这里写图片描述
其中 x t ∈ R p , h t ∈ R p . a n d T : R 2 p → R 4 n x_t \in R^p,h_t \in R^p.and T:R^{2p} \rightarrow R^{4n} xtRp,htRp.andT:R2pR4n是一个仿射变换 T = W ∗ [ x t , h t − 1 ] + b T = W * [x_t,h_{t-1}] + b T=W[xt,ht1]+b,则 h t ∈ R p , c t ∈ R n 可 以 用 下 面 的 等 式 计 算 h_t \in R^p,c_t \in R^n 可以用下面的等式计算 htRp,ctRn
这里写图片描述
其中, P : R n → R p P : R^n \rightarrow R^p P:RnRp是一个线性的映射,这里主要的计算量是在仿射变换T,由于其涉及到4n2p的矩阵W,因此,FLSTM网络主要减少W的参数。
##优化方法
在FLSTM网络中,主要是将矩阵W转化为两个矩阵,可以近似为 W ≈ W 2 ∗ W 1 W \approx W_2 * W_1 WW2W1,其中 W 1 W_1 W1大小为2p
r,$ W_2KaTeX parse error: Expected ‘EOF’, got ‘#’ at position 258: …=/dissolve/70) #̲GLSTM GLSTM主要是将…x_t 以 及 隐 藏 层 以及隐藏层 h_t 可 以 被 分 到 不 同 的 独 立 的 组 中 。 例 如 , 如 果 有 两 个 组 , 则 可以被分到不同的独立的组中。例如,如果有两个组,则 x_t 和 和 h_t 能 够 有 效 的 被 分 成 两 个 向 量 , 能够有效的被分成两个向量, x_t = (x_t1,x_t2) 和 和 h_t = (h_t1,h_t2) , 其 中 ,其中 h_ti$仅依靠$x_ti,h_{t-1}^i$以及cell memory state。因此,分为k个组的公式可以表示为:
这里写图片描述

其中, T j T^j Tj是组j的从 R 2 p / k 到 R 4 n / k R^{2p/k} 到 R^{4n/k} R2p/kR4n/k的放射变换,组T有 k ∗ 4 n ∗ 2 p k ∗ k k*\frac{4n*2p}{k*k} kkk4n2p个参数,这种结构适合并行计算,因为每个组的计算都是独立的。具体结构如图1所示。
#实验结果

这里写图片描述

这里写图片描述

#源码
https://github.com/okuchaiev/f-lm

参考文献:
factorization tricks for lstm networks

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/195389.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号