重塑千禧年代
首页

重塑千禧年代 第1471节

p;

“self-attention可以进行更好的并行计算能力,而不是像rnn那样进行顺序处理,它还能直接比较序列中任意两个位置的向量表示,这样就能更有效的捕捉和利用长距离依赖关系,但rnn不行!”

\n

“rnn虽然理论上也能捕捉长距离依赖,但实际上往往因梯度消失或爆炸问题而难以实现!”

\n

乌思克尔特研究的是谷歌的机器翻译改进方法,他的父亲就是计算语言学的教授,尽管刚开始进入谷歌时对语言翻译的工作很不喜欢,但最终还是专注于这一领域的研究,而他近期正在琢磨的便是“自注意力self-attention”在相关领域的改善。

\n

吴恩达很快明白这位谷歌研究员的意思,也在几经思索后给予反驳:“自注意力没有显式地编码位置信息,这就意味着如果以它为核心的模型无法区分序列中相同词语在不同位置的意义差异,而在自然语言的处理中,词语的语义又与位置紧密相关。”

\n

“而且,自注意力模型必然因为序列中每对元素计算的注意力权重而有巨大的参数量,这极可能导致过拟合。”

\n

他这边刚说话,谷歌自家dl的席尔瓦也反驳了乌思克尔特提出的新路线,其中一个重要原因在于rnn的循环结构太符合大家对序列数据处理的理解,即当前状态依赖于过去的信息,而自注意力的全局依赖一看就不如rnn直观。

\n

易科与谷歌的两大领导者都批评了自注意力self-attention,但乌思克尔特并不服气,他直接登台阐述自己更多的想法。

\n

而且,针对吴恩达与席尔瓦抨击的缺点也给出一些解决思路,比如,引入位置编码,比如,进行多头注意力的研究。

\n

有人觉得眼前一亮,有人觉得异想天开,还有人现场进行快速的分析和演算。

\n

第一排的方卓极其茫然,他扭头询问旁边沉思的英伟达掌门人黄仁勋:“他们在讨论什么

本章未完,请点击下一页继续阅读! 第5页 / 共9页

相关小说

我真没想下围棋啊! 都市 /
我真没想下围棋啊!
山中土块
本站提供(山中土块)大神最新作品我真没想下围棋啊!最新章节全文免费阅读,我真没想...
1947311字07-29
华娱从男模开始 都市 /
华娱从男模开始
河马不会叫
本站提供(河马不会叫)大神最新作品华娱从男模开始最新章节全文免费阅读,华娱从男模...
2327960字08-08
1983:弃艺从文开始的文豪 都市 /
1983:弃艺从文开始的文豪
八十老登勇闯起点
本站提供(八十老登勇闯起点)大神最新作品1983:弃艺从文开始的文豪最新章节全文免...
565093字08-12
都重生了谁考公务员啊 都市 /
都重生了谁考公务员啊
柳岸花又明
本站提供(柳岸花又明)大神最新作品都重生了谁考公务员啊最新章节全文免费阅读,都重...
3329161字08-14
重返88:从迎娶小姨子开始 都市 /
重返88:从迎娶小姨子开始
蜗牛你别跑
本站提供(蜗牛你别跑)大神最新作品重返88:从迎娶小姨子开始最新章节全文免费阅读,...
3994580字07-28
美利坚打猎:从荒野独居开始 都市 /
美利坚打猎:从荒野独居开始
秋意勾画渔火钱江
本站提供(秋意勾画渔火钱江)大神最新作品美利坚打猎:从荒野独居开始最新章节全文...
659307字08-13