何恺明“残差之父”身份被挑战LSTM之父向何恺明开炮残差网络ResNet的“奠基

量子位看科技 2025-10-19 15:52:15

何恺明“残差之父”身份被挑战LSTM之父向何恺明开炮

残差网络ResNet的“奠基人”何恺明,被挑战了。

这次不是别人,正是LSTM之父Jürgen Schmidhuber。他不是为自己发声,而是替LSTM另一位作者Sepp Hochreiter鸣不平:

早在1991年,Hochreiter在博士论文中就提出过“循环残差连接”解决梯度消失问题,核心机制就是——单元自连接、权重为1.0,误差信号不会消失,理论上就是最早的残差学习结构。

这个思想后来被发展成了LSTM的核心机制,也就是恒定误差轮盘(CEC),再加上遗忘门之后演化成vanilla LSTM。

接着是2005年,LSTM被“展开”成前馈神经网络,奠定了深度网络基础。

2015年,Highway网络横空出世,用“门控残差”首次突破百层深度。

ResNet则在同年年末爆火,把残差连接彻底带入主流视野。

但Jürgen强调,这三者的残差机制内核是一样的:都是基于“1.0权重恒等连接”,只是表达形式不同。

更进一步,ResNet其实可以被视为“门恒为1的Highway网络”,而Highway本身又是前馈版的LSTM。

换句话说,如果追根溯源,残差网络真正的源头——可能得追溯到30年前的LSTM论文原型。

不过这也是Jürgen一贯的风格。他之前就曾表示,AlexNet、VGG、GAN、Transformer都“受他实验室启发”,引发不少争议。

网友调侃:Schmidhuber is all you need.

看来,这场“AI功劳簿”的争议还远远没完。

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注