科研系学霸
首页

第67章 Q&A

“首先,我们将‘被压缩的AI模型’与‘负责调教的AI元模型’之间的关系,形式化为一个非零和合作博弈。

‘被压缩的AI模型’选择一组模型参数θ目标是在给定的压缩约束下最小化任务损失函数

L_task(θ),

而‘负责调教的AI元模型’选择一种压缩策略φ,目标是最小化一个元损失函数

L_meta(φ,θ),

这样就能得到一个组合的惩罚项,也就是一般模型里的损失函数L_meta(φ,θ)=

L_task(θ')+λ*

R(φ),

我们并不追求一个无限递归的最优,而是试图找到一个平衡,这正是一个纳什均衡点的概念。

之后我设计了一个交替优化算法来逼近这个均衡点,其迭代过程可以假设地抽象为一个映射T:(θ_k,φ_k)->(θ_{k+1},φ_{k+1})

......

经过以上的过程,我们就可以证明T确实是压缩映射,根据Banach不动点定理,

这个映射就存在唯一的不动点,并且无论从任何初始点开始迭代,

该算法都会以线性收敛速度全局收敛到这个唯一的不动点(θ*,φ*)。

而这个不动点正是我们寻求的纳什均衡。”

其实说到一半的时候大部分人就已经跟不上周昀的思路了,毕竟不是数学系的,

对于这种数学证明,大部分人都不是特别擅长,更别说周

本章未完,请点击下一页继续阅读! 第4页 / 共5页

相关小说

神明调查报告 网游 /
神明调查报告
黑山老鬼
本站提供(黑山老鬼)大神最新作品神明调查报告最新章节全文免费阅读,神明调查报告讲...
609107字09-01
异度旅社 网游 /
异度旅社
远瞳
本站提供(远瞳)大神最新作品异度旅社最新章节全文免费阅读,异度旅社讲述的是在日常...
1668337字09-04
黄泉逆行 网游 /
黄泉逆行
踏浪寻舟
本站提供(踏浪寻舟)大神最新作品黄泉逆行最新章节全文免费阅读,黄泉逆行讲述的是灾...
5589113字09-04
我在异世封神 网游 /
我在异世封神
莞尔wr
本站提供(莞尔wr)大神最新作品我在异世封神最新章节全文免费阅读,我在异世封神讲述...
6371019字09-05
重生2013:超级科技帝国 网游 /
重生2013:超级科技帝国
昭灵驷玉
本站提供(昭灵驷玉)大神最新作品重生2013:超级科技帝国最新章节全文免费阅读,重生...
575276字09-04
伪像报告 网游 /
伪像报告
须尾俱全
本站提供(须尾俱全)大神最新作品伪像报告最新章节全文免费阅读,伪像报告讲述的是全...
1198000字08-20