当前位置: 首页 > news >正文

中企动力科技股份有限公司潍坊分公司河北电子商务seo

中企动力科技股份有限公司潍坊分公司,河北电子商务seo,dede网站被黑,做网站设计要注意什么问题一,关于learning rate的讨论:(1)在梯度下降的过程中,当我们发现loss的值很小的时候,这时我们可能以为gradident已经到了local min0(低谷),但是很多时候,loss很小并不是因…

一,关于learning rate的讨论:

(1)在梯度下降的过程中,当我们发现loss的值很小的时候,这时我们可能以为gradident已经到了local min=0(低谷),但是很多时候,loss很小并不是因为已经到达了低谷,而是(如下图):

如上图,当右上角的loss几乎为0时,右下角的gradient并没有趋近于0,而是出现反复的极值 ,这种情况下是因为learning rate过大,是的变化的幅度过大,是的optimisization卡在山腰(如左下角)。


(2)然而,我们指的learning rate并不是越大越好,也不是越小越好。

如上图左下角,因为learning rate过大,使得梯度跨度过大不能进入低谷到达黄色叉叉,而如果选择 learning rate过大,梯度移动缓慢,在进入低谷后在大updates之后还是难以到达黄色叉叉。


因为,我们需要一个自动化改变的learning rate,在坡度较陡的时候减小learning rate,在坡度较小的时候增大.

这时,我们想着在之前的learning rate 下加一个随i变化的δ。

δ的求法如下:
(第一种求法)δ是前面所有gradient绝对值的均方

(第二种求法) :第一种的缺点是,因为是全部平均,难以在陡的地方快速减小gradident,在缓的地方减小gradident。为此,我们添加了α权重,减少之前的梯度影响,但又保留一定的惯性。

但是呢,运行后的结果会出现:

 这是因为,在y轴方向,一开始较陡,δ较大,当左转进入较缓的低谷时,δ中的gardient不断增大,当前面的大gradient的和影响不断减小,由当前的δ占主导时,小δ使得y轴learning rate突然增大,发生沿y方向移动,之后由于遇上陡坡,learning rate减小而返回。


解决方法:让learning rate n也随着t减小(有点模拟退火的思维)

还有一个方法:进行预加热(Warm up)。

Warmup的核心思想是在训练的初始阶段,将学习率从较小的值逐步增加到预设的目标值,而不是直接使用较大的学习率。这一过程类似于“热身”,让模型在训练初期逐步适应数据分布,从而减少训练的不稳定性。

今天就学到这啦。 

http://www.ysxn.cn/news/341.html

相关文章:

  • 做gay网站违法吗seo排名怎么样
  • 网站关键字设置格式全媒体广告代理加盟
  • 网站建设结单 优帮云网店运营教学
  • 网上支付网站怎摸做百度惠生活怎么做推广
  • 百度网站数据统计怎么做怎么开设自己的网站
  • 日本a片女人和狗做的网站企业推广app
  • 电子商务网站建设的一般竞价推广账户竞价托管收费
  • 画册设计公司机构关键词优化百家号
  • 万链网站做的怎么样网站设计模板
  • 搜索引擎有哪些?网站seo站长工具
  • wordpress 建站赚钱磁力搜索引擎
  • magento wordpress integration优化大师的作用
  • 郑州网站seo外包搜索广告是什么意思
  • 中低端网站建设客户网北京十大最靠谱it培训机构
  • 阿里云上的网站建设网页在线代理翻墙
  • 襄阳棋牌网站建设重庆关键词排名推广
  • 唯品会网站开发技术分析外包公司和劳务派遣的区别
  • 有免费做门户网站吗做直销去哪里找客户
  • 做电影网站犯法吗指数工具
  • 网站开发设计师的工作b站推广入口
  • 帮别人做网站需要什么能力seo网站有哪些
  • 做电商网站有什语言好专业的seo排名优化
  • 魏县专业做网站做网站建设优化的公司排名
  • 本地建站discuz搜索引擎seo关键词优化效果
  • 找哪里做网站关键词点击排名软件
  • 网站制作最新技术网页模板免费下载
  • 手机网站建设最新报价代做百度收录排名
  • 武昌做网站哪家好广州seo外包
  • 手机上管理wordpress影视网站怎么优化关键词排名
  • 石龙做网站建网站建设