当前位置: 首页 > news >正文

网站与app的本质区别牛推网络

网站与app的本质区别,牛推网络,西宁公司官方网站建设,网站管理员是什么意思前情提要 编码器-解码器结构 如果将一个模型分为两块:编码器和解码器那么编码器-解码器结构为:编码器负责处理输入,解码器负责生成输出流程:我们先将输入送入编码器层,得到一个中间状态state,并送入解码器…

前情提要

编码器-解码器结构

  • 如果将一个模型分为两块:编码器和解码器
  • 那么编码器-解码器结构为:编码器负责处理输入,解码器负责生成输出
  • 流程:我们先将输入送入编码器层,得到一个中间状态state,并送入解码器层,和额外的输入一同处理后,得到模型的输出
    在这里插入图片描述
  • CNN就可以重新表示为下图
    在这里插入图片描述
  • RNN也可以表示为下图:
    在这里插入图片描述

Seq2seq

  • 序列到序列的模型:从一个句子生成到另一个句子
  • 模型分为编码器、解码器两部分,其中,编码器可以是一个RNN,用来读取输入句子,解码器使用另外一个RNN来输出生成的句子
  • 注意:由于在输入时,我们知道全部的输入句子,所以可以用两个RNN做双向,但是解码器是生成模型,不能看到完整的句子,所以不能做双向
  • 注意:在编码器层,通过开始<bos>、结束<eos>来控制编码器的输出
    在这里插入图片描述
  • 编码器层的输出是不会作为模型的输出,相反它最后一层的输出作为编码器层输入的一部分,和编码器层额外的输入合并,整体作为编码器层的输入,即编码器层的最后隐藏状态,作为解码器的初始隐藏状态,如下:
    在这里插入图片描述

Transformer的框架概述

  • NLP中预训练的目的:为了生成词向量
  • Transformer采用了seq2seq(序列到序列)的模型,整体框架如下:
    • seq2seq的模型基本都分为编码器层和解码器层,即从编码器到解码器的结构
      在这里插入图片描述

使用机器翻译的场景来解释

  • 在机器翻译的场景中:
    • 编码器层:把输入变成一个词向量
    • 解码器层:得到编码器层输出的词向量后,生成翻译的结果
      在这里插入图片描述
  • 同时,N * 的意思是:编码器层里面又有N个小编码器(默认N=6),一个编码器可以看作Self-Attention,而Self-Attention会对词向量做增强,经过6个编码器,那就是增强了6次
  • 编码器层最后的输出会分别给6个解码器
    在这里插入图片描述
  • 因此,Transformer的关键就在于编码器和解码器,如下:
    在这里插入图片描述
http://www.ysxn.cn/news/742.html

相关文章:

  • 网站建设公司排百度指数免费添加
  • 佛山电商网站建设深圳seo优化排名公司
  • wordpress 手机样式单页关键词优化费用
  • 工信部网站备案网址2022年最近十大新闻
  • 老客户网站建设seo导航站
  • 号码之家官网关键词优化公司网站
  • 如何用ppt做网站爱站工具包官网
  • 沈阳企业定制网站建设搜外网
  • 工业机器人技术seo下拉优化
  • 宁波网站建设优化企业推荐最近新闻摘抄50字
  • 唐山企业网站建设网络营销渠道的特点
  • 一级a做爰片凤凰网站成品网站1688入口网页版怎样
  • 用什么技术来做网站十大营销手段
  • 如何办理浙江省网站备案密码重置和备案注销安卓优化神器
  • 做网站用什么数据库好用百度快速收录网站
  • 网站建设开票计量单位搜索大全引擎地址
  • 西安网站建设昆奇优化服务平台
  • wordpress 栏目分页seo网站排名的软件
  • 炫酷网站欣赏恶意点击竞价是用的什么软件
  • 品牌建设策划方案九江seo公司
  • 建网站用的域名多少钱站长工具seo客户端
  • 自己做网站咋做可以直接进入的舆情网站
  • 网站建设软件开发工作室整站模板求购买链接
  • 如何查看一个网站做的外链站长工具网站测速
  • 收集链接 做网站最新互联网项目平台网站
  • 长沙网站网站建设seo搜索引擎优化是通过优化答案
  • 松溪网站建设微信营销模式有哪些
  • 网站空间租赁合同西安百度网站排名优化
  • 盐城网站建设案例移动广告平台
  • 做网站 0元代理手机网站