当前位置: 首页 > news >正文

有没有教做衣服的网站游戏交易平台

有没有教做衣服的网站,游戏交易平台,兰州需要做网站的公司有哪些,企业网站建设可以分为( )交互层次最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。 节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。 针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了…

最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。

节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。

总结链接如下:

  • 《大模型面试宝典》(2024版) 正式发布

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球


图片

大语言模型的构建过程一般分为两个阶段,即:预训练、人类对齐(对齐再细分为指令微调+基于人类反馈强化学习)

预训练-数据准备流程

图片

  1. 原始语料库:为了构建功能强大的语言模型,需要从多元化的数据源中收集海量数据来进行训练。网页、书籍、代码、对话语料是主要的预训练数据。根据来源不同,可以分为通用文本数据和专用文本数据。

  2. 数据预处理:质量过滤、敏感内容过滤、数据去重。这一环节主要通过数据的规则特征、垂直定向小模型训练识别并去除质量差、有毒性、隐私的数据。

  3. 词元化:将文本内容处理为最小基本单元,用于后续的训练准备。

预训练-Transformer模型架构

Transformer是由多层的多头注意力(Multi-head Self-attention)模块堆叠而成的神经网络模型。原始Transformer模型由编码器和解码器两个部分构成,而这两个部分实际上可以独立使用,例如基于编码器架构的BERT模型和解码器架构的GPT模型(后续文章再对Transformer进行详尽解析)

图片

指令微调

指令微调(Instruction Tuning)是指使用自然语言形式的数据对预训练后的大语言模型进行参数微调,也称为有监督微调或多任务提示训练。

指令微调的数据集构建

  1. 基于现有的NLP任务数据集构建:学术界围绕传统NLP任务(如机器翻译、文本摘要和文本分类等)发布了大量的开源数据集合,这些数据是非常重要的监督学习数据资源,可以用于指令数据集构造。

  2. 基于日常对话数据构建:用户在日常对话中的实际需求作为任务描述,与人类真实诉求较为匹配,增加数据的多样性。

  3. 基于合成数据构建:借助已有高质量指令数据作为上下文学习示例,输入给大语言模型,进而生成大量多样化的任务描述和输入-输出数据。

指令微调的训练策略

  1. 优化设置:指令微调中的优化器设置(AdamW或Adafactor)、稳定训练技巧(权重衰减和梯度剪裁)和训练技术(3D并行、ZeRO和混合精度训练)都与预训练保持阶段一致,可以完全沿用。下面列出指令微调与预训练的不同之处。

  2. 数据组织:平衡数据分布

  3. 参数高效微调:如 低秩适配微调方法、适配器微调、前缀微调(这里我们也留到后文进行详细介绍,本文优先关注整体流程)

人类对齐RM/RL(强化学习阶段)

人类对齐是一个较为抽象的概念,难以直接进行形式化建模,代表性的是有用性(Helpfulness)、诚实性(Honesty)和无害性(Harmlessness),主要由以下两个阶段

奖励模型训练

这一步是使用人类反馈数据训练奖励模型

首先,使用语言模型针对任务指令生成一定数量的候选输出

然后,邀请标注员对于输出文本进行偏好标注(形式多种)

最后,使用偏好数据进行奖励模型的训练,使其建模人类偏好。

强化学习训练

这一步,语言模型对齐被转化为一个强化学习问题。具体来说:

待对齐语言模型担任策略实施者角色(称为策略模型),它接收提示作为输入并返回输出文本,其动作空间是词汇表中所有词元,状态指的是当前已生成的词元序列。

奖励模型则根据当前语言模型的状态提供相应的奖励分数,用于指导策略模型的优化。

为了避免当前训练轮次的语言模型明显偏离初始(强化学习训练之前)的语言模型,通常会在原始优化目标中加入一个惩罚项(如KL离散度)

例如:Instruct GPT使用PPO算法来优化待对齐语言模型,以最大化奖励模型的奖励。对于每个输入提示,InstructGPT计算当前语言模型与初始语言模型生成结果之间的KL离散度作为惩罚项。KL散度越大,意味着当前语言模型越偏离初始语言模型。

http://www.jinmujx.cn/news/111742.html

相关文章:

  • 百度做的网站和其他网站的区别南京百度快速排名优化
  • 上海市建设工程 安全协会网站怎么可以让百度快速收录视频
  • 做策划的网站网络营销的工具有哪些
  • vue做的小网站全球网站排行榜
  • 购物中心网站建设西安网红
  • 网站推广什么意思交易链接大全
  • 云服务器做网站新手教程网络营销形式
  • 外贸cms 网站免费seo软件推荐
  • 有个网站专做品牌 而且价格便宜淘宝数据分析工具
  • 怎么做淘宝客网站页面宁波seo网络推广咨询热线
  • 深圳品牌做网站公司有哪些网络服务器有哪些
  • 更换wordpress登录界面深圳英文站seo
  • 湖北营销型网站建设seo数据优化
  • 怎么修改WordPress文件結構seo 资料包怎么获得
  • 做网站一定要实名认证吗流量精灵
  • 网络游戏端游郑州优化网站公司
  • 齐河网站建设公司网络营销的优势与不足
  • 自适应网站wordpress推广app用什么平台比较好
  • 融媒体中心 党政网站的建设广州seo网站优化培训
  • 阿里巴巴网站开发seo关键词排名软件流量词
  • 网站风格分类百度云登录首页
  • 微网站自己怎么做品牌营销策划公司哪家好
  • 建设一个网站的支出杭州seo按天计费
  • 软件开发培训机构价格上海seo优化外包公司
  • 高端品牌全屋定制成都自动seo
  • 做钓鱼网站会被抓吗百度竞价排名平台
  • 吴江城乡建设局网站产品软文代写
  • 一个网站能放多少关键词周口网络推广哪家好
  • 福州家园网新河seo怎么做整站排名
  • 锦州网站建设哪家好sem是什么方法