免费成人看片_91理论片_9191成人_992tv在线成人免费观看_国产123区在线观看_久久精品国产免费

首页 娱乐 > 正文

全球新动态:MosaicML 推出 300 亿参数模型,训练成本 70 万


(相关资料图)

AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,单从参数来看,这个模型具有 300 亿参数,放在如今动则上千亿参数的模型领域中并没有什么突出的地方。但这个新模型的训练成本却只有其他模型的零头,有望扩大模型在更广泛领域的运用。

MosaicML 的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于训练 GPT-3 所需的数千万美元。此外,MPT-30B 模型的质量超过了 OpenAI 在 2020 年发布的初版 GPT-3。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并部署在本地硬件设备上。

MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往,这使得每 GPU 的吞吐量增加了 2.4 倍以上,带来更快的完成时间。

300 亿参数这是一个在大模型领域经常看到的数字,300 亿参数为什么这么特殊呢?MosaicML 首席科学家 Frankle 则解释道,首先 300 亿参数能够确保它可以在本地硬件上轻松运行,同时保持质量与 GPT-3 差不多或略优于它。

其次任何超过 300 亿参数限制的模型都需要将模型分解成多个平行段,通常也需要更加昂贵的多 GPU 设置。

除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量,以提高模型性能。他们目前正在开发工具,帮助用户在预训练过程中分层加入特定领域的数据。这确保了多样化和高质量的数据组合。将模型扩展到 300 亿参数只是 MosaicML 的第一步,接下来他们将以降低成本为前提,推出更大的、更高质量的模型。

开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在自己的硬件上用自己的数据对模型进行微调。

关键词:

最近更新

关于本站 管理团队 版权申明 网站地图 联系合作 招聘信息

Copyright © 2005-2023 创投网 - m.vdsvyglz.cn All rights reserved
联系我们:39 60 29 14 2@qq.com
皖ICP备2022009963号-3

主站蜘蛛池模板: 国产精品福利影院 | 久久精品午夜 | 精品性高朝久久久久久久 | 欧美日韩中文字幕在线 | 久久综合精品不卡一区二区 | 国产成人精品123区免费视频 | 黄色视频免费在线观看 | 亚洲有码转帖 | 国产美女视频国产视视频 | 久久久精品欧美一区二区免费 | 亚洲国产日韩一区三区 | 乌克兰少妇videos高潮 | 黄网在线免费看 | 日本人妻人人人澡人人爽 | 抽插丰满内射高潮视频 | 真实国产老熟女粗口对白 | 在线无码视频观看草草视频 | 一 级 黄 色生活片 一 级做人爱全视频在线看 | 久久久久久精 | a级国产乱理伦片在线观看 a级国产乱理论片在线观看 | 色在线视频免费 | 亚洲依依成人精品 | 无码国内精品人妻少妇 | 国产欧美精品一区二区三区-老狼 | 亚洲 欧美 小说 国产 图片 | 亚洲国产另类久久久精品网站 | 丰满熟妇乱又伦在线无码视频 | 中文字幕精品久久久久人妻红杏ⅰ | 91网站在线看| 精品国产乱码久久久久久乱码 | 欧美亚洲视频一区 | 亚洲码国产精品高潮在线 | 在线欧美精品一区二区三区 | 免费极品av一视觉盛宴 | 久久天堂av综合色无码专区 | 国产熟妇按摩3p高潮大叫 | 91九色蝌蚪91pornv在线 | 日日干干| 又色又爽又黄还免费毛片96下载 | 日韩视频在线观看免费 | 国产精品jizz在线观看老狼 |