您好,欢迎访问一九零五行业门户网

130亿参数,8个A100训练,UC伯克利发布对话模型Koala

自从 meta 发布并开源了 llama 系列模型,来自斯坦福大学、uc 伯克利等机构的研究者们纷纷在 llama 的基础上进行「二创」,先后推出了 alpaca、vicuna 等多个「羊驼」大模型。
羊驼已然成为开源社区的新晋顶流。由于「二创」过于丰富,生物学羊驼属的英文单词都快不够用了,但是用其他动物的名字给大模型命名也是可以的。
最近,uc 伯克利的伯克利人工智能研究院(bair)发布了一个可以在消费级 gpu 上运行的对话模型 koala(直译为考拉)。koala 使用从网络收集的对话数据对 llama 模型进行微调。
项目地址:https://bair.berkeley.edu/blog/2023/04/03/koala/
koala 已经推出线上测试 demo:
demo 地址:https://chat.lmsys.org/?model=koala-13b开源地址:https://github.com/young-geng/easylmkoala 概述与 vicuna 类似,koala 也使用从网络收集的对话数据对 llama 模型进行微调,其中重点关注与 chatgpt 等闭源大模型对话的公开数据。
研究团队表示,koala 模型在 easylm 中使用 jax/flax 实现,并在配备 8 个 a100 gpu 的单个 nvidia dgx 服务器上训练 koala 模型。完成 2 个 epoch 的训练需要 6 个小时。在公共云计算平台上,进行此类训练的成本通常低于 100 美元。
研究团队将 koala 与 chatgpt 和斯坦福大学的 alpaca 进行了实验比较,结果表明:具有 130 亿参数的 koala-13b 可以有效地响应各种用户查询,生成的响应通常优于 alpaca,并且在超过一半的情况下与 chatgpt 性能相当。
koala 最重要的意义是它表明:在质量较高的数据集上进行训练,那么小到可以在本地运行的模型也可以获得类似大模型的优秀性能。这意味着开源社区应该更加努力地管理高质量数据集,因为这可能比简单地增加现有系统的规模更能实现安全、真实和强大的模型。从这个角度看,koala 是 chatgpt 一种小而精的平替。
不过,koala 还只是一个研究原型,在内容、安全性和可靠性方面仍然存在重大缺陷,也不应用于研究之外的任何用途。
数据集和训练构建对话模型的主要障碍是管理训练数据。chatgpt、bard、bing chat 和 claude 等大型对话模型都使用带有大量人工注释的专有数据集。为了构建 koala 的训练数据集,研究团队从网络和公共数据集中收集对话数据并整理,其中包含用户公开分享的与大型语言模型(例如 chatgpt)对话的数据。
不同于其他模型尽可能多地抓取网络数据来最大化数据集,koala 是专注于收集小型高质量数据集,包括公共数据集中的问答部分、人类反馈(正面和负面)以及与现有语言模型的对话。具体而言,koala 的训练数据集包括如下几个部分:
chatgpt 蒸馏数据:
公开可用的与 chatgpt 对话数据(sharegpt);human chatgpt 比较语料库 (hc3),其中同时使用来自 hc3 数据集的人类和 chatgpt 响应。开源数据:
open instruction generalist (oig);斯坦福 alpaca 模型使用的数据集;anthropic hh;openai webgpt;openai summarization。实验与评估该研究进行了一项人工评估,将 koala-all 与 koala-distill、alpaca 和 chatgpt 几个模型的生成结果进行比较,结果如下图所示。其中,使用两个不同的数据集进行测试,一个是斯坦福的 alpaca 测试集,其中包括 180 个测试查询(alpaca test set),另一个是 koala test set。
总的来说,koala 模型足以展示 llm 的许多功能,同时又足够小,方便进行微调或在计算资源有限的情况下使用。研究团队希望 koala 模型成为未来大型语言模型学术研究的有用平台,潜在的研究应用方向可能包括:
安全性和对齐:koala 允许进一步研究语言模型的安全性并更好地与人类意图保持一致。模型偏差:koala 使我们能够更好地理解大型语言模型的偏差,深入研究对话数据集的质量问题,最终有助于改进大型语言模型的性能。理解大型语言模型:由于 koala 模型可以在相对便宜的消费级 gpu 上运行,并且执行多种任务,因此 koala 使我们能够更好地检查和理解对话语言模型的内部结构,使语言模型更具可解释性。以上就是130亿参数,8个a100训练,uc伯克利发布对话模型koala的详细内容。
其它类似信息

推荐信息