Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术

2023-08-30 10:12:21 站长之家

【资料图】

编程客栈() 8月30日消息:Stability AI 是图像生成 AIStable Diffusion 的开发商，其最近推出了开放访问的语言模型 Stable Beluga 的基于 Web 的聊天界面 Stable Chat。在发布时，Stable Beluga 是 HuggingFace 排行榜上表现最好的开放大型语言模型（LLM）。

Stable Beluga 基于 Meta 发布的 LLaMA 基础模型，并使用由 GPT-4 生成的合成数据集进行微调。最大的Stable Beluga 模型包含 70B 个参数，在多个基准测试中优于 ChatGPT，包括 AGIEval，该测试基于 LSAT 和 SAT 等常见考试。为了帮助评估Stable Beluga，Stability AI 创建了Stable Chat Web 界面来帮助用户与模型交互并对其输出提供反馈。根据 Stability AI：

Stable Beluga 模型受到微软关于 Orca 论文启发而产生，该论文介绍了一种称为解释微调（explanation tuning）的技术。像指导微调（instruction tuning）一样，最近许多开放 LLM 都使用了这种技术，包括 ChatGPT 和 Vicuna。

解释微调使用由教师生成的示例输入和期望模型输出的数据集。在 ChatGPT 的情况下，教师是实际使用该模型的人类用户。相比之下，在 Orca 和 Stable Beluga 中，解释微调数据集是通过提示 GPT-4 解释为什么会生成它所做出的输出来生成的内容。

Stability AI 创建了自己的 600,000 个示例组成的解释微调数据集——只有微软数据集大小十分之一。然后他们训练了两个版本 Stable Beluga：基于 65B 参数原始 LLaMA 模型的 Stable Beluga 1 和基于 70B Llama 2 模型的 Stable Beluga 2。两者均以非商业许可证发布。尽管这些模型在发布时在排行榜上取得第四名和第一名，但目前基于 LLaMA 进行微调模型已经推动 Stable Beluga 2 退出前十名，并将 Stable Beluga 1 甩到更低位置。

根据 Stability AI 公司表示，这些模型以非商业许可证发布旨在鼓励研究人员协作迭代并改进技术。然而，该公司指出，这需要超出普通研究人员的资源，并决定创建 Stable Chat 网站。用户可以创建免费登录或使用 Google 帐户访问聊天界面。模型的响应可以被投票、反对或标记；这些用户反馈将用于未来改进模型。

另外，Stability AI 最近还宣布他们的 LLM 将在 DEF CON 31 举办的 AI 红队活动中使用android。此次活动由白宫赞助，涵盖了「Anthropic，谷歌， pythonHugging Face，微软，英伟达，编程客栈OpenAI 和 Stability AI」，目标是帮助识别模型中的风险和漏洞。

访问 Stable Chat：

https://research.stability.ai/chat

关键词：

责任编辑：宋璟

Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术

相关新闻

Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术

中国移动副总经理高同庆：治用并举，开创数据价值释放新局面

那英又缺席，一个月内第二次

云梦看利川：百年老屋打造新民宿新房老屋让山村更美丽诱人

金山wifi共享精灵（如何使用金山共享文档）

晋商银行(02558.HK)委任李燕斌为董事会秘书

国家标准委等部门联合印发《关于推进畜禽粪污资源化利用标准体系建设的指导意见》

正和生态龙虎榜数据（8月29日）

“百万青年看祖国”港澳台实习生广东行举办

依法不认定为犯罪或者不按犯罪处理的26种情形

兴业银锡上半年实现营收12.46亿元银锡产量有望持续增长

电脑主机声音大怎么办电脑主机声音大处理方法

南京新辟5条公交接驳线路 9月1日起正式运行

2023年8月29日十二星座运势

三星笔记本电脑键盘错乱怎么解决（三星笔记本电脑键盘错乱）

新零售板块8月28日涨0.8%，我乐家居领涨，主力资金净流出2.73亿元

可靠股份: 关于使用闲置募集资金进行现金管理的公告

赵环宇：幸灾乐祸别人死亡之组&打不好贬低男篮我看不到热爱

eclipse怎么支持中文（eclipse中文教程）

福建福州晋安法院凝“新”聚力开展集体廉政谈话

今晚1ban鳄鱼？米勒更博：今天状态火热，7w伤害鳄鱼！

克拉玛依市有了全疆首家三甲中西医结合医院

谷歌正在开发适用于安卓的eSIM传输工具

29家企业、企业产品牵手第20届东博会

宝宝相册文字素材宝宝相册文字语录

2000年龙票值多少钱（2000年龙票）

日料店老板“砸店”被质疑炒作，本人回应：只将墙纸灯笼等撕毁

2023年成都职工大病医疗互助报销比例最新标准，如下

泡泡玛特上半年营收28.14亿元跨境电商平台站点数达到28个

路飞专属电话虫公布！还 includes 巴基与路飞合影

株洲这两村将创建全国乡村治理示范

梦见牙掉了牙齿掉了是什么意思原版周公解梦原版免费

安徽芜湖可提供奥克斯冰箱维修服务地址在哪

夜组词有哪些（夜组词）

高调杀人的韩国，先崩溃了