Stability AI发布语言模型StableLM，能力不及ChatGPT，但胜在开源

【GameLook专稿，未经授权不得转载！】

GameLook报道/作为AI绘图浪潮中最受关注的一家公司，Stability AI近日又宣布推出了StableLM，一个最新的开源语言模型。

根据Stability AI的介绍，目前该模型的Alpha版本有30亿和70亿参数两个版本，但随后还将推出150亿和300亿参数的模型。和Stable Diffusion一样，该模型目前同样在Github已经开源，可供开发者下载，并基于CC BY-SA-4.0进行商用。

据悉，StableLM的训练数据主要来自开源数据集The Pile，该数据集主要收集了来自维基百科、YouTube等平台的数据。在The Pile的基础上，Stability AI将带标记内容的规模扩大到了1.5万亿个，是The Pile大小的3倍。

“尽管StableLM的参数只有30亿和70亿，远远不及GPT-3的1750亿个参数，但该数据集的丰富性使得StableLM依旧可以在对话和编程等工作上展现出卓越的能力。”Stablility AI如此说道。

Stability AI 官方示例：写邮件

根据官方Github页面的展示，StableLM可以完成包括简单对话写代码、写邮件以及Rap歌词、小说、笑话段子等内容的创意性书写。

GameLook也在官方的Huggingface上体验了StableLM 70亿参数的版本后，简单用三个问题将其与ChatGPT（GPT-3.5）进行了比较。提问均由New Bing生成，并且由于StableLM目前对中文的支持有限（支持但效果不好），所以所有提问将使用英文。

第一个问题：请用一句话解释“稳定（Stability）”的含义。

ChatGPT

StableLM

在这个问题上，ChatGPT给出了不错的答案，但StableLM则在解释“稳定”这个概念时，多次出现了“Stability”这个单词。

第二个问题：请编写一个Python函数，输入一个字符串，输出该字符串中每个字母出现的次数。

ChatGPT

StableLM

同样的，CahtGPT的结果经过笔者验证，完全可行，并且在回答中，不仅代码有注释，ChatGPT还给出了示例。而StableLM显然理解错了问题，给了一串统计字符数量的代码。

第三个问题：请用“春天，樱花，微风”为提示写一首诗。

ChatGPT

StableLM

由于笔者并非欧美文学方面的专业人士，于是这一题笔者请来了New bing作为裁判，分别为两首诗歌打分。最终StableLM的诗歌得到了9分，而ChatGPT的诗歌则拿到了满分10分（当然有可能是出于一家人的偏袒）。

“这只是我的个人喜好，你可能会有不同的看法。在这种情况下，一个人可能会说’美在观者的眼中‘，意思是每个人对美的定义和感受都不一样。”

虽然在测试的问题中，StableLM的表现还有提升的空间。但其最大的优势其实并不在于参数的量级，而是开源性。

在GameLook过往的一篇文章的评论区，就有网友表示，“开源和不开源的区别就是无限大。Midjourney再强大，该用Stable Diffusion的还是用Stable Diffusion。”

开源技术是近年来推动人工智能迅速发展最重要的力量之一。通过开源软件和模型，开发人员和研究人员可以协作和建立在彼此的工作之上，加速创新的步伐。

也正是因为开源为Stability AI提供的可能性，今年三月，该公司就已经在以40亿美元的估值寻求融资了，要知道，在去年10月，该公司在融资后的估值才刚刚破10亿美元。

在科技行业许多企业降低估值都很难得到融资的当下，这无疑印证了Stability AI的潜力。

凭借其稳定性和开源性质，StableLM有潜力成为研究人员和开发人员在各种项目上的有价值的工具。而随着稳定性AI不断投资于其发展并在人工智能领域推动更大的开放性，我们可以期待在未来几年看到更多激动人心的进展。

如若转载，请注明出处：http://www.gamelook.com.cn/2023/04/515862/