Stability AI发布语言模型StableLM,能力不及ChatGPT,但胜在开源

【GameLook专稿,未经授权不得转载!】

GameLook报道/作为AI绘图浪潮中最受关注的一家公司,Stability AI近日又宣布推出了StableLM,一个最新的开源语言模型。

根据Stability AI的介绍,目前该模型的Alpha版本有30亿和70亿参数两个版本,但随后还将推出150亿和300亿参数的模型。和Stable Diffusion一样,该模型目前同样在Github已经开源,可供开发者下载,并基于CC BY-SA-4.0进行商用。

据悉,StableLM的训练数据主要来自开源数据集The Pile,该数据集主要收集了来自维基百科、YouTube等平台的数据。在The Pile的基础上,Stability AI将带标记内容的规模扩大到了1.5万亿个,是The Pile大小的3倍。

“尽管StableLM的参数只有30亿和70亿,远远不及GPT-3的1750亿个参数,但该数据集的丰富性使得StableLM依旧可以在对话和编程等工作上展现出卓越的能力。”Stablility AI如此说道。

Stability AI 官方示例:写邮件

根据官方Github页面的展示,StableLM可以完成包括简单对话写代码、写邮件以及Rap歌词、小说、笑话段子等内容的创意性书写。

GameLook也在官方的Huggingface上体验了StableLM 70亿参数的版本后,简单用三个问题将其与ChatGPT(GPT-3.5)进行了比较。提问均由New Bing生成,并且由于StableLM目前对中文的支持有限(支持但效果不好),所以所有提问将使用英文。

第一个问题:请用一句话解释“稳定(Stability)”的含义。

ChatGPT

StableLM

在这个问题上,ChatGPT给出了不错的答案,但StableLM则在解释“稳定”这个概念时,多次出现了“Stability”这个单词。

第二个问题:请编写一个Python函数,输入一个字符串,输出该字符串中每个字母出现的次数。

ChatGPT

StableLM

同样的,CahtGPT的结果经过笔者验证,完全可行,并且在回答中,不仅代码有注释,ChatGPT还给出了示例。而StableLM显然理解错了问题,给了一串统计字符数量的代码。

第三个问题:请用“春天,樱花,微风”为提示写一首诗。

ChatGPT

StableLM

由于笔者并非欧美文学方面的专业人士,于是这一题笔者请来了New bing作为裁判,分别为两首诗歌打分。最终StableLM的诗歌得到了9分,而ChatGPT的诗歌则拿到了满分10分(当然有可能是出于一家人的偏袒)。

“这只是我的个人喜好,你可能会有不同的看法。在这种情况下,一个人可能会说’美在观者的眼中‘,意思是每个人对美的定义和感受都不一样。”

虽然在测试的问题中,StableLM的表现还有提升的空间。但其最大的优势其实并不在于参数的量级,而是开源性。

在GameLook过往的一篇文章的评论区,就有网友表示,“开源和不开源的区别就是无限大。Midjourney再强大,该用Stable Diffusion的还是用Stable Diffusion。”

开源技术是近年来推动人工智能迅速发展最重要的力量之一。通过开源软件和模型,开发人员和研究人员可以协作和建立在彼此的工作之上,加速创新的步伐。

也正是因为开源为Stability AI提供的可能性,今年三月,该公司就已经在以40亿美元的估值寻求融资了,要知道,在去年10月,该公司在融资后的估值才刚刚破10亿美元。

在科技行业许多企业降低估值都很难得到融资的当下,这无疑印证了Stability AI的潜力。

凭借其稳定性和开源性质,StableLM有潜力成为研究人员和开发人员在各种项目上的有价值的工具。而随着稳定性AI不断投资于其发展并在人工智能领域推动更大的开放性,我们可以期待在未来几年看到更多激动人心的进展。

如若转载,请注明出处:http://www.gamelook.com.cn/2023/04/515862

关注微信