Stability AI 是一家成立于 2019 年的英国开源生成式人工智能企业,由埃马德・莫斯塔克创立。其以 Stable Diffusion 为代表的模型开源后引起轰动,为公司赢得大量关注。该公司提供包括成像、语言、代码和音频等多领域的人工智能模型产品,如 Stable Cascade、Stable Video Diffusion、Stable Audio 等,在人工智能领域展现出强大的技术实力和创新能力。
Stable Diffusion:于 2022 年 8 月开源的 AI 图像生成器,可根据用户给定的文本生成对应的图像,能模仿多种艺术风格。
Stable Cascade:2024 年 2 月推出的新一代文生图模型,建立在 Würstchen 架构上,可在消费级硬件上进行简单训练和微调,能有效降低推理使用的显存。
Stable Video Diffusion:是该公司的第一个开放视频模型,可将文本和图像输入转换为生动的场景,为媒体、娱乐、教育、营销等领域的广泛视频应用提供服务。
Stable Audio:首款用于音乐和音效生成的产品,用户通过输入文本提示和持续时间来创建原始音频,可生成高质量、44.1kHz 立体声音频。
Stable Zero123:一种专门用于生成 3D 对象的高级 AI 模型,能够从各个角度准确地解释对象应该如何出现。
创意产业:为设计师、艺术家等提供灵感和创意,生成独特的设计作品和艺术作品。
教育领域:可以为学生提供个性化的学习辅导,根据学生的学习情况和需求,生成相应的学习资料和练习题。
医疗领域:可以辅助医生进行疾病诊断和治疗方案的制定,通过对大量医疗数据的分析,为医生提供更加准确的诊断依据和治疗建议。
优势:以开源为特色,其模型如 Stable Diffusion 等开源后,吸引了全球大量开发者和研究人员参与改进和创新,加速了技术的发展和传播;提供多种模态的模型产品,能满足不同用户在图像、视频、音频、3D 和语言等方面的需求。
不足:公司面临着法律诉讼,如 Getty Images 指控其误用超 1200 万张照片来训练 Stable Diffusion 图像生成系统,这对公司的声誉和业务发展带来一定挑战。