可灵 AI 是快手 AI 团队自研的视频生成大模型,于 2024 年 6 月 6 日在官网正式上线,随后经历多次迭代升级,不断优化。它采用类 Sora 的 DiT 结构,以 Transformer 替代传统卷积网络结构,结合 flow 模型作为扩散模型基座,显著提升计算效率。可灵 AI 功能强大,支持文生视频、图生视频、视频续写、运镜控制、首尾帧自定义等多种能力。能够根据文本提示生成长达 2 分钟、帧率 30fps、分辨率 1080p 的高质量视频,并支持多种宽高比。生成的视频运动幅度大且合理,可模拟物理世界特性,具有强大的概念组合能力和想象力。同时,还拥有高表现模式、视频延长等会员专属功能。
支持生成长度最高3分钟的高清视频,分辨率为1080p,帧率为30fps。
生成的视频内容符合运动规律,能够模拟真实世界的物理特性。
具备强大的概念组合能力,能够将用户丰富的想象力转化为具体的画面。
采用3D时空联合注意力机制和Diffusion Transformer架构,实现高质量的视频生成。
支持自由的输出视频宽高比,满足用户不同的创作需求。
基于3D人脸和人体重建技术,实现表情肢体全驱动技术,增强视频的生动性和表现力。
根据用户需求进行个性化定制,生成符合特定风格和主题的视频。
支持多种视频风格和特效,用户可自由选择和调整。
适用于广告与营销、影视制作、教育培训、社交媒体和游戏开发等多个行业,帮助提高视频制作效率和质量。
可以看出可灵大模型在视频生成领域具有显著的技术优势和应用前景,能够为视频创作者和各行业提供强大的支持。
可灵 AI 的使用方法如下:
网页端
注册与登录:访问可灵 AI 官网,完成注册后登录账号。
文生视频
进入页面:点击 “AI 视频”,进入视频生成页面。
输入描述:在 “创意描述” 框内输入不超过 500 字的提示词,比如 “低角度向上推进,缓缓抬头,冰山上突然出现一条恶龙,然后恶龙发现你,冲向你”。
设置参数:拖动 “创意想象力和相关性” 滑块调整视频风格倾向;选择 “高性能” 或 “高表现” 模式;设置 “生成时长”;选择 “视频比例”;设置 “运镜控制和运镜方式”;在 “不希望呈现的内容” 框输入避免出现的问题。
生成视频:确认无误后,点击 “立即生成” 按钮。
查看与下载:生成的视频会保存在右上角的 “所有视频” 中,可在此查看、预览和下载。
图生视频
进入页面:点击 “AI 视频”,进入视频生成页面。
上传图片:点击上传按钮,选择一张图片。
输入描述:在提示词输入框输入文字描述,帮助 AI 更好地理解生成方向。
设置参数:选择 “高性能” 或 “高表现” 模式等参数。
生成视频:确认无误后,点击 “立即生成” 按钮。
查看与下载:与文生视频一样,在 “所有视频” 中查看、预览和下载生成的视频。
手机端
下载与安装:在苹果 App Store 或安卓应用商店搜索 “可灵 AI”,下载安装。
文生视频
进入功能:打开可灵 AI,点击 “AI 视频” 中的文生视频功能。
输入描述:在输入框内输入提示词。
设置参数:设置相关参数,如生成模式等。
生成视频:点击 “立即生成”。
查看与下载:在生成记录或相关文件夹中查看、下载视频。
图生视频
进入功能:点击 “AI 视频” 中的图生视频功能。
上传图片:点击上传按钮,从手机相册中选择图片。
输入描述:输入文本描述。
设置参数:设置相关参数。
生成视频:点击 “立即生成”,等待视频生成完成后查看、下载。
AI 图片生成
新建创作:点击屏幕下方的加号,开始新建创作。
输入描述:输入想要的描述内容,也可选择随机生成。
上传参考图:如有需要,上传 JPG 或 PNG 格式的参考图。
设置比例和数量:设置图片的比例和生成数量。
生成图片:点击 “立即生成” 按钮。