
分类:
开发运营: 快手大模型团队
收录时间: 2026-01-26
本站浏览: 211027 次
功能简介: 新一代AI创意生产力平台

扫码体验
可灵 AI(Kling AI)是快手 AI 团队自主研发的视频生成大模型,于 2024 年 6 月 6 日正式上线官网并开放邀测,定位为 “新一代 AI 创意生产力平台”。作为全球首个面向公众开放的真实影像级视频生成工具,其核心目标是通过人工智能技术降低创意内容生产门槛,实现 “智能生活与便捷工作” 的产品价值。
基础架构:采用类 Sora 的 DiT(Diffusion Transformer)架构,以 Transformer 替代传统卷积网络,结合 flow 模型作为扩散基座,兼顾生成质量与计算效率。
关键技术:搭载 3D 时空联合注意力机制,可精准建模复杂时空运动与物理规律(如光影反射、流体动态),解决长视频生成中的 “崩坏” 问题。
迭代进化:截至 2025 年 11 月已完成 30 余次版本迭代,最新 2.5 Turbo 模型在风格一致性、动态流畅度与人物表现力上实现显著突破。
(一)视频生成核心能力
分辨率与时长:支持 1080P/30fps 高清输出,单次生成最长 3 分钟视频,支持 16:9/9:16/1:1 等多宽高比适配;
多模态输入:覆盖文生视频、图生视频、视频续写三大核心模式,支持图片 + 文本联合创作;
质量表现:2.0 版本在复杂时序指令执行能力上,对比谷歌 Veo2 和 Sora 的胜负比分别达 205% 和 367%。
(二)创作控制功能
帧控制:首创自定义起始帧与结束帧,实现丝滑转场与一镜到底特效;
运镜系统:内置推进拉远、水平摇镜等 6 种大师级镜头控制方案;
精细化编辑:支持角色替换、元素增删、局部重绘等多模态视频编辑功能。
(三)附加能力
AI 数字人:支持性别、年龄、肤色等特征精细化调节的虚拟形象定制;
全链路创作:集成 AI 音效生成、文本创作、语音合成等配套功能,覆盖从脚本到成片的完整流程;
会员体系:提供每日免费灵感值与多档付费会员,包含高清去水印、批量创作等特权。
时间节点 关键进展
2024 年 6 月 上线邀测,发布 1080P 视频生成功能
2024 年 7 月 开放公测并推出会员体系,新增视频续写功能
2024 年 9 月 启动 “导演共创计划”,联合李少红、贾樟柯等导演打造 AI 生成电影级短片
2024 年 12 月 推出独立 App,基座模型升级至 1.6 版本,优化移动端体验
2025 年 3 月 接入 DeepSeek-R1 系统,实现自然语言精准控制专业参数
2025 年 4 月 发布 2.0 版本,新增多模态编辑与 AI 音效功能
影视创作:参与亚冬会开幕式特效、《大卫之家》等剧集制作,9 部 AI 生成短片被中国电影博物馆永久收藏;
商业营销:服务伊利、vivo、周大福等品牌,生成广告素材单条最高播放量 90 万;
文旅领域:与甘肃文旅等合作打造《甘肃的歌》等作品,“快来惹毛我” 特效项目全网曝光超 10 亿次;
垂直领域:赋能电商虚拟试穿、教育互动视频、游戏 UGC 内容生成等场景。
荣誉资质:获评《麻省理工科技评论》“全球文生视频领域里程碑”,入选 2025 福布斯中国人工智能科技企业 TOP50;
用户规模:截至 2025 年 11 月,全球用户达 4500 万,累计生成视频 2 亿条,企业端 API 调用覆盖 149 个国家;
商业成果:商业化流水累计破亿,合作企业超 2000 家,成为影视、广告、游戏行业主流创作工具。
1、优势亮点
技术领先性:DiT 架构与 3D 时空注意力机制构建核心壁垒,物理规律模拟与长视频稳定性表现突出;
功能全面性:覆盖多模态输入、精细化编辑、全链路创作的完整生态,兼顾专业需求与新手友好度;
落地能力强:在影视、文旅、商业等领域形成规模化案例,用户与商业化数据表现亮眼。
2、注意事项
部分高级功能(如高清去水印、批量创作)需开通会员,免费额度有限;
复杂场景下的人物细节生成仍有优化空间,长视频生成速度受设备性能影响较大;
多模态输入的指令精准度需用户通过学习提示词技巧提升。
川公网安备51172402000187号 蜀ICP备2026003041号-1