横空出世的「马」:HappyHorse-1.0 如何改写 AI 视频竞赛
2026 年 4 月:榜单、低调发布叙事与工程现实;以及为何集成应以 happyhorse.app 官方文档为准。

2026 年 4 月——当月最受讨论的 AI 模型没有新闻稿、没有 LinkedIn 官宣,也没有创始人照片。只有一个名字:HappyHorse。
在硅谷,AI 发布往往是剧场:主题演讲、倒计时、精心剪辑的演示片。工程师在 X 上感慨「多年努力终于开花结果」,投资人转发时配上火焰表情。机器轰鸣作响。
于是,当 HappyHorse-1.0 在 2026 年 4 月 7 日悄然登上 Artificial Analysis 全球视频榜榜首——在零预告、零背景、零公开团队的情况下,压过字节跳动备受关注的 Seedance 2.0——社区一时分不清该佩服还是该怀疑。
两种情绪都有。
榜单之上的「幽灵」
数字很难被忽视。HappyHorse-1.0 在盲评竞技场中,文生视频 1333 Elo、图生视频 1392 Elo,在两个类别都稳居 第一,领先各大实验室的当家模型。
模型在单张 H100 GPU 上约 38 秒 生成原生 1080p 视频,比 Seedance 2.0 快约 30–40%。它在一次前向传播中同步生成音画,支持 七种语言 的对口型——包括普通话、粤语、日语和韩语——并以统一的 Transformer 架构、仅 8 步 去噪完成上述能力。
技术社区开始挖掘:谁做的?初创?地下研究组?低调运作的实验室?
低调发布的艺术
在「每次发模型都像办发布会」的时代,HappyHorse 选择了沉默——而且效果惊人。
不说话,就让基准自己开口。研究者在 X 上转发评测片段,评论员逐帧对比输出。「HappyHorse」这个名字之所以传开,恰恰因为 没人知道它是什么。事实证明,神秘感本身就是极佳公关。
这套打法更像艺术圈,而非典型科技圈:匿名的街头艺术家、没有署名的首张专辑、在弄清导演是谁之前就拿奖的电影。作品不被预期和品牌包袱过滤,你只能凭它做了什么来评判。
在迷恋创始人叙事与机构背书的 AI 产业里,这种玩法很少被跑得如此干净。
阿里巴巴走出阴影
榜单爆发三天后,幕布落下。
4 月 10 日,一个新注册的 X 账号发布简短声明:HappyHorse-1.0 由 阿里巴巴 ATH-AI 创新业务部 打造,该团队源自淘宝与天猫集团未来生活实验室;负责人 张迪 曾任快手副总裁,曾主导 Kling AI 的技术路线——后者是中国最具代表性的视频生成模型之一。
据媒体报道,阿里巴巴向 CNBC 确认了相关说法,模型仍在测试阶段。
对许多观察者而言,这层信息披露让叙事彻底改写:这不是「以小博大」的创业公司,而是一家拥有海量算力与深厚人才储备的科技巨头,选择从侧门首秀最新模型——却仍然霸榜。
HappyHorse 真正做对了什么
抛开八卦,剩下的是扎实的工程。
模型的 单流 Transformer 架构 不把文本、图像、视频、音频当作需要事后拼接的独立问题,而是放进 统一的表示空间。这与多数「视频管线 + 后配音层」的哲学截然不同。
结果是连贯、同步的输出:不像「视频 + 配乐」,而像 生来就有声音的视频。对口播、广告片、多语种配音和社交媒体创作者来说,这种差别至关重要。
DMD-2 蒸馏 把推理压到 8 步 且无需 classifier-free guidance,是另一项关键胜利。高质量下的更快生成不只是体验问题,更是成本问题:在规模上,8 步与 50 步的差距,可能就是商业可持续与不可持续的分水岭。
值得留意的局限
HappyHorse-1.0 并非没有短板,榜单叙事也需要冷静看待。
Artificial Analysis 竞技场明显偏向 竖屏与对白密集型内容——超过 60% 的评测片段落在此类。这正是 HappyHorse 最擅长的场景。若你要渲染海上风暴、追车戏或抽象建筑可视化,Kling 或精调后的 Seedance 等对手在某些场景仍可能更强。
「能否集成」和「是否开源权重」是两件事。 若你本周就要上线产品,HappyHorse 提供已文档化的生产级 HTTP API,详见 happyhorse.app/docs:在控制台 API Keys 页面获取 Bearer Token,用 POST /api/generate 指定模型 happyhorse-1.0/video 创建任务,再用 GET /api/status 携带 task_id 轮询直至返回成片 URL。质量档位、原生音频(sound)、时长、画幅、图生视频 URL、多镜头提示等字段均以官方文档为准。
对某些研究路径而言,仍可能缺少 公开权重、可自托管检查点 或 完全离线推理。请把公开榜单当作信号之一;把 官方 API 文档 当作当下能构建什么的一手依据。
为何这一刻重要
HappyHorse 是更大转折中的一个样本。
中国的 AI 实验室——阿里、字节、快手、智谱——不再发布「对中国来说已经很强」的模型,而是发布 在全球范围内也属第一梯队 的作品。视频生成、音频合成与多模态 AI 的竞争已是真正的全球赛场,领先者之间的差距也在收窄。
「低调首发」也预示了下一阶段竞争可能的样貌:当基准趋于饱和、市场对通稿麻木,先让输出说话 的团队,或许仍能赢下最关键的前 72 小时——那段注意力最稀缺、也最值钱的时间。
HappyHorse 没有锣鼓喧天,却把能看到的榜单都刷到了前排。
下一款神秘模型,很可能已经在训练里。
在 happyhorse.app 上落地
榜单是故事,上线才是产品。打开 https://happyhorse.app/,按 API 文档 使用 POST /api/generate 与 GET /api/status,把榜单背后的同一模型家族,变成用户能点开的成片——原生音频、多语种交付、以及与真实排期匹配的迭代节奏。