搜索

生成式 AI 2025 年 12 月:视频、图像、音频蓬勃发展

生成式 AI 2025 年 12 月:视频、图像、音频蓬勃发展

忙碌的一个月

2025 年 12 月生成式 AI 领域的发布丰富多彩:新模型版本、开放 API 和大量融资。

另请阅读:


视频

Luma AI — Ray3 Modify

2025 年 12 月 18 日 — Luma AI 利用 Ray3 Modify 增强了 Dream Machine,这是一款专为 AI-人类混合工作流设计的模型。

Merry Merry Modify! Happy Holidays wrapped up with Ray3 Modify in Dream Machine.

🇨🇳 Merry Merry Modify!在 Dream Machine 中用 Ray3 Modify 结束美好的假期。@LumaLabsAI on X

关键功能

Feature描述
Keyframe controls关键帧的精确控制
Character reference生成之间的人物一致性
High-fidelity编辑时保持高质量

Ray3 Modify 允许创作者编辑和重新构想现有视频,同时保持视觉一致性。一款旨在集成到专业制作流程中的工具。

国际扩张

Luma AI 还在 12 月 2 日开设了伦敦办事处,由 Jason Day (前 WPP) 领导。

🔗 Dream Machine


Pika Labs — 公共 API

2025 年 12 月 8 日 — Pika 通过与 Fal 的合作向开发者开放其 API。

Get excited! Now you can add Pika magic to your products and applications. Introducing the Pika API hosted by @fal.

🇨🇳 兴奋起来吧!现在您可以将 Pika 的魔力添加到您的产品和应用程序中。介绍由 @fal 托管的 Pika API。@pika_labs on X

特点

方面详情
ModelPika 2.2
FeaturesPikascenes, Pikaframes
HostingVia Fal (turnkey API)
Integration开发者 SDK

Pika API 的开放现在允许将视频生成集成到任何应用程序中,从而使该技术的访问民主化。

🔗 Pika


图像

Midjourney — UI重新设计

2025 年 12 月 16 日 — Midjourney 在 alpha.midjourney.com 上推出了其界面的重大重新设计。

We’re doing a bunch of redesigns on our site and we’re putting them up on alpha.midjourney.com for you to try!

🇨🇳 我们正在对网站进行大量重新设计,并将其发布在 alpha.midjourney.com 上供您试用!@midjourney on X

新功能

  • Click-and-scroll creator — 新的、更直观的创作风格
  • Universal sidebar — 所有设置分组在统一的侧边栏中
  • 重新设计的界面 — 更好的整体用户体验

Midjourney 继续改善其网络体验,逐渐减少对其建立最初声誉的 Discord 的依赖。

🔗 Midjourney Alpha


音频 & 音乐

ElevenLabs — Eleven Music 更新

2025 年 12 月 22 日 — ElevenLabs 用一系列新功能丰富了 Eleven Music。

Today, we’re rolling out a suite of new features and improvements across Music, including Explore, which offers a new way to discover, remix, and reprompt your perfect composition.

🇨🇳 今天,我们在 Music 中推出了一系列新功能和改进,包括 Explore,它提供了一种发现、混音和重新提示您的完美作品的新方法。@elevenlabsio on X

新功能

Feature描述
Explore作品的发现和混音
Real-time lyrics实时歌词高亮
Section regeneration特定部分的重新生成
Improved history改进的历史记录
Smoother navigation更流畅的界面

2025 年 8 月推出的 Eleven Music 继续改进,以成为一个完整的 AI 音乐创作工具。

🔗 ElevenLabs


Suno — Personas 更新

2025 年 12 月 19 日 — Suno 通过其 Personas 更新显著提高人声一致性。

We’ve updated Personas to vastly improve vocal consistency from track to track. It’s time to enter album-mode…

🇨🇳 我们更新了 Personas,以极大地提高曲目之间的人声一致性。是时候进入专辑模式了…@suno on X

改进

  • 人声一致性 — 曲目之间声音保持一致
  • Album mode — 创建一致专辑的能力
  • 艺术身份 — 在多个作品中保持风格

此次更新响应了创作者的强烈需求:能够制作具有一致声音身份的多曲目项目。

🔗 Suno


融资

2025 年 12 月也以巨额融资为标志:

公司金额估值日期
Black Forest Labs$300M Series B$3.25B12 月 1 日
Luma AI$900M Series C2025 年 11 月

尽管经济环境不确定,这些融资证明了投资者对生成媒体 AI 领域的胃口。


汇总表

日期参与者公告
12 月 1 日Black Forest Labs$300M Series B
12 月 2 日Luma AI伦敦办事处
12 月 8 日Pika Labs公共 API (Pika 2.2)
12 月 16 日RunwayGen-4.5 + Universal World Simulator
12 月 16 日Black Forest LabsFLUX.2 [max]
12 月 16 日MidjourneyUI重新设计 (alpha)
12 月 18 日Luma AIRay3 Modify
12 月 19 日SunoPersonas 更新
12 月 22 日ElevenLabsEleven Music 更新

这意味着什么

2025 年 12 月说明了该行业的快速成熟:

  1. 视频 — World Models 的竞赛已经开始 (Runway Gen-4.5)
  2. 图像 — 上下文生成到来 (FLUX.2 [max])
  3. 音频 — 工具变得专业化 (一致性, 编辑)
  4. 可访问性 — API 正在开放 (Pika)

2026 年有望成为整合的一年,工具将越来越多地集成到专业的创意工作流中。


来源