goenhance logo

Midjourney V8 与 V7:究竟有什么不同

Cover Image for Midjourney V8 与 V7:究竟有什么不同
Irwin

如果你刚听说 Midjourney 发布了 V8,并且不确定是否需要关心——这篇文章适合你。

不适合那些花了一年时间建立个性化档案的人。适合那些试图弄清楚这到底意味着什么的人。是否值得关注。甚至从哪里开始。

简短回答:是的,值得关注。但原因并不是大多数评论所说的那样。

2. 快速比较:V7 与 V8 一览

在其他任何事情之前——这是完整的图景。

Midjourney V7 Midjourney V8 Alpha
默认外观 艺术化、温暖、画风 摄影风格、电影感、较冷
如何处理提示 创意填补空白 更加字面地遵循你的话语
生成速度 基线 ~快 5 倍
最大分辨率 1024×1024(放大) 原生 2K,使用 --hd
图像中的文字 不可靠 大大改进(使用"引号")
解剖学(手、脸) 良好 明显更好
草稿模式 可用 尚未推出
个性化(--p 强大、成熟 初期阶段
当前状态 稳定,默认模型 Alpha——仅限选择加入
适合初学者吗? 很好的起点 值得从第一天开始尝试

没有哪个版本是客观上更好的。它们为不同目的制作不同的图像。本文的其余部分将帮助你弄清楚哪个版本适合你实际想要制作的内容。

相同提示结果

3. V8 中的变化:对初学者真正重要的 4 件事

V8 于 2026 年 3 月 17 日发布。Midjourney 的官方公告将其描述为一个全新的模型——而不是 V7 的改进。是从头开始的重建。

有很多变化。大多数你还不需要考虑。

以下是实际上会影响你第一周的四个变化。

1. 速度大约快 5 倍。

以前需要 30-60 秒的任务现在在 10 秒内完成。The Decoder 确认了这一点在实际使用中成立,而不仅仅是基准测试。我在 V7 和 V8 中连续运行了相同的提示。V7:大约 45 秒。V8:不到 8 秒。当你在第 30 次迭代中尝试正确提示时,这不是一件小事。

2. 图像中的文字现在实际上可以工作了。

在提示中将你的文字放在"双引号"中。保持简短——两到四个字。V8 可以清晰地呈现它。街道标志、海报标题、产品标签。V7 会将其变成装饰性的废话。我在两个模型中尝试了"一个咖啡馆窗户标志,上面写着'OPEN'"。V7 给了我一些看起来像字母争吵的东西。V8 给了我一个清晰可辨的标志。虽然不完美——它仍然是 alpha 版——但比 V7 更可用。

3. 提示更接近你描述的内容。

V7 解释你的提示并在其上添加自己的创意层。V8 更加字面地理解你的话。写下"一个穿红色外套站在窗边的女人",V8 就会给你这个。V7 给你一些让人联想到的东西。对于希望自己的实际想法出现在屏幕上的初学者来说,V8 对模糊或不精确的提示更宽容。

4. 原生 2K,使用 --hd

在任何提示中添加 --hd,V8 从一开始就以完整的 2K 分辨率呈现。无需单独的放大步骤。后期不会引入伪影。问题是:--hd 每次生成的成本增加 4 倍,运行速度慢 4 倍。在你探索时不要使用它。将其保留用于值得保留的图像。

底线:V8 的四大升级——速度、文字、提示准确性和原生 2K——都指向同一个方向。更多控制、更快反馈、更少浪费时间。这正是初学者所需要的。

4. 美学差异:为什么 V8 看起来比 V7 "更冷"

V7 和 V8 不仅生成方式不同——它们的感觉也不同。如果你期待其中一个只是"更好",你会对实际得到的结果感到困惑。

V7 有个性。温暖的颜色、柔和的氛围光、轻微的纹理,使即使是"照片真实"的输出也感觉像是由有意图的人拍摄的。我在两个版本中运行了"一个在雨天窗边阅读的女人"。V7 回来的是一种电影感——柔和的绿色,金色的室内光线在边缘渗透。我会原样发布它。V8 给了我同一场景的准确、光线良好的照片。在每一个可测量的方面都更好。但更难以产生情感。

这不是一个缺陷。这完全取决于你需要什么。

V8 默认更接近于受控的工作室拍摄。中性色温、精确的阴影、干净的边缘。较少的情感,更多的文档记录。对于产品模型、建筑渲染、肤色准确的人像——V8 的视觉方法正是正确的。对于电影感或情感充沛的东西,V7 通常能更轻松地达到。

试图让 V8 看起来像 V7——或反之亦然——通常比一开始就选择正确的模型要多费力。

底线:V7 增加情感。V8 增加精确度。两者都不是错误的答案——这取决于你是在创作艺术还是在制作资产。

v8 文本渲染

5. 评论家错在哪里(以及他们对在哪里)

最严厉的 V8 评论来自经验丰富的用户——他们并没有错。他们只是不是在谈论你的情况。

@EugenioFierro3:"错误的手、破损的比例——在许多情况下感觉比 V7 更糟。" Curious Refuge:"大致与 V7 相当,在某些情况下实际上更糟。" @umesh_ai 通过两个模型运行相同的提示,得出结论 V8"更真实,但更少艺术性和创造性。"

这些是真实、诚实的反应。我认为他们没有错。

但他们没有说的是:每一个评论家进入 V8 时都带着你还没有的东西。一个经过数月图像评分建立的 V7 个性化档案。这个档案是让 V7 对经验丰富的用户感觉如此调校的原因。它了解他们的品味。当他们切换到 V8 时,他们是在将一个全新的模型与一个已经知道他们喜欢什么的工具进行比较。当然,现在感觉更糟。

你没有这个问题。

没有需要忘记的 V7 习惯。没有需要留下的档案。没有需要中断的工作流程。你从零开始使用这两个模型,这意味着 V8 的粗糙边缘对你的影响远小于对那些自 MJ V5 以来一直使用的人。

我花了一周时间阅读我能找到的每一篇负面评论。潜在的抱怨几乎总是相同的:"我的 V7 结果更好。"这是一个迁移问题,而不是质量问题。如果你正在切换,这很重要。如果你是从头开始,这几乎无关紧要。

底线:评论家们对 V8 不同的描述是正确的。他们没有描述你的情况。你没有旧的工作流程需要放弃——这实际上是一个优势。

6. V7 与 V8:何时使用哪个

在这里做出错误选择的最快方法是问"哪个更好"。更好用于什么?

使用 V7 当:

  • 你想要感觉艺术化、氛围感或画风的图像——概念艺术、幻想、编辑插图
  • 你在编写简短、印象派的提示,并希望模型能创造性地填补美学空白
  • 你需要一个稳定、一致的模型用于任何你要展示给他人的东西

使用 V8 当:

  • 你需要准确的人物形象——肖像、角色表、任何带有手的东西
  • 你在编写详细、具体的提示,并希望你的指令能准确落地
  • 图像中的文字很重要——标牌、标签、标题
  • 你想尝试原生 2K 进行最终渲染

如果你真的不知道从哪里开始:选择 V8。它更快,因此你在相同时间内可以进行更多尝试。更多尝试意味着更快的学习。探索 V8 的生成效果一周,然后通过 V7 运行相同的提示并进行比较。差异将立即显现,你会知道哪种美学适合你正在制作的内容。

底线:将模型与输出匹配,而不是与炒作匹配。V7 用于艺术。V8 用于准确性。拿不准时,从 V8 开始,让速度为你服务。

7. 初学者的两阶段路线图

大多数教程告诉你 V8 能做什么。没有人告诉你实际上应该先做什么。这是我开始时希望存在的部分。

**初学者犯的最大错误:**直接跳入提示实验,而没有建立个性化档案。这就像在不知道想要哪个电台的情况下调节收音机。模型没有你的品味参考,因此每个输出都感觉像是彩票。

这是修复此问题的两阶段方法。

阶段 1——前两周:使用 V7 并对所有内容进行评分

阶段 1 中你的唯一任务不是生成优秀的图像。而是对它们进行评分。

每次生成时,点击结果上的点赞或点踩。喜欢或讨厌——两个答案都能教会模型一些东西。要持续这样做。达到 200 个评分。

我开始时没有这样做。我花了几周时间想知道为什么我的提示没有产生任何连贯的东西,改变关键词,添加参数,尝试我在 Reddit 上找到的每个技巧。没有一个比简单地对 200 张图像进行评分更有效。评分系统是 V7 和 V8 如何构建你的美学偏好图像的方式。跳过它,你就是在以模型实际能力的 40% 运行。

为什么先用 V7?因为 V7 对简短提示更宽容。你不需要写一段话就能得到一些有趣的东西。这使得生成足够的多样性以进行有意义的评分变得更容易。目标不是爱上 V7。目标是建立你将在 V8 中使用的档案。

200 个评分实际上能给你带来什么:

  • 模型开始朝着你偏好的色彩调色板方向发展
  • 构图风格、光照氛围和细节水平都开始朝着你选择的方向发展
  • 感觉随机的提示开始产生感觉有意图的结果

40 个评分解锁系统。200 个评分是它开始感觉像你的地方。继续超过 200——改进会持续到大约 2,000,但回报递减。对于大多数初学者来说,200 是一切开始点击的门槛。

阶段 2——200 个评分后:将你的档案带到 V8

你的 V7 档案会自动转移到 V8。无需设置。

切换到 V8,添加 --p 激活个性化,并从 --stylize 500 开始。现在看看会发生什么。之前感觉通用的提示开始产生趋向于你的品味的结果。更少随机。更连贯。更"属于你"。

这是大多数初学者从未达到的部分——因为没有人告诉他们先做评分工作。

阶段 2 中的提示变化: 在阶段 1 中,你在学习 MJ 可以产生什么。在阶段 2 中,你在引导它朝着你想要的方向发展。提示处理主题和背景。档案处理美学方向。它们做不同的工作。一旦你理解了这种分工,提示就不再感觉像是猜测。

没有人提到的复合效应: 你在阶段 1 中评分的每张图像都会使阶段 2 更好。你在阶段 2 中评分的每张图像都会使你的下一个会话更好。模型不是静态的——只要你继续评分,它就会继续学习你的偏好。大多数对 MJ 感到困惑的用户只是停止了在第一周后的评分。

提示准确性测试

为什么这有效(大多数评论跳过的部分)

V8 相对于 V7 的最大升级不是速度或分辨率。是个性化在模型运作中变得更加重要,而不是更少。Midjourney 对 V8 的指导:重度依赖个性化,并将 --stylize 调到 1000。

这意味着两阶段路线图不是一种变通方法。这正是 V8 设计的使用方式。

底线:在 V7 中进行两周的评分,然后将你的档案转移到 V8。这一个习惯将那些感到困惑的初学者与那些感到掌控的初学者区分开来——而且除了持续性外没有任何成本。

8. 接下来如何处理你的 Midjourney 图像

生成一张优秀的图像是第一步。大多数教程到此为止。以下是实际接下来发生的事情。

如果你是为社交媒体创作——Reels、TikTok、YouTube Shorts——静态图像的覆盖率明显低于同一内容的动态形式。我通过亲身经历学到了这一点:在同一周内发布了相同的视觉效果作为静态图像和视频片段。视频片段的播放量是静态图像的 11 倍。相同的图像,相同的标题,不同的格式。

从那以后,我开始通过 GoEnhance 的 图像到视频工具 运行 Midjourney 输出。工作流程是:在 MJ 中生成,下载图像,上传到 GoEnhance,选择运动风格,完成。我第一次用 V8 肖像做到了这一点——一个提示,第一次尝试,没有花哨的东西——在不到一分钟内就有了一个可发布的片段。没有视频编辑软件。没有时间线。没有关键帧。这真的让我感到惊讶。我本以为还要在后期花一个小时。

上传你的第一张 Midjourney 图像,看看它会变成什么——免费

动画化图片工具 类似地工作,并且处理角色艺术效果良好——它能识别出哪些元素应该移动,并应用看起来有意图而不是随机的运动。我已经用 MJ 的幻想肖像、产品模型和抽象作品进行了测试。首次尝试的一致性比我预期的要好。并不是每个输出都是完美的,但命中率足够高,以至于它已经成为我在 MJ 生成后的默认步骤。

需要明确的一点是:GoEnhance 是下一步,而不是替代。如果你想在图像本身上进行迭代——细化构图、改变光照、尝试不同的美学——这些工作仍然在 Midjourney 中进行。GoEnhance 从 MJ 停止的地方接手。你还可以浏览 <a href=/ai-image-generator">AI 图像生成器,在开始生成之前查看所有可用内容。

底线:图像是起点,而不是终点。为你的最佳 MJ 输出添加运动是将静态资产转变为可发布内容的最快方法——而且不到一分钟。

9. 定价:你实际上在为什么付费

V7 和 V8 都包含在你现有的 Midjourney 订阅中——但如果你不知道它们在哪里,成本陷阱很容易掉进去。

计划 月费 快速 GPU 小时
基本 $10/月 3.3 小时
标准 $30/月 15 小时
专业 $60/月 30 小时
超级 $120/月 60 小时

大多数初学者掉入的陷阱:在每次生成时使用 --hd--q 4。两者的成本都是标准费率的 4 倍,运行速度慢 4 倍。将它们叠加,你就达到了每张图像的 16 倍。这会快速消耗掉基本计划的 GPU 小时。一个下午的热情测试,突然间你就用完了。

实际的解决方法很简单。在探索时使用标准分辨率。仅对你决定值得保留的图像应用 --hd。V8 的标准输出确实很好——你不需要原生 2K 来处理任何发送到手机屏幕或社交媒体的内容。

还有一件值得知道的事情:V8 目前没有 Relax 模式。每个 V8 生成都需要快速 GPU 小时。V7 的 Relax 模式允许你在没有额外成本的情况下生成,只是队列较慢。在基本计划中,这种差异比大多数评论承认的要重要得多。

底线:在标准设置下,V7 和 V8 的成本相同。预算压力完全存在于 --hd--q 4 和缺失的 Relax 模式中。在标准下探索,选择性放大,你的 GPU 小时将会持续。

10. 常见问题

作为一个完全的初学者,我应该从 Midjourney V7 还是 V8 开始? 在前两周从 V7 开始,同时通过图像评分建立你的个性化档案——目标是 200。然后切换到 V8,并携带档案。这样你会从这两个模型中获得更强的结果,而不是在没有任何评分偏好建立的情况下直接跳入其中一个。

Midjourney V8 是否对所有用户开放? 是的。V8 Alpha 对所有 Midjourney 订阅者开放,无论计划如何。访问 alpha.midjourney.com,使用现有帐户登录,并从模型菜单中选择 V8。它仍处于 alpha 阶段,因此随着 Midjourney 继续优化,其行为可能会发生变化。

为什么有些创作者说 V8 看起来比 V7 更糟? 他们将 V8 与经过数月个性化评分调整到他们特定品味的 V7 版本进行比较。这是一个迁移问题,而不是质量问题。对于在这两个模型上从头开始的初学者来说,差距要小得多。

Midjourney V8 的成本是否比 V7 高? 不是直接的——这两个模型都从相同的 GPU 分钟池中提取。成本差异来自 V8 的高级功能。--hd--q 4、风格参考和情绪板每次生成的成本都增加 4 倍。V7 还具有 Relax 模式,这实际上是免费的生成,只是队列较慢。V8 还不支持这一点。

使用 Midjourney 图像进行社交媒体的最佳方法是什么? 在 Midjourney 中生成,然后使用像 GoEnhance 这样的工具将静态图像转换为短视频片段。图像到视频工具 将静止图像转换为适合 Reels 或 TikTok 的动态内容——不需要编辑经验。根据我的经验,第一次尝试通常足够好,可以发布。

Midjourney V8 何时会成为默认模型? 没有官方时间表。之前的模型过渡每个都有不同的 alpha 期。在 V8 达到普遍可用性之前,V7 仍然是任何生产工作的稳定选择。

11. 结论

V8 和 V7 并不是为同一个工作竞争。

V8 更快、更字面、更擅长解剖学和文字,适合照片真实和商业工作。V7 更温暖、更具解释性,仍然是艺术和风格化输出的更强选择。你不必永久选择一个——每个订阅者都可以使用这两个。

如果你是初学者:在 V7 中建立你的个性化档案,将其迁移到 V8,并看看哪种美学与你正在制作的内容匹配。这种两阶段方法比在任一模型上进行任何数量的提示优化更快地获得有用的结果。

一个诚实的警告:如果你的主要目标是基于布局的工作——品牌演示、印刷材料、精确的排版——Canva 或 Adobe Express 仍然是那项特定工作的更好工具。Midjourney 生成。它不允许你手动编排。

一旦你有了真正满意的图像,下一个问题是如何处理它们。GoEnhance 将 Midjourney 输出转换为动态内容——这是大多数教程完全跳过的步骤。这是静态生成变成你可以实际发布的东西的地方。

开始使用 GoEnhance 创建——免费 →