共计 3331 个字符,预计需要花费 9 分钟才能阅读完成。
2012 年,计算机科学家吴恩达和 Jeff Dean 进行了一场试验。他们动用 1.6 万个 CPU、1000 万张猫咪图片以及当时全球最大的深度学习网络,耗时 3 天,生成了世界上第一张 AI 猫脸图像。那时候的小猫图片,受限于技术,称得上是“面目全非”。
12 年后,当网友首次看到背着白色翅膀的黑猫图片时,几乎都以为是真实照片。毕竟宠物博主给猫咪装扮后用胶片机拍照记录并不稀奇,直到看到帖子下方的“AIGC”标签,人们才惊讶发现这竟是 AI 生成的。怀揣好奇,众多网友前往名为“Recraft AI”的应用尝试生成理想小猫,随后各种“小猫胶片照”充斥了小红书、抖音等社交平台的信息流。
近年来,AI 生图成为离普通用户最近的 AI 进展。自 2021 年年初 OpenAI 发布 DALL- E 大模型,AI 能通过文字生图起,三年内 AI 生图工具不断进化迭代。有专攻技术能力突破的,如 Stable Diffusion、Midjourney、FLUX 等;也有专攻 C 端应用的,如妙鸭相机、Remini 等。如今这届网友正将 Recraft AI 捧上新“神坛”。
此次 Recraft AI 火起来的是其内置的预设风格“Hard Flash”。该模式可模拟胶片摄影开启闪光灯后的效果,生成的图片主体突出、对比度高、色彩饱满浓郁。目前该 AI 网站支持免费用户每天获 50 个积分,生成 50 张图片,虽中文提示词生成效果不如英文,但支持中文口令直接输入。
若说 ChatGPT 让作者焦虑,Midjourney 让画家忧愁,这次慌的是摄影师。小红书是 Recraft 最初被国内用户关注的地方,相关话题下已有超 1 万条笔记。其中有摄影爱好者哀嚎“摄影不存在了”;专业胶片摄影博主认为其构图、色彩和审美佳,开始思索人类摄影师还能抓住什么;甚至有人研究其调色与构图进行“反向学习”。
尽管其他 AI 工具画风更细腻、图片更精美,但看多了有“AI 味儿”。早期“一眼假”是 AI 味儿,如今过于逼真无瑕也是。在追求细节和真实的 AI 绘画工具中,强烈鲜明的视觉风格是 Recraft 出圈关键。用不同模型输入相同口令“many animals”,Recraft 内置的 Hard Flash 模式有别样感觉。它没常规构图,将动物一字排开,画面大面积留白,似增添别样情绪,如展现出孤独的狮子。
当 AI 生成的画面能传达情绪,Recraft AI 被贴上“梦核”“怪诞”标签,激发了网友创作欲。有人输入喜欢的电影台词或歌词期待生成画面,如一条点赞 1.6 万的小红书笔记,博主“帆”将《宇宙探索编辑部》台词输入后,生成的图片虽不能百分百复刻台词内容,但画面风格很有特色。也有人用它记录梦境或表达情绪,还有热心网友整理提示词,甚至有人发现新商机,帮无法使用的用户生成梦核图片,一张几块钱。在网友热情参与下,继妙鸭相机、Remini 黏土特效后,又掀起一场 AI 狂欢浪潮。近期小红书、抖音等社交媒体充满各种奇妙图片,如 HelloKitty 站在窗边看烟花、小狗在雪地里吃蛋糕等。11 月 25 日,小红书官方科技薯发起活动,用户用 Recraft 生图带话题发布笔记有机会被推流。在社媒推动下,过去一周 Recraft 在国内 App Store 下载量跃升至“图形和设计榜单”第二。
虽说 Recraft AI 已获大量国内网友喜爱,但“Hard Flash”模式并不能体现其技术实力。很多常用 AI 生图工具的用户认为,此前不少 AI 绘画大模型通过口令输入也能实现类似胶片效果。真正能证明 Recraft AI 实力的是今年发布的 Recraft V3 模型。
在正式官宣 Recraft V3 模型前,Recraft AI 曾用“red-panda”化名参与 Artificial Analysis 网站中 AI 图像竞技场投票,一举超过 FLUX、Midjourney、Ideogram、Stable Diffusion 3.5 排名第一,成为 AI 生成图像赛道黑马。因“red-panda”这个名字,起初很多人猜测模型背后是中国公司,直到今年 10 月 Recraft AI 在推特上认领该模型,人们才开始关注这家成立两年的 AI 企业。
Recraft AI 成立于 2022 年,总部位于英国。创始人兼首席执行官安娜•维罗尼卡•多罗古什此前在谷歌和微软从事软件工程工作,后加入俄罗斯最大搜索引擎平台 Yandex,是 CatBoost 开源梯度提升库的创造者。今年 1 月,Recraft AI 获得由美国风投机构 Khosla Ventures 领投的 1100 万美元 A 轮融资,GitHub 前首席执行官纳特•弗里德曼也参与其中,融资用于加速技术研发和市场拓展。
国内大多用户通过社交媒体上传播的“Hard Flash”模式了解 Recraft AI,所以常误以为它是像 Midjourney 那样的 AI 图像生成公司。但其实 Recraft AI 成立初衷是“专注于为平面设计师提供 AI 辅助工具”,比起 Midjourney,它更像 AI 版的 Cavan 或者 Photoshop。就连排名第一的 Recraft V3 模型,某种程度上也是为方便设计师生成海报而训练的。
在 Recraft V3 模型官方介绍博客中,该公司称此模型是“图像生成领域里,唯一可以生成带有长文本内容的 AI 图像模型”。比如设计师要在海报上展现大量文字内容,以往 AI 生图模型易在文字上出错,设计师通常先借助 AI 生成海报背景图,再用其他工具 P 上文字。而 Recraft V3 模型通过提升 AI 直接在图像中渲染文字内容的准确性,精简设计师利用 AI 生成海报的流程。AI 媒体“新智元”曾解释其运作机制:在构建文本信息时,Recraft 团队采用 TextDiffuser- 2 的表征方式,每行文本先记录内容,再通过坐标指明具体区域。与 TextDiffuser- 2 不同的是,Recraft 用三个坐标点表示文本,使模型能支持渲染倾斜文本。总之,借助 Recraft V3,设计师对海报中文字内容的生成效果与把控力大大提升。
除生成多种风格图像外,Recraft 还提供套索、局部重绘、抠图、mockup 等设计工具。体验过后,其 mockup 功能最令刺猬公社的设计同事惊艳。借助 AI 能力,Recraft AI 能实现图样或图标自动贴合产品图片,直接生成产品样图,省去设计师手动调整参数的麻烦。此外,Recraft 还引入实时协作功能,同一项目设计师可在无限画布上对生成内容评论并及时修改。
虽约 80% 的国内用户没把 Recraft AI 当成 AI 设计工具使用,但凭借 Hard Flash 走红也并非坏事。从 AI 生成图像领域历史看,最近 3 年竞争激烈,各大玩家都在更新大模型。2021 年年初 OpenAI 发布 DALL- E 大模型;2022 年 3 月 Midjourney 上线;2022 年 8 月 Stable Diffusion 正式开源;2024 年 8 月 Black Forest Labs 推出 FLUX 模型成为新领头羊……而 10 月,Recraft 成为讨论主角。
根据 Recraft AI 官方数据,Recraft V3 模型发布 20 天后,该应用全球累计注册用户超 200 万。每次注册登录时,Recraft 会询问用户得知途径,创始人多罗古什透露“几乎所有增长都来自社交媒体和用户口口相传”。
这背后的变化是,随着 AI 生成图像工具走进大众生活,AI 企业仅靠模型实力出圈不够。就像多罗古什所说:“仅靠生成高质量 AI 图像不够,(产品)还需建立吸引人们注意力的东西。”以往一些面向 C 端的 AI 产品已证明这点,如去年的妙鸭相机和今年上半年的 Remini,分别凭借“AI 写真”和“黏土特效”在用户心中留下深刻标签。
对于 Recraft AI 来说,Hard Flash 带来的胶片感是其在社媒出圈、形成认知的“抓手”。在追求画面细节与真实感的 AI 模型中,Recraft 切入允许不合常理的“想象力”赛道。一方面,风格统一的滤镜画风加深用户记忆,让 Recraft 名字扎根;另一方面,巧妙掩盖了 AI 模型部分能力欠缺,就算生成人物有塑料感、画面常以彩色幕布为背景,在“梦核”“怪诞”风格标签下也变得合理。
AI 企业追求技术突破仍是当下重点,但要让更多普通用户走进 AI 时代,除突破性技术,还需降低使用门槛、选好产品定位及营销策略,这样才能有更多 AI 产品“飞入寻常百姓家”。