大家可能都听过最近AI绘画领域的又一次突破:ControlNet。 顾名思义,ControlNet是用来“控制”生成图的;在ControlNet出现之前,希望AI生成指定动作的人物图非常困难,而ControlNet技术的出现一举解决了这个难题,不仅能控制人物身体姿势,甚至可以控制手势。
编辑|冷猫大部分的高质量视频生成模型,都只能生成上限约15秒的视频。清晰度提高之后,生成的视频时长还会再一次缩短。这就让尝试AI视频创意的创作者们非常苦恼了。要想实现创意,必须使用分段生成,结合首尾帧,不仅操作起来很麻烦,而且需要来回抽卡来保证画面的 ...
为解决甲虫后翅图像采集困难、训练数据集不足等问题,研究人员开展利用 Stable Diffusion 和 ControlNet 生成叶甲后翅图像的研究。结果显示合成图像保真度高,该研究为机器学习提供形态图像,展示了新方法的广泛适用性。 在昆虫的奇妙世界里,翅膀无疑是它们 ...
从 ControlNet 到 SAM,今年大热的几篇 CV 论文摘得了本次 ICCV 大奖。 本周,国际计算机视觉大会 ICCV(International Conference on Computer Vision)在法国巴黎开幕。 作为全球计算机视觉领域顶级的学术会议,ICCV 每两年召开一次。 和 CVPR 一样,ICCV 的热度屡创新高。
6月21日,腾讯混元文生图大模型(以下简称为混元DiT模型)宣布全面开源训练代码,同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。 这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化 ...
“最强绘图模型”FLUX深夜更新,一口气连发四款工具! 用官方的话说,这次的更新给FLUX“带来了更多的控制方式和可操作性”。 别看官方说得简单,实际效果可是要震撼得多。 变换工具Redux,可改变人物动作、画面视角/风格。 这些工具分为dev和pro两个版本 ...
燃烧的柴火,在一张桌子上,在乡下。Burning firewood, on a table, in the countryside. 同样,放大“燃烧的火柴”的PNG,就连火焰周边的黑烟都能分离出来: 这就是ControlNet作者提出的新方法——LayerDiffusion,允许大规模预训练的潜在扩散模型(Latent Diffusion Model)生成透明 ...
“最强绘图模型”FLUX 深夜更新,一口气连发四款工具! 用官方的话说,这次的更新给 FLUX“带来了更多的控制方式和可操作性”。别看官方说得简单,实际效果可是要震撼得多。 只用一个相同的轮廓,FLUX 就能变幻出各式各样不同风格的画作: 变换工具 Redux ...
On Sunday, a Reddit user named “Ugleh” posted an AI-generated image of a spiral-shaped medieval village that rapidly gained attention on social media for its remarkable geometric qualities. Follow-up ...