绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

news/2024/3/29 5:17:43/文章来源:https://blog.csdn.net/ShowMeAI/article/details/131997123

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

img

🤖 摄影写真面临AI技术洗牌,一键生成杂志大片的时代来了

img

软件:midjourney & Stable Diffusion

模型:moonmix_utopia

人物lora: 老婆真人

后期:PS

Steps: 50, Sampler: DPM++ 2M SDE Karras, CFG scale: 7

随着AI技术不断发展,诸如Midjourney 和 Stable Diffusion 等工具生成的图片质量已经非常高了!在AI创意二维码、文字、证件照之后,AI创意写真也火爆了起来~

以这套「荷叶罗裙一色裁,芙蓉向脸两边开」的古风人物摄影为例。这些完全由AI生成图片,精美的服饰、优美的姿态、优雅的布局,使得照片非常逼真且极具美感。可见,当前的AI算法已经能捕捉并重现复杂的艺术细节,这对依赖传统服装、妆容来打造古风照片的摄影行业无疑是个巨大的冲击 ⋙ 小红书

img

🤖 Runway 宣布 Gen-1 和 Gen-2 完全开放,可以免费注册尝试

img

7月24日,Runway 宣布 Gen-1 和 Gen-2 已经完全开放,任何人都可以注册一个账号免费尝试。需要说明的是,Gen-1 和 Gen-2 是 Runway 研发的两代AI生成系统:

  • Gen-1是第一代系统,可以实现各种图像到图像、文本到图像等生成任务,如文字换脸、视频背景替换等

  • Gen-2是新一代系统,实现了文本到视频的生成,只需要文本描述就可以生成逼真的视频,并且图像生成质量也有了大幅度提高,可以生成更高分辨率和更逼真的图片 ⋙ Runway官网

🤖 Stability AI推出最新图像生成模型 SDXL 1.0,免费在线试玩

img

在线试玩:https://clipdrop.co/stable-diffusion

7月27日,Stability AI 宣布推出最新的图像生成模型 Stable Diffusion XL 1.0,开源版本可在 GitHub 上获取。

Stable Diffusion 是目前全球使用最广泛的开源文生图模型。本次推出的 Stable Diffusion XL 1.0,是对早期 SDXL 0.9、SDXL Beta 和流行的 V1.5 模型的改进,也是当前图像生成领域最好的开源模型。

如图所示,SDXL 基础模型的性能明显优于之前的变体,并且与细化模块相结合的模型实现了最佳的整体性能 ⋙ 公告 | GitHub

img

🤖 AI视频创作十八法,超级工具合集让你轻松创作各种形式的视频!

img

目前,使用AI技术生成视频的工具已经非常多了!这篇文章总结了当前的18种主流方法,并附上了相关教程,非常全面了~

方法一:图片转视频双雄

  1. Runway

  2. Midjourney

方法二:文字生成视频三强

  1. Runway Gen-2

  2. Pikalabs

  3. Zeroscope

方法三:使用Midjourney图片生成视频

  1. 制作3D全景视频

  2. 利用变形功能制作视频

  3. 使用Pan功能生成视频

  4. 使用Zoom Out功能制作一镜到底视频

方法四:使用其他AI软件创作视频

  1. Runway frame interpolation

  2. Genmo

  3. Wonder Studio

  4. Stable Diffusion

  5. Gen-1

  6. ControlNet

  7. Kaiber

  8. Deforum Colab ⋙ 今说新语

img

🤖 Llama 2微调的极速指南,制作对话摘要生成器

img

这是一篇极速操作指南,结合代码案例演示了如何使用 Hugging Face 库对 Llama 2 模型进行微调 (fine-tuning),使其成为一个对话摘要生成器,对于 Llama 模型的实际使用具有很好的参考价值。

  1. Download the model:通过 clone Llama 的 inference repo 来下载 Llama 2 的7B模型,并组织好目录结构,准备接下来的转换和训练;这一步获取了基础的Llama 2模型

  2. Convert model to Hugging Face format:使用提供的转换脚本,将原始的 Llama 2 模型转换为 Hugging Face 的格式,方便后续通过 Hugging Face 的 API 进行微调;这一步实现了模型格式的转换,为 fine-tuning 做好了准备

  3. Run the fine-tuning notebook:基于 Hugging Face 的 transformers 库,作者编写了一个 nNotebook,内含了数据集准备、模型加载、设置训练参数等代码,可以直接运行进行对话摘要任务的微调;这一步完成了对话摘要模型的训练

  4. Run inference on your fine-tuned model:由于 Hugging Face 仅保存 adapter 权重,所以需要将经过微调的权重加载到完整 Llama 2 模型中,然后就可以进行推理和生成对话摘要了;这一步实现了利用微调过的模型进行下游任务 ⋙ @Sam L’Huillier

img

🤖 AI让我变强了!也让我更忙了……

img

这篇文章的观点很有意思!AI技术和产品的爆发,非但不会取代人类员工,反而会赋能人类,提升工作效率和产出。BUT!个人效率的提升可能会导致企业的进一步压榨。整理下文章核心要点:

  1. 变化,不是替代
  • 历史上,被认为会取代人类的新技术,往往只是改变并增强了人类,AI也将是如此
  1. AI在工作中的应用
  • AI可以增强各个团队的工作效率和产出,例如市场营销、销售、支持、产品和工程等

  • AI释放人力去处理更复杂和关键的问题,也能使游戏的员工更出色

  1. 故事将走向何方
  • AI提高个人效率的结果,可能是公司对员工劳动力的进一步压榨;但这是企业文化的问题,而不是AI技术本身的问题

  • AI浪潮提高了对员工能力和产出的期待,员工需要积极适应变化,并随着时代一起成长 ⋙ 阅读原文

img

🤖 Nijijourney官方AI绘画课程,艺术修养与绘画理论必修课

img

Niji 官方最近推出了系列免费的绘画课程 Niji Academy ,将艺术基础与AI技术相结合,补上绘制一张优秀图像所需要的绘画历史、审美熏陶、基础理论等「必修课」,带领读者丝滑进入艺术的领域。

抄写别人已经写好的提示词再缝缝补补,很难真的学会AI绘画。只有见过足够多美的、好看的东西,掌握最基本的原理与基础,才能自己绘制出美图。

目前官网更新了两节课程,但是只有英语和日语版本。幸好!歸藏进行了内容翻译,链接一并附上!一起来刷课呀!

🔔 01测量和抽象的基础知识:绘制一切的理论

img

https://sizigi.notion.site/Lesson-1-Fundamentals-of-Measurement-and-Abstraction-The-Theory-of-How-to-Draw-Everything-0833708fbe044f6a9f37d4357d25f32e

  1. 一切之理论 (为何一切都是美) :这部分讲述了为什么左图不是「真正的艺术」,右图又为什么「无聊」,提出要找到一个包罗万象的艺术理论

  2. 为什么它值得在博物馆里展出? 这部分通过比较乔托的画作和同期的文学作品,说明语言是组织口头信息,艺术是组织视觉信息;当一个想法被良好传达时,不管传达方式,美都会涌现

  3. 意外的文艺复兴:这部分提到了一个reddit社区,探索具有古典感觉的各种艺术作品,说明组织概念对各种媒介都适用

  4. 视觉抽象:这部分通过对句子进行逐步抽象来说明抽象的过程,并给出抽象程度不同的图像例子,说明艺术家需要给予观众足够信息,让他们自己想象

  5. 说服观众相信真相:这部分比较了现实主义和抽象主义这两种辩证方式,以及它们之间的恐怖谷效应

  6. 那么对于超抽象的东西呢:这部分分析了超抽象艺术难以理解的两个原因,并说明不要过于关注风格,应该学习组织视觉信息的方式 ⋙ 中文学习笔记

🔔 02 终结者(线)

img

https://sizigi.notion.site/Lesson-2-The-Terminator-Line-459ceabed46c42fb9b9eeebb8df57354

  1. 建立视觉层级:这部分举了拉斐尔的画作为例子,说明使用简单和复杂的区域驱动观看者的视线,形成焦点

  2. 当你有不止一个焦点时会发生什么? 这部分给出了两个焦点竞争视觉优先级的例子,说明焦点的相对层级关系

  3. 当你没有焦点时会发生什么? 这部分给出一个没有焦点的博斯画作为反例,解释这样的画需要仔细观看才能理解

  4. 全能的明暗交界线:这部分介绍了使用明暗交界线来组织图像的方法,在亮和暗两个区域划分细节

  5. 边缘光,终极明暗交界线:这部分展示了边缘光效果作为明暗交界线应用的极致形式

  6. 控制细节的层次:这部分总结了组织图像的第一步是划分光和影,一切都始于光和影的划分,你可以从明暗交界线看到整个画面 ⋙ 中文学习笔记

🤖 The Document is All You Need!一站式 LLM 底层技术原理入门指南

img

这是一篇非常「硬核」的飞书文档,面向非科班出身但想要了解AI技术原理的受众,帮助实现零基础入门大语言模型 (Large Language Mode, LLM) 底层技术原理

文档从浅到深,覆盖了非常多内容细节,并在持续更新 LLM 最新技术进展及相关原理!如果你对ChatGPT等大语言模型感兴趣、希望入门了解大语言模型这件事、想知道这个世界上正在发生什么,那这篇文档值得放入你的收藏夹~

  1. Introduction:人工智能概述

  2. 入门 | 多层感知器 Multiple-Layer Perceiver, MLP

  3. 入门 | 卷积神经网络 Convolutional Neural Network, CNN

  4. 入门 | 循环神经网络 Recurrent Neural Networks, RINNS

  5. 入门 | 强化学习 Reinforcement Learning, RL

  6. 入门 | 自然语言处理与语言模型 NLP & LanguageModeI, LM

  7. 开始进入正题!seq2seq模型与注意力机制 Attention! (2014)

  8. RNN 时代的 BERT 和 GPT!Semi-Supervised Sequence Learning:怎么用大量无标注样本去做自监督学习? (2015)

  9. 欢迎来到芝麻街家族!图解ELMo:Embedding的新纪元 (2018.2)

  10. Attention is All You Need!大语言模型的基石 Transfoormer (2017)

  11. ULM-FiT 与多任务学习 Multitask Learning:NLP的 ImageNet 时刻 (2018.5)

  12. 它来了它来了,终于等到你!大篇幅详解 GPT,GPT-2 与 GPT3

  13. 预训练语言模型的新范式:Prompting!

  14. 为什么它诞生之初远比 GPT 出风头?图解芝麻街家族新员BIERT!(2018.10)

  15. 回看波澜壮阔的语言模型乃至 NLP 的发展史! ⋙ 飞书文档

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_337210.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TypeScript基础篇 - TS模块

目录 模块的概念 Export 语法(default) Export 语法(non-default) import 别名 Type Export语法【TS】 模块相关配置项:module【tsconfig.json】 模块相关配置项:moduleResolution 小节总结 模块的…

【LLM】大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调(SFT)人类反馈的强化学习(RLHF)RLHF结果局限性安全性预训练的安全性安全微调上手就干使用登记代码下载获取模型转换模型搭建Text-Generation-WebUI分发模型…

pytorch的发展历史,与其他框架的联系

我一直是这样以为的:pytorch的底层实现是c(这一点没有问题,见下边的pytorch结构图),然后这个部分顺理成章的被命名为torch,并提供c接口,我们在python中常用的是带有python接口的,所以被称为pytorch。昨天无意中看到Torch是由lua语言写的&…

M 芯片的 macos 系统安装虚拟机 centos7 网络配置

centos 安装之前把网络配置配好或者是把网线插好 第一步找到这个 第二步打开网络适配器 选择图中所指位置 设置好之后 开机启动 centos 第三步 开机以后 编写网卡文件保存 重启网卡就可以了,如果重启网卡不管用,则重启虚拟机即可 “ ifcfg-ens160 ” 这…

【java入门学习】

文章目录 java学习章节目录学习前的准备main函数怎么写?Java程序运行的步骤如何让代码运行起来?java程序由三部分构成:注释注释规范 标识符练习 总结 java学习章节目录 SE语法 初阶段主要来熟悉java的语法: 1.初始java 2.数据类型…

黑苹果如何在macOS Sonoma中驱动博通网卡

准备资源(百度:黑果魏叔 下载) 资源包中包含:AirportBrcmFixup.kext/IOSkywalkFamily.kext/IO80211FamilyLegacy.kext/OpenCore-Patcher 使用方法: 1.将 csr-active-config 设置为 03080000 全选代码 复制 2.在 …

kafka集群搭建(Linux环境)

zookeeper搭建,可以搭建集群,也可以单机(本地学习,没必要搭建zookeeper集群,单机完全够用了,主要学习的是kafka) 1. 首先官网下载zookeeper:Apache ZooKeeper 2. 下载好之后上传到…

layui框架学习(33:流加载模块)

Layui中的流加载模块flow主要支持信息流加载和图片懒加载两部分内容,前者是指动态加载后续内容,示例的话可以参考csdn个人博客主页,鼠标移动到页面底部时自动加载更多内容,而后者是指页面显示图片时才会延迟加载图片信息。   fl…

记录vue的一些踩坑日记

记录vue的一些踩坑日记 安装Jq npm install jquery --save vue列表跳转到详情页,再返回列表的时候不刷新页面并且保持原位置不变; 解决:使用keepAlive 在需要被缓存的页面的路由中添加:keepAlive: true, {path: /viewExamine,nam…

怎么在线修改图片?分享一个图片修改工具

无论是在个人或商业领域,我们都需要使用高质量的图片来传达信息或提高品牌形象。大尺寸的图片也会占据大量的存储空间和带宽,影响网站的加载速度和用户体验。因此,我们需要一种高效的工具来解决这个问题。今天向大家介绍一款非常实用的图片处…

Android 开发代码规范

一. AndroidStudio开发工具规范 使用最新的稳定版本.统一文件的编码格式为utf-8. 清除每个类里面的无效的import导包.代码样式统一,比如,tab缩进4个空格,或者 tab size等如果没有特殊情况使用默认的配置即可。每行字数每行字符数不得超过 160 字符&…

C++--菱形继承

1.什么是菱形继承 单继承:一个子类只有一个直接父类时称这个继承关系为单继承 多继承:一个子类有两个或以上直接父类时称这个继承关系为多继承 菱形继承的问题:菱形继承有数据冗余和二义性的问题,数据冗余是由于创建多个相同类型的…

SpringBoot 如何进行 统一异常处理

在Spring Boot中,可以通过自定义异常处理器来实现统一异常处理。异常处理器能够捕获应用程序中抛出的各种异常,并提供相应的错误处理和响应。 Spring Boot提供了ControllerAdvice注解,它可以将一个类标记为全局异常处理器。全局异常处理器能…

Glow: Generative Flow with Invertible 1×1 Convolutions论文解析及实现(二)

Glow: Generative Flow with Invertible 11 Convolutions 代码github: https://github.com/rosinality/glow-pytorch添加链接描述 1 模型架构如下 1.1 左边图flow模型 Flow model ① ActNorm ② InvConv2dLU ③ AffineCoupling 1.2 右边模型结构Glow模型 Glow Model Block…

万年历【小游戏】(Java课设)

系统类型 Java实现的小游戏 使用范围 适合作为Java课设!!! 部署环境 jdk1.8Idea或eclipse 运行效果 更多Java课设系统源码地址:更多Java课设系统源码地址 更多Java小游戏运行效果展示:更多Java小游戏运行效果展…

解决Font family [‘sans-serif’] not found问题

序言 以下测试环境都是在 anaconda3 虚拟环境下执行。 激活虚拟环境 conda activate test_python_env 或 source activate test_python_env工具: WinSCP Visual Studio Code 这里笔者使用 WinSCP 工具连接,编辑工具是 Visual Studio Code 一、字体…

mysql(六)读写分离

目录 前言 一、概述 二、配置JAVA环境及安装阿米巴 三、配置阿米巴 四、测试 总结 前言 MySQL读写分离是一种常见的数据库架构设计模式,旨在提高系统的性能和可用性。它通过将读操作和写操作分离到不同的MySQL实例上来实现。 读写分离的原理是: 1. 主…

UE5.1.1 创建C++项目失败

因一直使用Unity开发环境,安装Unreal后,并未详细配置过其开发环境,默认创建蓝图工程无异常,但创建UE C项目时总共遇到两个错误: 错误一 Running /Epic/UE/UE_5.1/Engine/Build/BatchFiles/Build.bat -projectfiles -…

郑州主域名和多个子域名的泛域名https证书

随着网络的发展,一个站长往往会创建多个域名网站,为了与主站有联系,站长会选择主站域名的二级域名来创建网站,比如主站是www .***. com,那么新创建的网站的域名就是top .***. com、vip .***. com等。 1.在安装部署htt…

原生求生记:揭秘UniApp的原生能力限制

文章目录 1. 样式适配问题2. 性能问题3. 原生能力限制4. 插件兼容性问题5. 第三方组件库兼容性问题6. 全局变量污染7. 调试和定位问题8. 版本兼容性问题9. 前端生态限制10. 文档和支持附录:「简历必备」前后端实战项目(推荐:⭐️⭐️⭐️⭐️…