TensorRT插件助力,AI绘画更快一步,实战验证
从ChatGPT到Sora,众多的AI是目前很火热的技术和话题。而这中间,显卡是很重要的一个部分,显卡使用AI功能,已经是非常普遍的了。
AI的应用有很多,除了在游戏上的使用,例如众所周知的DLSS外,还可以用于其他的多种用途。那么作为个人用户,很多爱好者更喜欢使用本地化部署,搭建自己的AI平台,更加贴合和符合自己的需要,通常是使用自己的电脑来完成。那么使用NVIDIA的显卡,就是实现这些目的重要工具。
对于电脑爱好者来说,NVIDIA的显卡是为人熟知的,在个人市场占有率很高。当然,现在显卡价格很贵,所以这款技嘉的RTX 4070 SUPER AERO OC 12G雪鹰,5K的价位已经属于不错的了。它都有的DLSS功能,是基于AI深度学习的提升画质的技术,是一款由 AI 驱动的性能倍增器, 可以让玩家在不花费额外成本的情况下运行更高分辨率和更高帧率的游戏,目前已经更新的DLSS 3.5,有不少的游戏支持DLSS。
显卡是全白色的,哑光表面配合斜纹,低调沉稳。配备技嘉经典的“风之力”散热系统,由三个90mm导流风扇组成,其中相邻的风扇选择方向是反的,这样可以减少扰流和增加气压。风扇的扇叶上面有有导流设计,风扇使用了纳米石墨烯润滑油,可以延长寿命。风扇具备自动启停功能,当GPU温度较低或处于较低负载时,风扇将会自动停止运转,减少噪音。
显卡的背面采用了全金属背板,提升显卡坚硬度的同时提供良好的散热。显卡右侧有进气格栅,里面的散热鳍片和复合式热管清晰可见,8根复合式热管,可提供更好的散热性能。
显卡中部是供电接口,采用了最新规范的16PIN 12VHPWR接口,上面还有指示灯。左侧是双BIOS切换开关,分为超频和静音模式,可以自由切换。
我们先来看看这款显卡在游戏上的性能,适用3DMARK进行测试。
先来看看电脑的配置,CPU是英特尔i9-14900KF(临时用的),内存是光威48GB内存,显卡是技嘉的RTX 4070 SUPER 12GB(RTX 4070 SUPER AERO OC 12G雪鹰),主板是技嘉的B760M AORUS ELITE X AX(B760M冰雕X)。
首先是3DMARK 最新的STEEL NOMAD测试,总分4626分。
然后是TIME SPY EXTREME,总分10594,其中图形得分10232,CPU得分13252。
3DMARK FIRE STRIKE ULTRA测试,总分13505,其中图形得分12591,物理得分55699,综合得分6975。
DLSS测试,关闭DLSS的事实是28.76帧,而启动DLSS3后,帧数高达100.86帧,提升巨大。
可以说,这款显卡本身已经是十分优秀了,可以在2K-4K分辨率下玩一些3A大作没有问题。
AI不仅体现在对于游戏帧数的提高,NVIDIA在Computex2024期间发布一项全新项目:G-Assist。这个项目利用RTX显卡的强大AI功能,将为PC游戏玩家提供一种全新的互动体验。G-Assist项目就像一个智能助手,它能理解游戏的上下文,并通过对话方式提供即时的帮助和指导。
用句通俗的话说,就是当你在游戏里遇到各种问题的时候,G-Assist可以回答玩家关于物品、任务和关卡BOSS等等各方面的问题, 帮助玩家更好的畅玩游戏。同时也会对玩家的电脑进行智能的调整,获得最优的状态。
当然,利用显卡不止玩游戏,下面来看看AI其他的一些用途和表现,尤其是使用了TensorRT插件后,对于AI绘画的影响。要说明的是,AI用途不止是绘画哦,这里只是举例。
个人使用电脑搭建平台使用AI绘画,是现在很流行的。本地部署的开源平台,最常见的是 “Stable Diffusion” ,俗称SD。使用SD就可以进行 AI 绘画,它的基本特色,就是输入文字描述,然后通过显卡进行AI运算,然后生产图片。比如上图,就是在SD界面上输入部分文本描述文字后,AI绘画自动完成的。
“Stable Diffusion” 简称SD,SD平台的搭建牵扯到许多软件,还有其他因素。感谢“秋葉aaaki” 大神,使用了他做的整合包。
这个是大佬做的启动器,各种设置画面简洁,这个并不是SD的界面。
那么在生成引擎里我们选择技嘉的4070 SUPER显卡,除了显卡CPU和核显,也是可以绘图的,但是速度就差的太远了。
一键启动后,会打开浏览器界面,这里才是SD的WebUI界面。在这里可以有各种设置。包括出图的尺寸,数量、模型等等各种参数。对于我们这个初学者来说,保持默认是个好选择。如果是最常用的文生图的话,所需要做的只是输入提示词。提示词分为正向和反向,正向是绘画的方向、反向是绘画避免的方向。然后点击生成就可以了,多简单,上图就是生成了20张512x512的图片,用时27.9秒。
图形越大需要的时间越多,将图片的尺寸换为768x768,那么用时就是1分钟1.4秒,就是61.4秒。
同样的大小,我们换另外的一组文本词汇,结果用时1分钟13.1秒,就是73.1秒。
提高速度是AI的一个关键目标,可以有多重方法。TensorRT 是一个由 NVIDIA 开发的用于推理的高性能 SDK,TensorRT 加速插件可以对Stable Diffusion Web UI训练好的模型进行优化,通过优化网络计算,来提高模型出图效率。
按照网上的攻略,我们安装了这个插件并进行了设置,然后按照上面那3种情况下,再次运行,看看有什么不同。
首先是512x512下20张图片,这里用时19.3秒,相对于没有用插件之前的27.9秒,速度提升了不少。
然后是768x768分辨率下,同样是20张照片,时间是44.3秒。而之前没有用插件的时候,是61.4秒。
换另外一组文本词汇,时间是58.3秒,而没有用插件之前,是73.1秒。
通过3组不同大小和文本的对比,我们看,使用了TenserRT插件后,出图时间分别是原来的67.2%,72.1%和72.5%,出图速度大幅提升,对于固定大小输出,很有效果。当然TenserRT插件也有一些局限,比如需要固定的尺寸,还有重新输出模型。
通过上面的实际操作,可以看出,使用这款N卡,技嘉的RTX 4070 SUPER AERO OC 12G雪鹰,不仅可以在游戏里使用AI功能,通过DLSS获得游戏效果的提升,也可以使用AI,变身生产力工具,例如在AI绘画里,可以大显身手,并且可以通过各种方式,提升绘画效率。一个显卡,多种用途,非常实用。
https://item.jd.com/100087948278.html