
AI 这个名词绝对是今年与未来最火热的议题之一,目前出现各类生成式 AI 应用,例如 ChatGPT 和 Stable Diffusion,为行业带来全新的发展路线。 为了让生成式 AI 应用有更高效的产出,AMD、Intel 与 NVIDIA 等芯片厂商皆不断研发新的软硬件,以期在这块市场上取得更多收益。 这次笔者就利用目前持有的三张入门显卡(ARC A380、GTX 1650和RX 6400),来让读者了解三家芯片厂商的入门产品能提供多少运算效能。
GUNNIR ARC A380 Photon 6G OC 外观
笔者这张ARC A380品牌是GUNNIR,是一张需要外接电源的版本,目前电商平台有销售的SPARKLEARCA380 ELF则无需外接电源。 两者主要差别是 GPU 加速频率。 据TechPowerUp数据库显示,ARC A380 Photon 6G OC加速频率是2450 MHz,ARCA380 ELF加速频率是2050 MHz,差了400 MHz。
ARC A380 Photon 6G OC 外盒正面印有产品外观彩图,散热器跟外接电源的设计,让它看起来不像入门级显卡。 右上角标示该卡为IntelARC 3系列成员,支持XeSS超采样技术和DirectX 12 Ultimate API。
背面标示该卡需要的环境配备,例如350W以上并且有8 Pin PCIe电源接头的电源供应器、建议8GB以上系统内存、AMD Ryzen 3000系列及更新的处理器并能开启Resizable BAR功能的平台,以及Windows 10或Windows 11 64位系统。


正面可以看到整体采黑色双风扇散热器,背面也有一块黑色的金属强化背板,已经是接近中阶显卡才有的待遇,整体尺寸不含挡板为 222 x 114 x 42 mm。


内部可以看到有一块不小的铝挤散热片,还有一根导热管。 上方印有Intel ARC字样,8 Pin电源插座旁还有一块GUNNIR Logo的发光区域,正常开机时会发蓝光。


在影像输出方面,具备 1 个 HDMI 2.0 跟 3 个 DisplayPort 2.0 输出接头,是 4000 左右显示卡中输出接头最多的。

性能测试
硬件规格
处理器 | AMD Ryzen 5 5600X (关闭 PBO) |
---|---|
主板 | ASUS PRIME B550M-K/CSM |
内存 | XPG SPECTRIX D60G DDR4 RGB 3000 8GB x2 (OC 3200) |
显示卡 | ASUS Dual Radeon RX 6400 GUNNIR ARC A380 Photon 6G OC ZOTAC GAMING GeForce GTX 1650 Low Profile |
储存 | ADATA Legend 710 |
屏幕 | TUF Gaming VG27AQL1A ZAKU II EDITION |
驱动版本 :
- ASUS Dual Radeon RX 6400 – AMD Software : Adrenalin Edition 23.11.1
- GUNNIR ARC A380 Photon 6G OC – Intel Arc & Iris Xe Graphics 31.0.101.4972
- ZOTAC GAMING GeForce GTX 1650 Low Profile – GeForce Game Ready 546.17
操作系统:Windows 11 23H2 (关闭防毒)
电源设置:平衡模式
性能与游戏测试
3DMark
不免俗的还是要跑一下 Benchmark,首先是 3DMark,Time Spy 中 ARC A380 分数最高,Fire Strike Extreme 中则是 RX 6400 表现最佳。


Geekbench
再来是 Geekbench,OpenCL 性能 GTX 1650 具备优势,Vulkan 则是 RX 6400 领先,而 ARC A380 在这两项测试中性能皆居次。
GravityMark Vulkan
GravityMark Vulkan 的显卡性能排名与 Geekbench Vulkan 相同,表示 RX 6400 在 Vulkan API 的性能表现是三者中最强的,只是大家性能差距也不大。

Counter-Strike 2
简单试个游戏,首先是Counter-Strike 2,由于是入门显卡,所以笔者统一使用1080P 120Hz低特效全屏幕设置,地图选Dust 2进行AI对战,结果RX 6400出现画面异常不能玩,只有在未设置全屏幕前的窗口化状态下正常,因此RX 6400在这项没有成绩。 GTX 1650 在 CS2 游戏测试中 AVG FPS 最高。

Overwatch 2
接着测 Overwatch 2,一样是 1080P 120Hz 低特效全屏,关闭动态渲染比率,游戏分辨率设置 100%,最大帧率 300,地图 66 号公路,AVG FPS 由 RX 6400 胜出。

AI 相关应用测试
Stable Diffusion WebUI
现在进入重头戏,先来试个最常用的本地 AI 应用 Stable Diffusion WebUI,模型使用 Stable Diffusion V1.5,GTX 1650 用的是 AUTOMATIC1111 的 Stable Diffusion web UI,版本 1.6.0;ARC A380 用的是 openvinotoolkit 的Stable Diffusion web UI,版本 1.6.0;RX 6400 使用 Nod.AI 专为 AMD RDNA 显示卡最佳化的 Shark (Vulkan API),版本 20231009.984。 测试使用的设置和 Prompt 跟「Stable Diffusion AI 生图加速新利器! 通过 LCM LoRA 大幅提升生图速度」这篇相同,测试结果显示 Intel 的 OpenVINO 加速相当出色,速度让对手看不到车尾灯。

本地 LLM 大型语言模型运作性能测试
笔者使用KoboldCpp V1.5加载Taiwan-LLM-7B-v2.1-chat-Q4_K_S.gguf 模型进行测试,设置只更改 Presets,GTX 1650 选择 cuBLAS,ARC A380 和 RX 6400 选择 CLBlast,询问的问题是「什么是LLM」,连续三次。 图片排序左至右依序是 GTX 1650、ARC A380、RX 6400,测试结果显示 GTX 1650 效率最高,RX 6400 次之。



AI 视频放大补帧性能测试
测试工具使用 Waifu2x-Extension-GUI 版本 3.108.01, 放大工具选择 Real-CUGAN ncnn Vulkan,放大倍率为预设的 2X,补帧工具选择 RIFE ncnn Vulkan,针对各显卡开启硬件加速选项,图片存储格式用 WebP,图片质量设 80,测试的视频来源 (360P) 可按此下载。 此项测试由 GTX 1650 拿下冠军,RX 6400 获得亚军。

结论
以一般娱乐用途而言,在 4000 这个价位上,三款显卡的效能其实差不多,要是真的想跑 AI 应用,那么 NVIDIA 的显卡绝对是最稳的选择,AI 相关应用软件基本上都支持 CUDA,可以让你获得下载即可用的体验。
在本次测试结果中,AMD显卡虽然性能表现不如NVIDIA(这边仅考虑Windows平台),通过OpenCL或VulkanAPI还是可以获得一定程度的效果。 另外,AMD的ROCm虽然说已登陆Windows平台,但笔者使用KoboldCpp的ROCm 版本只能正常开启程序,加载模型后就自己关闭了,而Shark从Vulkan改为ROCm会显示错误出不了图,因笔者手上没AMD更高阶的显卡(本身偏好用无须外接电源的显示卡),不晓得是不是VRAM不够所以跑不了,或是有其他原因,也希望能在Windows系统上看到更多优化解决方案出现。
至于Intel ARC显示卡在AI的发展,只要Intel持续积极对社群/开发者进行资源投入,以本次Stable Diffusion WebUI测出来的效率来看,在Windows系统的未来令人期待。
笔者并非AI相关产业人员,对这方面并不熟悉,若是大家有更准确且方便比较性能的测试方法/工具欢迎提出,希望是以简单安装、容易使用且免费或开放源代码,能够在Windows系统正常运作为主。 关于 AI 应用测试结果仅供参考,测试期间为 11 月底至 12 月初,有机会且刚好有硬件的话会继续测试一些东西给大家看。