• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Tin tức

Hiệu năng các dòng GPU NVidia với các mô hình Deep Learning hiện tại năm 2020

@admiz by @admiz
02/10/2023
in Tin tức
0
Hiệu Năng Các Dòng Gpu Nvidia Với Các Mô Hình Deep Learning Hiện Tại Năm 2020 606fdf4a52207.jpeg

Các mô hình học sâu (Deep Learning) hiện đại có memory footprint lớn. Nhiều GPU không đủ VRAM để đào tạo chúng. Trong bài này, chúng tôi xác định GPU nào có thể đào tạo các network tiên tiến nhất mà không gây ra lỗi bộ nhớ. Chúng tôi cũng đo điểm benchmark hiệu suất đào tạo của mỗi GPU.

Tóm tắt

Các GPU sau có thể đào tạo tất cả các mô hình ngôn ngữ và hình ảnh hiện tại, kể từ tháng 2 năm 2020:

  • RTX 8000: 48 GB VRAM, ~$5,500.
  • RTX 6000: 24 GB VRAM, ~$4,000.
  • Titan RTX: 24 GB VRAM, ~$2,500.

Các GPU sau có thể đào tạo hầu hết (nhưng không phải tất cả) các mô hình hiện tại:

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

  • RTX 2080 Ti: 11 GB VRAM, ~$1,150. *
  • GTX 1080 Ti: 11 GB VRAM, ~$800 refurbished. *
  • RTX 2080: 8 GB VRAM, ~$720. *
  • RTX 2070: 8 GB VRAM, ~$500. *

GPU sau không phù hợp để đào tạo các mô hình hiện tại:

  • RTX 2060: VRAM 6 GB, ~ $ 359.

* Việc đào tạo trên các GPU này đòi hỏi kích thước lô nhỏ, do đó, độ chính xác của mô hình thấp hơn.

Mô hình hình ảnh (Image model)

Kích thước lô tối đa trước khi hết bộ nhớ

Mô hình / GPU 2060 2070 2080 1080 Ti 2080 Ti Titan RTX RTX 6000 RTX 8000
NasNet Lớn 4 số 8 số 8 số 8 số 8 32 32 64
DeepLabv3 2 2 2 4 4 số 8 số 8 16
Yolo v3 2 4 4 4 4 số 8 số 8 16
Pix2Pix HD 0 * 0 * 0 * 0 * 0 * 1 1 2
StyleGAN 1 1 1 4 4 số 8 số 8 16
MaskRCNN 1 2 2 2 2 số 8 số 8 16

* GPU không có đủ bộ nhớ để chạy mô hình.

Hiệu suất, được đo bằng hình ảnh được xử lý mỗi giây

Mô hình / GPU 2060 2070 2080 1080 Ti 2080 Ti Titan RTX RTX 6000 RTX 8000
NasNet Large 7.3 9,2 10.9 10.1 12.9 16.3 13,9 15.6
DeepLabv3 4,4 4,82 5,8 5,43 7.6 9,01 8,02 9,12
Yolo v3 7,8 9,15 11,08 11,03 14,12 14,22 12.8 14,22
Pix2Pix HD 0,0 * 0,0 * 0,0 * 0,0 * 0,0 * 0,73 0,71 0,71
StyleGAN 1,92 2,25 2.6 2,97 4,22 4,94 4,25 4,96
MaskRCNN 2,85 3,33 4.36 4,42 5.22 6,3 5,54 5,84

* GPU không có đủ bộ nhớ để chạy mô hình.

Mô hình ngôn ngữ (Language model)

Kích thước lô tối đa trước khi hết bộ nhớ

Mô hình / GPU Đơn vị 2060 2070 2080 1080 Ti 2080 Ti Titan RTX RTX 6000 RTX 8000
Transformer Big Token 0 * 2000 2000 4000 4000 8000 8000 16000
Conv. Seq2Seq Token 0 * 2000 2000 3584 3584 8000 8000 16000
unsupMT Token 0 * 500 500 1000 1000 4000 4000 8000
Cơ sở BERT Sequence số 8 16 16 32 32 64 64 128
BERT Finetune Sequence 1 6 6 6 6 24 24 48
MT-DNN Sequence 0 * 1 1 2 2 4 4 số 8

* GPU không có đủ bộ nhớ để chạy mô hình.

Hiệu suất

Mô hình / GPU Các đơn vị 2060 2070 2080 1080 Ti 2080 Ti Titan RTX RTX 6000 RTX 8000
Transformer Big Words/sec 0 * 4597 6317 6207 7780 8498 7407 7507
Conv. Seq2Seq Words/sec 0 * 7721 9950 5870 15671 21180 20500 22450
unsupMT Words/sec 0 * 1010 1212 1824 2025 3850 3725 3735
BERT Base Ex./sec 34 47 58 60 83 102 98 94
BERT Finetue Ex./sec 7 15 18 17 22 30 29 27
MT-DNN Ex./sec 0 * 3 4 số 8 9 18 18 28

* GPU không có đủ bộ nhớ để chạy mô hình.

Kết quả được chuẩn hóa bởi Quadro RTX 8000

Hình 2. Thông lượng đào tạo được chuẩn hóa theo Quadro RTX 8000. Trái: Image model. Phải: Language model.

Kết luận

  • Các mô hình ngôn ngữ được hưởng lợi nhiều hơn từ bộ nhớ GPU lớn hơn các mô hình hình ảnh. Lưu ý cách sơ đồ bên phải dốc hơn bên trái. Điều này chỉ ra rằng các mô hình ngôn ngữ bị ràng buộc nhiều bộ nhớ hơn và các mô hình hình ảnh bị giới hạn tính toán nhiều hơn.
  • GPU có VRAM cao hơn có hiệu suất tốt hơn vì sử dụng kích thước lô lớn hơn giúp bão hòa các lõi CUDA.
  • GPU có VRAM cao hơn cho phép kích thước lô lớn hơn tương ứng. Tính toán ngược phong bì mang lại kết quả hợp lý: GPU có VRAM 24 GB có thể phù hợp với lô lớn hơn ~ 3x so với GPU có 8 GB VRAM.
  • Các mô hình ngôn ngữ chiếm bộ nhớ không cân xứng cho các chuỗi dài vì sự chú ý là bậc hai đối với độ dài chuỗi.

Khuyến nghị về GPU

  • RTX 2060 (6 GB): nếu bạn muốn khám phá việc học sâu trong thời gian rảnh rỗi.
  • RTX 2070 hoặc 2080 (8 GB): nếu bạn nghiêm túc về việc học sâu, nhưng ngân sách GPU của bạn là 600-800 đô la. Tám GB VRAM có thể phù hợp với phần lớn các mô hình.
  • RTX 2080 Ti (11 GB): nếu bạn nghiêm túc về việc học sâu và ngân sách GPU của bạn là ~ 1.200 đô la. RTX 2080 Ti nhanh hơn ~ 40% so với RTX 2080.
  • Titan RTX và Quadro RTX 6000 (24 GB): nếu bạn đang làm việc trên các mô hình SOTA rộng rãi, nhưng không có ngân sách cho việc chứng minh trong tương lai có sẵn với RTX 8000.
  • Quadro RTX 8000 (48 GB): bạn đang đầu tư vào tương lai và thậm chí có thể đủ may mắn để nghiên cứu học tập sâu SOTA vào năm 2020.

Chú thích

Image Models

Model Task Dataset Image Size Repo
NasNet Large Image Classification ImageNet 331×331 Github
DeepLabv3 Image Segmentation PASCAL VOC 513×513 GitHub
Yolo v3 Object Detection MSCOCO 608×608 GitHub
Pix2Pix HD Image Stylization CityScape 2048×1024 GitHub
StyleGAN Image Generation FFHQ 1024×1024 GitHub
MaskRCNN Instance Segmentation MSCOCO 800×1333 GitHub

Language Models

Model Task Dataset Repo
Transformer Big Supervised machine translation WMT16_en_de GitHub
Conv. Seq2Seq Supervised machine translation WMT14_en_de GitHub
unsupMT Unsupervised machine translation NewsCrawl GitHub
BERT Base Language modeling enwik8 GitHub
BERT Finetune Question and answer SQUAD 1.1 GitHub
MT-DNN GLUE GLUE GitHub

 

Previous Post

So sánh công nghệ ổ cứng SSD: NVMe khác với SATA như thế nào?

Next Post

Top 3 câu hỏi thường gặp về card đồ họa QUADRO

Related Posts

Tin tức

Liên tiếp tử vong do truyền dịch ở phòng khám tư: Hãy bỏ thói quen mệt là truyền

17/03/2026
Photo 0 1506842648356
Tin tức

Mở khóa bằng hình vẽ trên Android không an toàn như chúng ta tưởng

07/03/2026
Malware Andro 1
Tin tức

Ít nhất 2 thương hiệu điện thoại Trung Quốc giá rẻ bị cài sẵn mã độc

07/03/2026
Iot: Số Hóa Hôm Nay Vì Một Tương Lai “vạn Vật Kết Nối” 606fe502539ac.jpeg
Tin tức

IoT: Số hóa hôm nay vì một tương lai “vạn vật kết nối”

04/01/2024
Private Cloud: Đánh Giá Hai Phương án Hosted Và On Premise 606fe52520409.png
Tin tức

Private Cloud: Đánh giá hai phương án Hosted và On-Premise

03/01/2024
Raid Là Gì? Hướng Dẫn Lựa Chọn Cấu Hình Raid 606fe5291593c.jpeg
Tin tức

RAID là gì? Hướng dẫn lựa chọn cấu hình RAID

03/01/2024
Next Post
Top 3 Câu Hỏi Thường Gặp Về Card đồ Họa Quadro 606fdf561f9af.jpeg

Top 3 câu hỏi thường gặp về card đồ họa QUADRO

Bài mới nhất

Xây Dựng Hệ Thống Crm Giúp Quản Trị Quan Hệ Khách Hàng Tại Việt Nam 612d00c078b25.jpeg

Xây dựng hệ thống CRM giúp quản trị quan hệ khách hàng tại Việt Nam

10/05/2026
Hướng Dẫn Cách Thiết Kế Web Bằng Adobe Xd Cho Người Mới Bắt đầu 612cff1652a2c.jpeg

Hướng dẫn cách thiết kế web bằng adobe xd cho người mới bắt đầu

10/05/2026
Các Danh Mục Website Và Thành Phần Cơ Bản Cần Có Trên Trang Web 612cff2c92a86.jpeg

Các danh mục website và thành phần cơ bản cần có trên trang web

09/05/2026
Tổng Hợp Các Lỗi Thường Gặp Khi Thiết Kế Web Cơ Bản 612cff25ac128.jpeg

Tổng hợp các lỗi thường gặp khi thiết kế web cơ bản

09/05/2026
Top ý Tưởng Thiết Kế Website Sáng Tạo, độc đáo, Hiện đại 612cff1d9e9bc.jpeg

Top ý tưởng thiết kế website sáng tạo, độc đáo, hiện đại

08/05/2026

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution