• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Tin tức

Hiệu năng các dòng GPU NVidia với các mô hình Deep Learning hiện tại năm 2020

@admiz by @admiz
02/10/2023
in Tin tức
0
Hiệu Năng Các Dòng Gpu Nvidia Với Các Mô Hình Deep Learning Hiện Tại Năm 2020 606fdf4a52207.jpeg

Các mô hình học sâu (Deep Learning) hiện đại có memory footprint lớn. Nhiều GPU không đủ VRAM để đào tạo chúng. Trong bài này, chúng tôi xác định GPU nào có thể đào tạo các network tiên tiến nhất mà không gây ra lỗi bộ nhớ. Chúng tôi cũng đo điểm benchmark hiệu suất đào tạo của mỗi GPU.

Tóm tắt

Các GPU sau có thể đào tạo tất cả các mô hình ngôn ngữ và hình ảnh hiện tại, kể từ tháng 2 năm 2020:

  • RTX 8000: 48 GB VRAM, ~$5,500.
  • RTX 6000: 24 GB VRAM, ~$4,000.
  • Titan RTX: 24 GB VRAM, ~$2,500.

Các GPU sau có thể đào tạo hầu hết (nhưng không phải tất cả) các mô hình hiện tại:

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

  • RTX 2080 Ti: 11 GB VRAM, ~$1,150. *
  • GTX 1080 Ti: 11 GB VRAM, ~$800 refurbished. *
  • RTX 2080: 8 GB VRAM, ~$720. *
  • RTX 2070: 8 GB VRAM, ~$500. *

GPU sau không phù hợp để đào tạo các mô hình hiện tại:

  • RTX 2060: VRAM 6 GB, ~ $ 359.

* Việc đào tạo trên các GPU này đòi hỏi kích thước lô nhỏ, do đó, độ chính xác của mô hình thấp hơn.

Mô hình hình ảnh (Image model)

Kích thước lô tối đa trước khi hết bộ nhớ

Mô hình / GPU2060207020801080 Ti2080 TiTitan RTXRTX 6000RTX 8000
NasNet Lớn4số 8số 8số 8số 8323264
DeepLabv322244số 8số 816
Yolo v324444số 8số 816
Pix2Pix HD0 *0 *0 *0 *0 *112
StyleGAN11144số 8số 816
MaskRCNN12222số 8số 816

* GPU không có đủ bộ nhớ để chạy mô hình.

Hiệu suất, được đo bằng hình ảnh được xử lý mỗi giây

Mô hình / GPU2060207020801080 Ti2080 TiTitan RTXRTX 6000RTX 8000
NasNet Large7.39,210.910.112.916.313,915.6
DeepLabv34,44,825,85,437.69,018,029,12
Yolo v37,89,1511,0811,0314,1214,2212.814,22
Pix2Pix HD0,0 *0,0 *0,0 *0,0 *0,0 *0,730,710,71
StyleGAN1,922,252.62,974,224,944,254,96
MaskRCNN2,853,334.364,425.226,35,545,84

* GPU không có đủ bộ nhớ để chạy mô hình.

Mô hình ngôn ngữ (Language model)

Kích thước lô tối đa trước khi hết bộ nhớ

Mô hình / GPUĐơn vị2060207020801080 Ti2080 TiTitan RTXRTX 6000RTX 8000
Transformer BigToken0 *20002000400040008000800016000
Conv. Seq2SeqToken0 *20002000358435848000800016000
unsupMTToken0 *50050010001000400040008000
Cơ sở BERTSequencesố 8161632326464128
BERT FinetuneSequence16666242448
MT-DNNSequence0 *112244số 8

* GPU không có đủ bộ nhớ để chạy mô hình.

Hiệu suất

Mô hình / GPUCác đơn vị2060207020801080 Ti2080 TiTitan RTXRTX 6000RTX 8000
Transformer BigWords/sec0 *4597631762077780849874077507
Conv. Seq2SeqWords/sec0 *77219950587015671211802050022450
unsupMTWords/sec0 *1010121218242025385037253735
BERT BaseEx./sec34475860831029894
BERT FinetueEx./sec715181722302927
MT-DNNEx./sec0 *34số 89181828

* GPU không có đủ bộ nhớ để chạy mô hình.

Kết quả được chuẩn hóa bởi Quadro RTX 8000

Hình 2. Thông lượng đào tạo được chuẩn hóa theo Quadro RTX 8000. Trái: Image model. Phải: Language model.

Kết luận

  • Các mô hình ngôn ngữ được hưởng lợi nhiều hơn từ bộ nhớ GPU lớn hơn các mô hình hình ảnh. Lưu ý cách sơ đồ bên phải dốc hơn bên trái. Điều này chỉ ra rằng các mô hình ngôn ngữ bị ràng buộc nhiều bộ nhớ hơn và các mô hình hình ảnh bị giới hạn tính toán nhiều hơn.
  • GPU có VRAM cao hơn có hiệu suất tốt hơn vì sử dụng kích thước lô lớn hơn giúp bão hòa các lõi CUDA.
  • GPU có VRAM cao hơn cho phép kích thước lô lớn hơn tương ứng. Tính toán ngược phong bì mang lại kết quả hợp lý: GPU có VRAM 24 GB có thể phù hợp với lô lớn hơn ~ 3x so với GPU có 8 GB VRAM.
  • Các mô hình ngôn ngữ chiếm bộ nhớ không cân xứng cho các chuỗi dài vì sự chú ý là bậc hai đối với độ dài chuỗi.

Khuyến nghị về GPU

  • RTX 2060 (6 GB): nếu bạn muốn khám phá việc học sâu trong thời gian rảnh rỗi.
  • RTX 2070 hoặc 2080 (8 GB): nếu bạn nghiêm túc về việc học sâu, nhưng ngân sách GPU của bạn là 600-800 đô la. Tám GB VRAM có thể phù hợp với phần lớn các mô hình.
  • RTX 2080 Ti (11 GB): nếu bạn nghiêm túc về việc học sâu và ngân sách GPU của bạn là ~ 1.200 đô la. RTX 2080 Ti nhanh hơn ~ 40% so với RTX 2080.
  • Titan RTX và Quadro RTX 6000 (24 GB): nếu bạn đang làm việc trên các mô hình SOTA rộng rãi, nhưng không có ngân sách cho việc chứng minh trong tương lai có sẵn với RTX 8000.
  • Quadro RTX 8000 (48 GB): bạn đang đầu tư vào tương lai và thậm chí có thể đủ may mắn để nghiên cứu học tập sâu SOTA vào năm 2020.

Chú thích

Image Models

ModelTaskDatasetImage SizeRepo
NasNet LargeImage ClassificationImageNet331×331Github
DeepLabv3Image SegmentationPASCAL VOC513×513GitHub
Yolo v3Object DetectionMSCOCO608×608GitHub
Pix2Pix HDImage StylizationCityScape2048×1024GitHub
StyleGANImage GenerationFFHQ1024×1024GitHub
MaskRCNNInstance SegmentationMSCOCO800×1333GitHub

Language Models

ModelTaskDatasetRepo
Transformer BigSupervised machine translationWMT16_en_deGitHub
Conv. Seq2SeqSupervised machine translationWMT14_en_deGitHub
unsupMTUnsupervised machine translationNewsCrawlGitHub
BERT BaseLanguage modelingenwik8GitHub
BERT FinetuneQuestion and answerSQUAD 1.1GitHub
MT-DNNGLUEGLUEGitHub

 

Previous Post

So sánh công nghệ ổ cứng SSD: NVMe khác với SATA như thế nào?

Next Post

Top 3 câu hỏi thường gặp về card đồ họa QUADRO

Related Posts

Iot: Số Hóa Hôm Nay Vì Một Tương Lai “vạn Vật Kết Nối” 606fe502539ac.jpeg
Tin tức

IoT: Số hóa hôm nay vì một tương lai “vạn vật kết nối”

04/01/2024
Private Cloud: Đánh Giá Hai Phương án Hosted Và On Premise 606fe52520409.png
Tin tức

Private Cloud: Đánh giá hai phương án Hosted và On-Premise

03/01/2024
Raid Là Gì? Hướng Dẫn Lựa Chọn Cấu Hình Raid 606fe5291593c.jpeg
Tin tức

RAID là gì? Hướng dẫn lựa chọn cấu hình RAID

03/01/2024
Giới Thiệu Bộ Nhớ Intel Optane Persistent Memory 200 Series Mới 60712c5d88d68.png
Tin tức

Giới thiệu bộ nhớ Intel Optane Persistent Memory 200 Series mới

02/01/2024
Thế Hệ Xe điện Mới được Tăng Sức Mạnh Với Nvidia Drive 60751fe08b045.jpeg
Tin tức

Thế hệ xe điện mới được tăng sức mạnh với NVIDIA DRIVE

02/01/2024
Nvidia Và Các Nhà Sản Xuất Máy Tính Toàn Cầu Cho Ra Mắt Nền Tảng Máy Chủ Doanh Nghiệp Tối ưu Cho Công Nghiệp Ai 60751fd306406.png
Tin tức

NVIDIA và các nhà sản xuất máy tính toàn cầu cho ra mắt nền tảng máy chủ doanh nghiệp tối ưu cho công nghiệp AI

01/01/2024
Next Post
Top 3 Câu Hỏi Thường Gặp Về Card đồ Họa Quadro 606fdf561f9af.jpeg

Top 3 câu hỏi thường gặp về card đồ họa QUADRO

Bài mới nhất

Dịch Vụ Thiết Kế Website Tại Hải Dương Chuyên Nghiệp, ấn Tượng Và Uy Tín 612d25752b14f.png

Dịch vụ thiết kế website tại Hải Dương chuyên nghiệp, ấn tượng và uy tín

06/05/2025
Top Công Ty Thiết Kế Website Tại Biên Hòa Chuyên Nghiệp, Chuẩn Seo 612d259494e93.jpeg

Top công ty thiết kế website tại Biên Hòa chuyên nghiệp, chuẩn SEO

06/05/2025
Top Công Ty Thiết Kế Website Tại Vinh – Nghệ An Uy Tín 612d259a9cae3.jpeg

Top công ty thiết kế website tại Vinh – Nghệ An uy tín

05/05/2025
Top 10 Công Ty Thiết Kế Website Tại Nha Trang Chuyên Nghiệp 612d0a9ad018b.jpeg

Top 10 công ty thiết kế website tại Nha Trang chuyên nghiệp

05/05/2025
Các Dịch Vụ Thiết Kế Website Tại Vĩnh Phúc Chuyên Nghiệp, Uy Tín Nhất 612d0a91e63af.jpeg

Các dịch vụ thiết kế website tại Vĩnh Phúc chuyên nghiệp, uy tín nhất

04/05/2025

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution