• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Kiến thức tổng hợp Deep Learning

Điểm benchmark hiệu năng deep learning của RTX 2080 Ti trên TensorFlow

@admiz by @admiz
09/05/2021
in Deep Learning
0
Điểm Benchmark Hiệu Năng Deep Learning Của Rtx 2080 Ti Trên Tensorflow 605d681cef072.jpeg

Trong blog này, chúng tôi đã kiểm tra điểm chuẩn GPU NVIDIA GeForce RTX 2080 Ti trên khung học sâu của TensorFlow . Kết quả của chúng tôi cho thấy RTX 2080 Ti cung cấp giá trị đáng kinh ngạc cho giá cả. Chúng tôi đã chạy thử nghiệm trên một trong những máy trạm học sâu của chúng tôi (xem thông số kỹ thuật hệ thống bên dưới), với nhiều cấu hình GPU (1,2,4). Với mức giá khởi điểm, kết quả của Turing RTX 2080 Ti thực sự đáng chú ý cho việc đào tạo học tập sâu. Điều này được thể hiện rõ hơn khi so sánh hiệu suất với Volta Powered TITAN V ( xem blog của chúng tôi ở đây ), trong đó hiệu suất gần như ngang bằng.

Benchmark Snapshot: Nasnet, VGG16, Inception V3, ResNET-50

Phương pháp đo

Cấu hình được sử dụng cho TensorFlow không thay đổi từ đầu đến cuối ngoại trừ số lượng GPU được sử dụng trong một lần chạy chuẩn cụ thể.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Ghi chú: Chức năng giữ lại hình ảnh trong TensorFlow đã được sử dụng để nhập dữ liệu thực (hình ảnh) vào mô hình Nasnet, chứa dữ liệu thực bao gồm hình ảnh jpeg của hoa từ bộ dữ liệu của hình ảnh. Các mô hình khác Resnet50, VGG16, InceptionV3, đã sử dụng dữ liệu tổng hợp, được đo bằng cách sử dụng dữ liệu mà không có bất kỳ sửa đổi nào được thực hiện trong suốt chu kỳ thử nghiệm. Các thử nghiệm đã chạy bằng cách sử dụng gói python-pip trong thời gian chạy Anaconda theo quy định trong tài liệu cài đặt TensorFlow.

Các tập lệnh chuẩn đã được tải xuống từ github chính thức của TensorFlow, cùng với các mô hình được xây dựng trước. Trong mỗi trường hợp, các biến duy nhất thay đổi từ chạy sang chạy là:  num_gpus  và mô hình . Tất cả các thông số khác không thay đổi trong suốt thời gian của các thí nghiệm này. Kích thước hàng loạt được sử dụng là 64 cho tất cả đào tạo, chạy ở mặc định, độ chính xác đơn (fp32).

Thông số kỹ thuật hệ thống máy trạm RTX 2080 Ti

CPU 2 x Intel Xeon Gold 6148 2.4GHz CPU
RAM192GB DDR4-2666
SSD500 GB SSD
GPU1, 2, 4x NVIDIA GeForce RTX 2080 Ti (blower model)
OSUbuntu Server 16.04
DRIVERNVIDIA version 396.44
CUDACUDA Toolkit 9.2
Pythonv 2.7, pip v8, Anaconda
TensorFlow1.12

NVIDIA GeForce RTX 2080 Ti Deep Learning Benchmark trên TensorFlow: cấu hình 1, 2 và 4 GPU

Nasnet Images/Sec (Real Data)

ResNet-50 Images/Sec (Synthetic Data)

Inception V3 Images/Sec (Synthetic Data)

VGG16 Images/Sec (Synthetic Data)

Các lệnh Nasnet Benchmark & Output trên TensorFlow

Bên dưới các lệnh cụ thể để chạy từng kịch bản được ghi lại trên kết quả điểm chuẩn. Để thay đổi các mô hình mạng thần kinh, chỉ cần thay đổi  mô hình  lá cờ tức là  mô hình = resnet50 để đào tạo các mô hình Resnet50 với tất cả các biến khác như vậy.

Nasnet 1 GPU

python tf_cnn_benchmarks.py --data_format=NCHW --batch_size=64 --model=nasnet --optimizer=momentum -- variable_update=replicated --nodistortions --gradient_repacking=8 --num_gpus=1 --num_epochs=90 --weight_decay=1e-4 --data_dir=/data --train_dir=/data/scratch --data_name=imagenet

Step Img/sec total_loss
1 images/sec: 156.8 +/- 0 (jitter = 0.0) 7.496
10 images/sec: 156.7 +/- 0.5 (jitter = 2.5) 7.345
20 images/sec: 156.5 +/- 0.4 (jitter = 1.9) 7.52
30 images/sec: 156 +/- 0.3 (jitter = 2.0) 7.41
40 images/sec: 156.6 +/- 0.3 (jitter = 2.1) 7.473
50 images/sec: 156.5 +/- 0.3 (jitter = 2.1) 7.504
60 images/sec: 156.2 +/- 0.3 (jitter = 2.0) 7.509
70 images/sec: 156.4 +/- 0.3 (jitter = 2.1) 7.54
80 images/sec: 156.3 +/- 0.2 (jitter = 2.0) 7.332
90 images/sec: 156.3 +/- 0.2 (jitter = 1.9) 7.583
100 images/sec: 156.3 +/- 0.2 (jitter = 2.1) 7.43
—————————————————————-
total images/sec: 156.2
—————————————————————-

Nasnet 2 GPU

python tf_cnn_benchmarks.py --data_format=NCHW --batch_size=64 --model=nasnet --optimizer=momentum -- variable_update=replicated --nodistortions --gradient_repacking=8 --num_gpus=2 --num_epochs=90 --weight_decay=1e-4 --data_dir=/data --train_dir=/data/scratch --data_name=imagenet

Step Img/sec total_loss
1 images/sec: 285.8 +/- 0 (jitter = 0.0) 7.482
10 images/sec: 288.2 +/- 1.4 (jitter = 4.6) 7.537
20 images/sec: 281.7 +/- 2.5 (jitter = 7.7) 7.488
30 images/sec: 282.1 +/- 1.7 (jitter = 6.7) 7.508
40 images/sec: 282.3 +/- 1.4 (jitter = 7.7) 7.367
50 images/sec: 281.1 +/- 1.2 (jitter = 8.5) 7.498
60 images/sec: 281.4 +/- 1.1 (jitter = 8.4) 7.465
70 images/sec: 280.5 +/- 1.1 (jitter = 8.6) 7.387
80 images/sec: 280.3 +/- 1 (jitter = 9.0) 7.433
90 images/sec: 279.8 +/- 0.9 (jitter = 8.5) 7.442
100 images/sec: 279.9 +/- 0.8 (jitter = 8.0) 7.353
—————————————————————-
total images/sec: 279.85
—————————————————————-

Nasnet 4 GPU

python tf_cnn_benchmarks.py --data_format=NCHW --batch_size=64 --model=nasnet --optimizer=momentum -- variable_update=replicated --nodistortions --gradient_repacking=8 --num_gpus=4 --num_epochs=90 --weight_decay=1e-4 --data_dir=/data --train_dir=/data/scratch --data_name=imagenet

Step Img/sec total_loss
1 images/sec: 507.3 +/- 0 (jitter = 0.0) 7.549
10 images/sec: 475.4 +/- 7.1 (jitter = 29.7) 7.487
20 images/sec: 467.7 +/- 7 (jitter = 16.8) 7.525
30 images/sec: 470.8 +/- 4.9 (jitter = 11.8) 7.459
40 images/sec: 473 +/- 4.1 (jitter = 18.5) 7.419
50 images/sec: 474.6 +/- 3.4 (jitter = 18.4) 7.458
60 images/sec: 477.1 +/- 3 (jitter = 17.1) 7.481
70 images/sec: 476.7 +/- 3.1 (jitter = 18.0) 7.454
80 images/sec: 477.3 +/- 2.8 (jitter = 15.7) 7.499
90 images/sec: 477.9 +/- 2.5 (jitter = 15.4) 7.411
100 images/sec: 478.8 +/- 2.3 (jitter = 15.6) 7.485
—————————————————————-
total images/sec: 478.68
—————————————————————-

Previous Post

Tôi nên mua GPU nào để có trải nghiệm Deep Learning tốt nhất?

Next Post

Hướng dẫn tối ưu hóa lưu trữ cho AI và Deep Learning workload

Related Posts

Nvidia Công Bố Phiên Bản Pcie 4.0 Của A100: Gpu 250w Trên Form Factor Chuẩn 605d66d30fe7c.png
Deep Learning

NVIDIA công bố phiên bản PCIe 4.0 của A100: GPU 250W trên form factor chuẩn

19/05/2021
Computer Vision – Thị Giác Máy Tính Là Gì? 605d66cbbaaa4.jpeg
Deep Learning

Computer Vision – Thị giác máy tính là gì?

19/05/2021
Những Cuốn Sách Hàng đầu Về Deep Learning 605d66c4175f0.jpeg
Deep Learning

Những cuốn sách hàng đầu về Deep Learning

19/05/2021
Deep Learning Trong Lĩnh Vực Tài Chính: Cơ Hội Thúc đẩy Tăng Trưởng 605d66be30595.png
Deep Learning

Deep Learning trong lĩnh vực tài chính: Cơ hội thúc đẩy tăng trưởng

19/05/2021
Vai Trò Của Iot Và Ai Trong Ngành Công Nghiệp Sản Xuất 605d66b94509e.jpeg
Deep Learning

Vai trò của IoT và AI trong ngành công nghiệp sản xuất

19/05/2021
Giới Thiệu Gpu Quadro Rtx 8000 Của Nvidia 605d66b2e9d37.jpeg
Deep Learning

Giới thiệu GPU Quadro RTX 8000 của NVIDIA

19/05/2021
Next Post
Hướng Dẫn Tối ưu Hóa Lưu Trữ Cho Ai Và Deep Learning Workload 605d6823ab5e0.jpeg

Hướng dẫn tối ưu hóa lưu trữ cho AI và Deep Learning workload

Bài mới nhất

Top 6 Trang Web Tạo Email Marketing Miễn Phí, ấn Tượng Nhiều Người Dùng 612d237cbf541.png

Top 6 trang web tạo Email Marketing miễn phí, ấn tượng nhiều người dùng

14/05/2025
Dns Là Gì? Chức Năng, Cách Thức Hoạt động Và Nguyên Tắc Sử Dụng Hiệu Quả 612d236260cb2.jpeg

DNS là gì? Chức năng, cách thức hoạt động và nguyên tắc sử dụng hiệu quả

13/05/2025
Cpanel Là Gì Và Hướng Dẫn Sử Dụng Cpanel Hiệu Quả Cho Người Mới 612d235c02794.png

Cpanel là gì và hướng dẫn sử dụng Cpanel hiệu quả cho người mới

13/05/2025
Website Defacement Là Gì Và Cách Khắc Phục Hiệu Quả Cho Website 612d235622440.png

Website Defacement là gì và cách khắc phục hiệu quả cho website

12/05/2025
8 Cách Quản Lý Data Khách Hàng Hiệu Quả Cho Doanh Nghiệp 612d234c2b5ad.jpeg

8 cách quản lý data khách hàng hiệu quả cho doanh nghiệp

12/05/2025

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution