• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Kiến thức tổng hợp Deep Learning

Khảo sát nghiên cứu về AI cho thấy machine learning cần một sự thay đổi về văn hóa

@admiz by @admiz
18/05/2021
in Deep Learning
0
Khảo Sát Nghiên Cứu Về Ai Cho Thấy Machine Learning Cần Một Sự Thay đổi Về Văn Hóa 605d65d282b04.jpeg

Cộng đồng Machine Learning, đặc biệt trong lĩnh vực thị giác máy tính và xử lý ngôn ngữ, đang gặp vấn đề về văn hóa trong việc sử dụng dữ liệu. Đó là theo một cuộc khảo sát nghiên cứu về thực tiễn thu thập và sử dụng tập dữ liệu của cộng đồng được công bố vào đầu tháng này.

Điều cần thiết là cần có một thay đổi khỏi sự phụ thuộc vào các bộ dữ liệu lớn, được quản lý kém, sử dụng để đào tạo các mô hình Machine Learning. Thay vào đó, nghiên cứu đề xuất một nền văn hóa quan tâm đến những cá nhân hiện diện bên trong bộ dữ liệu và tôn trọng quyền riêng tư cũng như tài sản của họ. Nhưng trong môi trường Machine Learning ngày nay, các tác giả khảo sát cho biết, “bất cứ điều gì cũng có thể xảy ra”.

Trong bài báo “Dữ liệu và nội dung của nó: Một cuộc khảo sát về việc phát triển và sử dụng tập dữ liệu trong Machine Learning” được viết bởi các nhà ngôn ngữ học Amandalynne Paullada và Emily Bender của Đại học Washington, Inioluwa Deborah Raji, đồng sáng lập của của Mozilla Foundation, và các nhà khoa học nghiên cứu của Google là Emily Denton và Alex Hanna. Bài báo kết luận rằng các mô hình ngôn ngữ lớn có khả năng duy trì các định kiến ​​và thành kiến ​​đối với một loạt các cộng đồng bị thiệt thòi và rằng các bộ dữ liệu được chú thích kém là một phần của vấn đề.

Công việc cũng yêu cầu các thực hành quản lý dữ liệu và tài liệu nghiêm ngặt hơn. Các tập dữ liệu được thực hiện theo cách này chắc chắn sẽ đòi hỏi nhiều thời gian, tiền bạc và nỗ lực hơn nhưng sẽ “khuyến khích việc nghiên cứu các phương pháp tiếp cận Machine Learning vượt ra ngoài mô hình hiện tại của các kỹ thuật theo quy mô thần tượng hóa”.

“Chúng tôi lập luận rằng các bản sửa lỗi tập trung giới hạn vào việc cải thiện tập dữ liệu bằng cách làm cho chúng đại diện hơn hoặc thách thức hơn, có thể mất đi các điểm chung mà những đánh giá này nêu ra và chúng ta sẽ bị mắc kẹt trong trò chơi tập dữ liệu thay vì tiến bộ, miễn là khái niệm về ‘tiến độ’ được xác định phần lớn bởi hiệu suất trên bộ dữ liệu, “bài báo viết. “Nếu điều này xảy ra, chúng tôi dự đoán rằng Machine Learning như một lĩnh vực sẽ được định vị tốt hơn để hiểu cách công nghệ của nó tác động đến con người và thiết kế các giải pháp hoạt động với độ trung thực và công bằng trong bối cảnh triển khai của họ.”

Các sự kiện trong năm qua đã làm sáng tỏ những thiếu sót của cộng đồng Machine Learning và thường gây hại cho những người thuộc các cộng đồng bị thiệt thòi. Sau khi Google sa thải Timnit Gebru, một sự cố mà nhân viên Google gọi là một trường hợp “kiểm duyệt nghiên cứu chưa từng có”, Reuters đưa tin hôm thứ Tư rằng công ty đã bắt đầu thực hiện đánh giá các bài nghiên cứu về “chủ đề nhạy cảm” và ít nhất ba lần, các tác giả Theo truyền thông nội bộ và những người quen thuộc với vấn đề này, đã được yêu cầu không đặt công nghệ của Google dưới góc độ tiêu cực . Chưa có hồ sơ Washington Post của Gebru tuần này tiết lộ rằng Giám đốc AI của Google, Jeff Dean đã yêu cầu cô điều tra tác động tiêu cực của các mô hình ngôn ngữ lớn vào mùa thu năm nay.

Trong các cuộc trò chuyện về GPT-3, đồng tác giả Emily Bender trước đó đã cho hay rằng cô muốn thấy cộng đồng NLP ưu tiên cho một ngành khoa học tốt đẹp hơn. Bender là đồng tác giả của một bài báo với Gebru đã được đưa ra công chúng vào đầu tháng này sau khi Google sa thải Gebru. Bài báo đó đã xem xét việc sử dụng các mô hình ngôn ngữ lớn có thể tác động đến các cộng đồng bị thiệt thòi như thế nào. Tuần trước, các nhà tổ chức hội nghị Công bằng, Trách nhiệm và Minh bạch (FAccT) đã chấp nhận bài báo để xuất bản.

Cũng trong tuần trước, Hanna đã tham gia cùng các đồng nghiệp trong nhóm Đạo đức AI tại Google và gửi một thông báo tới ban lãnh đạo Google yêu cầu khôi phục Gebru. Cùng ngày, các thành viên của Quốc hội quen thuộc với thiên vị thuật toán đã gửi một lá thư đến Giám đốc điều hành Google Sundar Pichai yêu cầu câu trả lời.

Quyết định của công ty trong việc kiểm duyệt các nhà nghiên cứu AI và sa thải Gebru có thể mang hàm ý chính sách. Hiện tại, Google, MIT và Stanford là một số nhà sản xuất tích cực hoặc có ảnh hưởng nhất đối với nghiên cứu AI được công bố tại các hội nghị học thuật lớn hàng năm. Các thành viên của Quốc hội đã đề xuất quy định để bảo vệ chống lại sự thiên vị thuật toán, trong khi các chuyên gia kêu gọi tăng thuế đối với Big Tech, một phần để tài trợ cho nghiên cứu độc lập. VentureBeat gần đây đã nói chuyện với sáu chuyên gia về AI, đạo đức và luật pháp về những cách mà cuộc khủng hoảng đạo đức AI của Google có thể ảnh hưởng đến chính sách.

Đầu tháng này, “Dữ liệu và các nội dung của nó” đã nhận được giải thưởng từ các nhà tổ chức của hội thảo ML Retrospectives, Surveys and Meta-analyzes tại NeurIPS, một hội nghị nghiên cứu về AI thu hút 22.000 người tham dự. Gần 2.000 bài báo đã được xuất bản tại NeurIPS năm nay, bao gồm các công việc liên quan đến phát hiện lỗi cho các hệ thống quan trọng về an toàn ; phương pháp nhân giống ngược nhanh hơn, hiệu quả hơn ; và sự khởi đầu của một dự án coi biến đổi khí hậu như một thách thức lớn của Machine Learning .

Một bài báo khác của Hanna, được trình bày tại hội thảo Resistance AI, kêu gọi cộng đồng Machine Learning vượt ra ngoài quy mô khi xem xét cách giải quyết các vấn đề xã hội có hệ thống và khẳng định rằng cần phải chống lại tư duy quy mô. Hanna đã nói chuyện với VentureBeat vào đầu năm nay về việc sử dụng lý thuyết chủng tộc quan trọng khi xem xét các vấn đề liên quan đến chủng tộc, danh tính và sự công bằng .

Trong xử lý ngôn ngữ tự nhiên trong những năm gần đây, các mạng được thực hiện bằng cách sử dụng kiến ​​trúc mạng thần kinh Transformer và kho dữ liệu ngày càng lớn đã đạt được các điểm hiệu suất (benchmark) cao trong các điểm chuẩn như GLUE. BERT của Google và các dẫn xuất của BERT dẫn đầu, theo sau là các mạng như MT-DNN của Microsoft , Megatron của Nvidia và GPT-3 của OpenAI . Được giới thiệu vào tháng 5, GPT-3 là mô hình ngôn ngữ lớn nhất cho đến nay. Một bài báo về hiệu suất của mô hình đã giành được một trong ba giải thưởng giấy tốt nhất được trao cho các nhà nghiên cứu tại NeurIPS năm nay.

Quy mô của các bộ dữ liệu khổng lồ khiến cho việc xem xét kỹ lưỡng nội dung của chúng trở nên khó khăn. Điều này dẫn đến các ví dụ lặp đi lặp lại về sự thiên vị thuật toán trả lại các kết quả thiên vị khiêu dâm về người Hồi giáo, những người kỳ lạ hoặc không phù hợp với bản dạng giới mong đợi, những người khuyết tật, phụ nữ và người Da đen, trong số các nhân khẩu học khác.

Sự nguy hiểm của các bộ dữ liệu lớn cũng được chứng minh trong lĩnh vực thị giác máy tính, bằng chứng là các nhà nghiên cứu của Đại học Stanford thông báo vào tháng 12 năm 2019 rằng họ sẽ xóa các nhãn và hình ảnh xúc phạm khỏi ImageNet. Mô hình StyleGAN, do Nvidia phát triển, cũng cho kết quả sai lệch sau khi đào tạo trên một tập dữ liệu hình ảnh lớn. Và sau khi phát hiện ra các hình ảnh và nhãn phân biệt giới tính và phân biệt chủng tộc, những người tạo ra 80 triệu Hình ảnh nhỏ đã xin lỗi và yêu cầu các kỹ sư xóa và không sử dụng tài liệu này nữa.

Post Views: 135
Previous Post

Sự khác nhau giữa Deep Learning, Machine Learning và Data Science

Next Post

Các công ty khởi nghiệp sử dụng hình ảnh cấu trúc vi phân tử để tăng tốc chế tạo vắc xin COVID-19

Related Posts

Nvidia Công Bố Phiên Bản Pcie 4.0 Của A100: Gpu 250w Trên Form Factor Chuẩn 605d66d30fe7c.png
Deep Learning

NVIDIA công bố phiên bản PCIe 4.0 của A100: GPU 250W trên form factor chuẩn

19/05/2021
Computer Vision – Thị Giác Máy Tính Là Gì? 605d66cbbaaa4.jpeg
Deep Learning

Computer Vision – Thị giác máy tính là gì?

19/05/2021
Những Cuốn Sách Hàng đầu Về Deep Learning 605d66c4175f0.jpeg
Deep Learning

Những cuốn sách hàng đầu về Deep Learning

19/05/2021
Deep Learning Trong Lĩnh Vực Tài Chính: Cơ Hội Thúc đẩy Tăng Trưởng 605d66be30595.png
Deep Learning

Deep Learning trong lĩnh vực tài chính: Cơ hội thúc đẩy tăng trưởng

19/05/2021
Vai Trò Của Iot Và Ai Trong Ngành Công Nghiệp Sản Xuất 605d66b94509e.jpeg
Deep Learning

Vai trò của IoT và AI trong ngành công nghiệp sản xuất

19/05/2021
Giới Thiệu Gpu Quadro Rtx 8000 Của Nvidia 605d66b2e9d37.jpeg
Deep Learning

Giới thiệu GPU Quadro RTX 8000 của NVIDIA

19/05/2021
Next Post
Các Công Ty Khởi Nghiệp Sử Dụng Hình ảnh Cấu Trúc Vi Phân Tử để Tăng Tốc Chế Tạo Vắc Xin Covid 19 605d65d66fe30.jpeg

Các công ty khởi nghiệp sử dụng hình ảnh cấu trúc vi phân tử để tăng tốc chế tạo vắc xin COVID-19

Bài mới nhất

Cpanel Là Gì Và Hướng Dẫn Sử Dụng Cpanel Hiệu Quả Cho Người Mới 612d235c02794.png

Cpanel là gì và hướng dẫn sử dụng Cpanel hiệu quả cho người mới

13/05/2025
Website Defacement Là Gì Và Cách Khắc Phục Hiệu Quả Cho Website 612d235622440.png

Website Defacement là gì và cách khắc phục hiệu quả cho website

12/05/2025
8 Cách Quản Lý Data Khách Hàng Hiệu Quả Cho Doanh Nghiệp 612d234c2b5ad.jpeg

8 cách quản lý data khách hàng hiệu quả cho doanh nghiệp

12/05/2025
Địa Chỉ Email Là Gì Và Cách để Tạo Lập địa Chỉ Mail Chuyên Nghiệp 612d23693d14c.jpeg

Địa chỉ email là gì và cách để tạo lập địa chỉ mail chuyên nghiệp

11/05/2025
Tự động Hóa Bán Hàng: Cách ứng Dụng Crm Vào Bán Hàng Và Marketing 612d0eb0e2b27.jpeg

Tự động hóa bán hàng: Cách ứng dụng CRM vào bán hàng và Marketing

11/05/2025

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution