• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Tin tức

Sử dụng NLP để trích xuất dữ liệu y tế không có cấu trúc từ văn bản

@admiz by @admiz
28/12/2023
in Tin tức
0
Sử Dụng Nlp để Trích Xuất Dữ Liệu Y Tế Không Có Cấu Trúc Từ Văn Bản 606fe51283d1c.jpeg

Trong lĩnh vực y tế, chăm sóc sức khỏe, rất nhiều thông tin có liên quan để đưa ra các chẩn đoán và đề xuất chính xác chỉ có sẵn trong các ghi chú lâm sàng, văn bản tự do. Phần lớn dữ liệu này bị chìm trong kho tài liệu ở dạng không có cấu trúc. Các dữ liệu này rất cần thiết để đưa ra phác đồ điều trị chính xác. Do đó, điều quan trọng là có thể trích xuất dữ liệu theo cách tốt nhất có thể, sao cho thông tin thu được có thể được phân tích và khai thác.

Thuật toán xử lý ngôn ngữ tự nhiên, Natural Language Processing – NLP, có thể trích xuất dữ liệu lâm sàng từ văn bản bằng cách sử dụng kỹ thuật học tập sâu – deep learning, chẳng hạn như nhúng các từ dành riêng cho chăm sóc sức khỏe, mô hình nhận dạng đối tượng và mô hình phân giải thực thể. Các thuật toán như vậy sử dụng các mô hình được đào tạo để tìm các từ có liên quan trong nội dung văn bản. Các mô hình nhận dạng đối tượng hoạt động bằng cách tìm kiếm các tên cụ thể và nhóm chúng thành các danh mục được xác định trước. Mô hình phân giải đối tượng hướng đến việc tìm kiếm các bản ghi – như các chẩn đoán, phác đồ điều trị hoặc mã thuốc – có liên hệ đến cùng một đối tượng và xác lập chúng thành một bản ghi tổng thể.

Học máy có thể làm cho các mẫu hình trở nên rõ ràng hơn nhưng chỉ khi dữ liệu được sử dụng là sạch, chuẩn hóa và hoàn chỉnh. Xử lý ngôn ngữ tự nhiên (NLP) là một phần quan trọng trong việc thu thập dữ liệu từ các tài liệu chuyên môn và ghi chú lâm sàng.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Ví dụ về đường cong ROC (AUC) (từ Horng và cộng sự, 2017)

Ví dụ về đường cong ROC (AUC) (từ Horng và cộng sự, 2017)

NLP do đó rất quan trọng đối với lĩnh vực chăm sóc sức khỏe và có hai trường hợp sử dụng AI phổ biến trong y tế:

Dự đoán nguy cơ bệnh nhân:

Tạo ra một cơ chế kích hoạt tự động hỗ trợ cho quyết định lâm sàng đối với trường hợp nhiễm trùng máu tại bộ phận cấp cứu bằng cách sử dụng học máy.

Nghiên cứu này cho thấy lợi thế của việc trích xuất dữ liệu văn bản tự do và dấu hiệu quan trọng để xác định những bệnh nhân bị nghi ngờ có nhiễm trùng, đe dọa đến tính mạng. Nghiên cứu này sử dụng NLP để trích xuất dữ liệu từ văn bản lâm sàng.

Các nhà nghiên cứu thấy rằng AUC tăng từ 0,67 (không sử dụng NLP) lên 0,86 khi sử dụng NLP. AUC (giá trị ROC) là khu vực dưới đường cong và được sử dụng trong phân tích phân loại để đánh giá hiệu quả của một mô hình. Về cơ bản, giá trị AUC càng cao (giá trị càng gần bằng 1) thì độ chính xác của mô hình càng được xem xét. Nghiên cứu do đó kết luận rằng việc sử dụng NLP trên các bản ghi văn bản tự do là thuận lợi và thực sự cải thiện khả năng xác định và dự đoán nhiễm trùng ở bệnh nhân trong ER, như được chỉ ra bởi giá trị AUC tăng lên.

Dự đoán nguy cơ bệnh nhân là quan trọng bởi vì điều này nhấn mạnh quá trình ra quyết định. Giá trị của các xét nghiệm phỏng đoán cho phép các quyết định được thực hiện liên quan đến việc liệu một lựa chọn điều trị cụ thể có thể hữu ích nếu được theo đuổi hay không. Trên thực tế, tổng cộng 97% các quy tắc phỏng đoán được sử dụng trong đánh giá 29 nghiên cứu mà NLP đã được sử dụng, được nhận thấy là hợp lý về mặt lâm sàng. Các mô hình dự báo nguy cơ bệnh nhân có giá trị và có thể hỗ trợ khả năng chẩn đoán của bác sĩ. Điều này đã được tìm thấy trong nghiên cứu về nhiễm trùng huyết, như được thể hiện ở sự gia tăng giá trị AUC. Có những trường hợp khác mà khả năng chẩn đoán của bác sĩ là kém chuẩn xác. Ví dụ, các nhà ung thư học đã được ghi nhận chỉ có độ chính xác 20% khi dự đoán sự sống còn của bệnh nhân bị bệnh nan y.

Xây dựng nhóm thuần tập – cohort:

Cơ hội và thách thức trong việc tận dụng dữ liệu hồ sơ sức khỏe điện tử trong ung thư học.

Việc sử dụng thông tin kỹ thuật số và hồ sơ y tế điện tử (EHRs) ngày càng gia tăng đang mang lại kho “Dữ liệu lớn – Big Data” cho ngành y tế và chăm sóc sức khỏe. Dữ liệu rất dễ truy cập và trích xuất nếu nó ở định dạng có cấu trúc. Đây không phải là trường hợp cho dữ liệu phi cấu trúc, không được nhập theo định dạng được xác lập trước. Điều này có nghĩa là EHR bị hạn chế vì các thành phần dữ liệu hoặc thiếu hoặc ở dạng văn bản tự do.

Một nghiên cứu về ung thư phổi tế bào không nhỏ (non-small cell lung cancer – NSCLS) đã minh chứng việc sử dụng dữ liệu có cấu trúc và phi cấu trúc. Sử dụng cả hai loại dữ liệu, 8324 bệnh nhân được xác định là có NSCLC. Trong số 8324 đó, chỉ có 2472 người được tìm thấy trong nhóm thuần tập được tạo thành bởi dữ liệu có cấu trúc. Ngoài ra, 1090 bệnh nhân cũng sẽ được tính vào nếu chỉ sử dụng dữ liệu có cấu trúc. 1090 bệnh nhân được cho là không phù hợp với các thông số của nghiên cứu. Do đó, 2472 bệnh nhân là nhóm thuần tập cần quan tâm, được sử dụng để phân tích. Điều này làm nổi bật tầm quan trọng của việc sử dụng cả dữ liệu có cấu trúc và phi cấu trúc trong một phân tích.

Xây dựng nhóm thuần tập (để tập hợp dữ liệu trên một nhóm bệnh nhân thành nhóm hoặc nhóm thuần tập) là quan trọng vì việc phân tích dữ liệu tiếp theo dựa trên việc xác định nhóm thuần tập chính xác. Nhóm thuần tập sẽ được xác định dựa trên đề bài nghiên cứu được hỏi, do đó nếu các nhóm thuần tập không chính xác được xác định thì phân tích sẽ tạo ra kết quả giả. Việc xây dựng và xác định các nhóm thuần tập được cho là rất quan trọng trong việc xác định nguy cơ bệnh và chọn lọc bệnh nhân cho các thử nghiệm lâm sàng.

Một ví dụ khác ngoài nghiên cứu NSCLS mà ở đó việc nhận dạng nhóm là rất quan trọng, đó là nghiên cứu về bệnh nhân rối loạn giấc ngủ. Trong ví dụ này, việc xác định nhóm và xây dựng dẫn đến độ chính xác hơn 80% phân tích thuật ngữ trong một nghiên cứu NLP về bệnh nhân rối loạn giấc ngủ. Nghiên cứu này cho thấy NLP là một công cụ rất hữu ích để sử dụng cho dữ liệu phi cấu trúc.

Người ta cần có một thư viện NLP về chăm sóc sức khỏe đủ lớn, như một phần của bộ công cụ khoa học dữ liệu y tế của họ, chẳng hạn như thư viện NLP thực hiện nghiên cứu sử dụng để giải quyết những vấn đề chính xác này. Do đó rõ ràng NLP là một công cụ rất hữu ích và quan trọng để sử dụng trong AI cho việc xử lý dữ liệu phi cấu trúc.

Previous Post

SDS – Software-defined Storage là gì?

Next Post

Supermicro mở rộng Dòng sản phẩm GPU NVIDIA Ampere cho Doanh nghiệp AI với hiệu suất 5 petaFLOPS đầu tiên trong ngành

Related Posts

Iot: Số Hóa Hôm Nay Vì Một Tương Lai “vạn Vật Kết Nối” 606fe502539ac.jpeg
Tin tức

IoT: Số hóa hôm nay vì một tương lai “vạn vật kết nối”

04/01/2024
Private Cloud: Đánh Giá Hai Phương án Hosted Và On Premise 606fe52520409.png
Tin tức

Private Cloud: Đánh giá hai phương án Hosted và On-Premise

03/01/2024
Raid Là Gì? Hướng Dẫn Lựa Chọn Cấu Hình Raid 606fe5291593c.jpeg
Tin tức

RAID là gì? Hướng dẫn lựa chọn cấu hình RAID

03/01/2024
Giới Thiệu Bộ Nhớ Intel Optane Persistent Memory 200 Series Mới 60712c5d88d68.png
Tin tức

Giới thiệu bộ nhớ Intel Optane Persistent Memory 200 Series mới

02/01/2024
Thế Hệ Xe điện Mới được Tăng Sức Mạnh Với Nvidia Drive 60751fe08b045.jpeg
Tin tức

Thế hệ xe điện mới được tăng sức mạnh với NVIDIA DRIVE

02/01/2024
Nvidia Và Các Nhà Sản Xuất Máy Tính Toàn Cầu Cho Ra Mắt Nền Tảng Máy Chủ Doanh Nghiệp Tối ưu Cho Công Nghiệp Ai 60751fd306406.png
Tin tức

NVIDIA và các nhà sản xuất máy tính toàn cầu cho ra mắt nền tảng máy chủ doanh nghiệp tối ưu cho công nghiệp AI

01/01/2024
Next Post
Supermicro Mở Rộng Dòng Sản Phẩm Gpu Nvidia Ampere Cho Doanh Nghiệp Ai Với Hiệu Suất 5 Petaflops đầu Tiên Trong Ngành 607671c36820c.png

Supermicro mở rộng Dòng sản phẩm GPU NVIDIA Ampere cho Doanh nghiệp AI với hiệu suất 5 petaFLOPS đầu tiên trong ngành

Bài mới nhất

Sitemap Là Gì? Vì Sao Doanh Nghiệp Lại Cần Phải Tạo Sitemap Cho Website? 612d214ccfff9.jpeg

Sitemap là gì? Vì sao doanh nghiệp lại cần phải tạo sitemap cho website?

27/06/2025
Top 11 Công Ty Thiết Kế Website Tại Huế Uy Tín, Chuyên Nghiệp, Chuẩn Seo 612d25b49e1ec.jpeg

Top 11 công ty thiết kế website tại Huế uy tín, chuyên nghiệp, chuẩn SEO

26/06/2025
mẫu thiết kế website công ty người mẫu ấn tượng

Dịch vụ thiết kế website công ty người mẫu nổi bật, cao cấp tại NQ News

26/06/2025
Thiết Kế Website Công Ty Viễn Thông, Dịch Vụ Mạng Chuyên Nghiệp, Uy Tín 612d253e4213f.jpeg

Thiết kế website công ty viễn thông, dịch vụ mạng chuyên nghiệp, uy tín

25/06/2025
Top 11 Trang Web Hẹn Hò Uy Tín, Chất Lượng Nhất Dành Cho Người độc Thân 612d2550e83dd.jpeg

Top 11 trang web hẹn hò uy tín, chất lượng nhất dành cho người độc thân

25/06/2025

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution