• About
  • Advertise
  • Privacy & Policy
  • Contact
NQ NEWS
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
  • Kiến thức tổng hợp
    • Development
    • Deep Learning
    • Cloud Computing
    • Kiến thức bảo mật
    • Tin học văn phòng
  • Thủ thuật
    • Phần Mềm
    • Sửa lỗi máy tính
    • Bảo mật máy tính
    • Tăng tốc máy tính
    • Thủ thuật Wifi
  • Quản trị hệ thống
    • Giải pháp bảo mật
    • Mail Server
    • Mạng LAN – WAN
    • Máy chủ
    • Windows Server 2012
  • Tin tức
No Result
View All Result
NQ NEWS
No Result
View All Result
Home Kiến thức tổng hợp

Cách nhập dữ liệu Excel vào tập lệnh Python bằng Pandas

@admiz by @admiz
04/05/2021
in Kiến thức tổng hợp, Tin học văn phòng
0
Cách Nhập Dữ Liệu Excel Vào Tập Lệnh Python Bằng Pandas 60917e701812e.jpeg

Microsoft Excel là phần mềm bảng tính được sử dụng rộng rãi nhất trên thế giới và có lý do chính đáng cho việc đó. Excel có giao diện thân thiện với người dùng và các công cụ tích hợp mạnh mẽ giúp đơn giản hơn khi làm việc với dữ liệu.

Nhưng nếu muốn xử lý dữ liệu nâng cao hơn, bạn sẽ cần phải sử dụng những thứ vượt ra ngoài các khả năng của Excel và bắt đầu dùng một ngôn ngữ lập trình như Python. Thay vì sao chép thủ công dữ liệu vào database, sau đây là hướng dẫn nhanh về cách load dữ liệu Excel vào Python bằng Pandas.

Lưu ý: Nếu chưa từng sử dụng Python trước đây, hướng dẫn này có thể khó khăn. Bạn nên bắt đầu với các trang web để tìm hiểu Python và những ví dụ Python cơ bản mà Quantrimang.com đã gợi ý.

Cách load dữ liệu Excel vào Python bằng Pandas

  • Pandas là gì?
  • Cài đặt Pandas
  • Chuẩn bị dữ liệu Excel
  • Viết Python script
    • Nhập thư viện Python
    • Làm việc với đường dẫn file
    • Trích xuất dữ liệu Excel bằng Pandas.Read_Excel()
    • Chạy Script Python
    • Hãy xem xét kỹ hơn đối tượng DataFrame!

Pandas là gì?

Python Data Analysis Library (Pandas) là một thư viện mã nguồn mở cho ngôn ngữ lập trình Python được sử dụng để phân tích và thao tác dữ liệu.

Pandas load dữ liệu vào các đối tượng Python được gọi là Dataframe, lưu trữ dữ liệu theo hàng và cột giống như cơ sở dữ liệu truyền thống. Khi một Dataframe được tạo, nó có thể được thao tác bằng Python, mở ra vô số khả năng.

Cài đặt Pandas

Lưu ý: Bạn phải có Python 2.7 trở lên để cài đặt Pandas.

Để bắt đầu làm việc với Pandas trên máy tính, bạn sẽ cần nhập thư viện Pandas. Nếu tìm kiếm một giải pháp nâng cao, bạn có thể tải xuống Anaconda Python Distribution, có tích hợp Pandas. Nếu bạn không sử dụng Anaconda, Pandas rất đơn giản để cài đặt trong terminal.

Pandas là gói PyPI, có nghĩa là bạn có thể cài đặt bằng PIP cho Python thông qua dòng lệnh. Các hệ thống Mac hiện đại đi kèm với PIP. Đối với các hệ thống Windows, Linux và nhiều hệ thống cũ khác, rất dễ dàng để học cách cài đặt PIP cho Python.

Khi bạn đã mở terminal, phiên bản mới nhất của Pandas có thể được cài đặt bằng lệnh:

>> pip install pandas

Pandas cũng yêu cầu thư viện NumPy, hãy cài đặt thư viện này trên dòng lệnh:

>> pip install numpy

Bây giờ, bạn đã cài đặt Pandas và sẵn sàng tạo DataFrame đầu tiên!

Chuẩn bị dữ liệu Excel

Trong ví dụ này, hãy sử dụng một tập dữ liệu mẫu: Một workbook Excel có tên Cars.xlsx.

Một workbook Excel có tên Cars.xlsx

Tập dữ liệu này hiển thị thương hiệu, kiểu dáng, màu sắc và năm sản xuất của những chiếc ô tô được nhập vào bảng. Bảng được hiển thị dưới dạng phạm vi Excel. Pandas đủ thông minh để đọc dữ liệu một cách phù hợp.

Workbook này được lưu vào thư mục Desktop, đây là đường dẫn file được sử dụng:

/Users/grant/Desktop/Cars.xlsx

Bạn sẽ cần biết đường dẫn file của workbook để sử dụng Pandas. Hãy bắt đầu bằng cách mở Visual Studio Code để viết script. Nếu bạn không có trình soạn thảo văn bản, bài viết khuyên dùng Visual Studio Code hoặc Atom Editor.

Viết Python script

Bây giờ, bạn đã có trình soạn thảo văn bản mình cần. Tiếp theo, bài viết sẽ kết hợp Python và workbook Cars để tạo ra một DataFrame Pandas.

Nhập thư viện Python

Mở trình soạn thảo văn bản và tạo một file Python mới. Hãy gọi cho nó là Script.py.

Để làm việc với Pandas trong script, bạn sẽ cần nhập nó vào code của mình. Điều này được thực hiện với một dòng code:

import pandas as pd

Ở đây, ví dụ đang load thư viện Pandas và đính kèm nó vào một biến “pd”. Bạn có thể sử dụng bất kỳ tên nào mình muốn, còn ví dụ hiện đang sử dụng “pd”, là viết tắt của Pandas.

Để làm việc với Excel bằng Pandas, bạn cần một đối tượng bổ sung có tên ExcelFile. ExcelFile được tích hợp vào hệ sinh thái Pandas, vì vậy bạn có thể nhập trực tiếp từ Pandas:

from pandas import ExcelFile

Làm việc với đường dẫn file

Để cấp cho Pandas quyền truy cập vào workbook, bạn cần hướng script của mình đến vị trí file. Cách dễ nhất để làm điều này là cung cấp cho script đường dẫn đầy đủ đến workbook.

Nhớ lại đường dẫn trong ví dụ này: /Users/grant/Desktop/Cars.xlsx

Bạn sẽ cần đường dẫn file này được tham chiếu trong script để trích xuất dữ liệu. Thay vì tham chiếu đường dẫn bên trong hàm Read_Excel, hãy giữ “sạch” code bằng cách lưu trữ đường dẫn trong một biến:

Cars_Path = '/Users/grant/Desktop/Cars.xlsx'

Bây giờ, bạn đã sẵn sàng để trích xuất dữ liệu bằng hàm Pandas!

Trích xuất dữ liệu Excel bằng Pandas.Read_Excel()

Với Pandas được nhập và bộ biến đường dẫn được đặt, giờ đây, bạn có thể sử dụng các hàm trong đối tượng Pandas để hoàn thành nhiệm vụ.

Hàm bạn sẽ cần sử dụng có tên là Read_Excel. Hàm Read_Excel lấy đường dẫn file của workbook Excel và trả về một đối tượng DataFrame với nội dung của workbook. Pandas đặt chức năng này là:

pandas.read_excel(path)

Đối số “path” là đường dẫn đến workbook Cars.xlsx và bài viết đã đặt chuỗi đường dẫn thành biến Cars_Path.

Bạn đã sẵn sàng để tạo đối tượng DataFrame! Hãy kết hợp tất cả cùng nhau và đặt đối tượng DataFrame thành một biến có tên là DF:

DF = pd.read_excel(Cars_Path)

Cuối cùng, bạn sẽ muốn xem DataFrame, vì vậy hãy in kết quả. Thêm một câu lệnh in vào cuối script, sử dụng biến DataFrame làm đối số:

print(DF)

Đã đến lúc để chạy script trong terminal!

Chạy script Python

Mở terminal hoặc dòng lệnh và điều hướng đến thư mục chứa script của bạn. Trong trường hợp này, ta có ngay “Script.py” trên desktop. Để thực thi script, sử dụng lệnh python theo sau là file script:

Chạy script Python

Python sẽ kéo dữ liệu từ “Cars.xlsx” vào DataFrame mới và in DataFrame ra terminal!

Python sẽ kéo dữ liệu từ “Cars.xlsx” vào DataFrame mới và in DataFrame ra terminal

Hãy xem xét kỹ hơn đối tượng DataFrame!

Thoạt nhìn, DataFrame trông rất giống với bảng Excel thông thường. Điều này khiến Pandas DataFrame rất dễ hiểu.

Những header được gắn nhãn ở đầu tập dữ liệu và Python đã điền vào các hàng bằng tất cả thông tin đọc được từ workbook Cars.xlsx.

Lưu ý cột ngoài cùng bên trái, một chỉ mục bắt đầu từ 0 và đánh số các cột. Theo mặc định, Pandas sẽ áp dụng chỉ mục này cho DataFrame, có thể hữu ích trong một số trường hợp. Nếu không muốn chỉ mục này được tạo, bạn có thể thêm một đối số bổ sung vào code:

DF = pd.read_excel(Cars_Path, index=False)

Đặt đối số “index” thành False sẽ loại bỏ cột chỉ mục, chỉ còn lại dữ liệu Excel.

Bây giờ, bạn đã có khả năng đọc dữ liệu từ bảng tính Excel. Bạn có thể áp dụng lập trình Python theo bất kỳ cách nào mình chọn. Làm việc với Pandas là một cách đơn giản để các lập trình viên Python có kinh nghiệm làm việc với dữ liệu được lưu trữ trong workbook Excel.

Sự dễ dàng khi sử dụng Python để phân tích và thao tác dữ liệu là một trong nhiều lý do tại sao Python là ngôn ngữ lập trình của tương lai.

Chúc bạn thực hiện thành công!

  • Cách xóa smart tag trong Excel
  • Cách chuyển file CSV sang Excel hàng loạt
  • Cách in nhiều sheet trong Excel
  • Cách đánh dấu tích trong Excel
  • Cách đổi thư mục lưu file Excel mặc định
  • Cách tính và tô màu ô trống trong Excel
Post Views: 217
Previous Post

Cách viết biểu tượng độ trên máy tính, điện thoại

Next Post

Cách chèn ghi chú chân trang Google Docs

Related Posts

Sửa Nhanh Lỗi Laptop Windows 10 Sạc Pin Không Vào 60951215e059b.png
Phần cứng

Sửa nhanh lỗi laptop Windows 10 sạc pin không vào

11/05/2022
Làm Thế Nào để Xóa Một Phân Vùng Trên ổ đĩa Cứng Windows? 60951232be65c.png
Phần cứng

Làm thế nào để xóa một phân vùng trên ổ đĩa cứng Windows?

11/05/2022
Test Pin Laptop, Cách Kiểm Tra Pin Laptop đang ở Mức Nào Mà Không Cần Cài Phần Mềm 6095123831651.png
Phần cứng

Test pin laptop, cách kiểm tra pin laptop đang ở mức nào mà không cần cài phần mềm

11/05/2022
Hướng Dẫn Xử Lý Khi Key Bàn Phím Laptop Bị Hỏng 6095121ca32df.png
Phần cứng

Hướng dẫn xử lý khi key bàn phím laptop bị hỏng

11/05/2022
Nên Dùng Súng Loại Nào Trong Chiến Dịch Huyền Thoại? 6094aaf17f1da.png
Phần Mềm

Nên dùng súng loại nào trong Chiến Dịch Huyền Thoại?

07/05/2022
Hướng Dẫn Cài đặt Wtfast để Giảm Ping Khi Chơi Game Online, Khi đứt Cáp 6094aae16ee4b.png
Phần Mềm

Hướng dẫn cài đặt WTFast để giảm ping khi chơi game online, khi đứt cáp

07/05/2022
Next Post
Cách Chèn Ghi Chú Chân Trang Google Docs 60917e7518395.jpeg

Cách chèn ghi chú chân trang Google Docs

Bài mới nhất

4 Lưu ý Khi Sử Dụng Email Marketing Hiệu Quả Tránh Spam Cho Doanh Nghiệp 612d0db271290.jpeg

4 Lưu ý khi sử dụng email marketing hiệu quả tránh spam cho doanh nghiệp

07/05/2025
Tổng Hợp 10 Mẫu Email Marketing Giới Thiệu Sản Phẩm Nổi Bật Nhất Hiện Nay 612d0da97658c.png

Tổng hợp 10 mẫu email marketing giới thiệu sản phẩm nổi bật nhất hiện nay

07/05/2025
Dịch Vụ Thiết Kế Website Tại Hải Dương Chuyên Nghiệp, ấn Tượng Và Uy Tín 612d25752b14f.png

Dịch vụ thiết kế website tại Hải Dương chuyên nghiệp, ấn tượng và uy tín

06/05/2025
Top Công Ty Thiết Kế Website Tại Biên Hòa Chuyên Nghiệp, Chuẩn Seo 612d259494e93.jpeg

Top công ty thiết kế website tại Biên Hòa chuyên nghiệp, chuẩn SEO

06/05/2025
Top Công Ty Thiết Kế Website Tại Vinh – Nghệ An Uy Tín 612d259a9cae3.jpeg

Top công ty thiết kế website tại Vinh – Nghệ An uy tín

05/05/2025

Danh mục

  • Android
  • Bảo mật máy tính
  • Bảo mật, Antivirus
  • Chuyện công nghệ
  • Deep Learning
  • Development
  • Dịch vụ công trực tuyến
  • Dịch vụ nhà mạng
  • Giải pháp bảo mật
  • Hệ thống
  • Hệ thống
  • iPhone
  • Kiến thức bảo mật
  • Kiến thức cơ bản phổ thông
  • Kiến thức Marketing căn bản
  • Kiến thức tổng hợp
  • Lập trình
  • Linux
  • Linux OS
  • macOS
  • Mail Server
  • Mạng LAN – WAN
  • Máy ảo
  • Máy chủ
  • ms excel
  • ms-powerpoint
  • Nền tảng điện toán đám mây
  • Phần cứng
  • Phần Mềm
  • Quản trị hệ thống
  • Raspberry Pi
  • Sửa lỗi máy tính
  • Tăng tốc máy tính
  • Thủ thuật
  • Thủ thuật SEO
  • Thủ thuật Wifi
  • Tiện ích hệ thống
  • Tin học văn phòng
  • Tin tức
  • Uncategorized
  • Ứng dụng
  • Website
  • Windows Server 2012

Thẻ

#app #chatbot #chatbot tự động #CRM #Kiến thức cơ bản #Techblog #Thiết kế website Android apple CPU Email Marketing Google Google Drive hacker HTML hàm python hàm python có sẵn hình nền hình nền máy tính học css học python học SQL ios iphone iphone 12 iPhone X macos Microsoft mssql MS SQL Server ngôn ngữ lập trình python Raspberry Pi Samsung smartphone SQL SQL Server tham số trong C thủ thuật windows 10 tài liệu python windows windows 10 YouTube điện thoại thông minh ứng dụng
  • About
  • Advertise
  • Privacy & Policy
  • Contact

© 2022 Pha Le Solution

No Result
View All Result
  • Home

© 2022 Pha Le Solution