Rate this post

Hôm nay, trong hướng dẫn data science Python này , chúng ta sẽ thấy Thiết lập Môi trường data science cho Python. Hơn nữa, chúng tôi sẽ cho bạn biết về tất cả những gì bạn cần cài đặt cho Thiết lập Môi trường data science, chẳng hạn như Python, Anaconda, Miniconda.

Cùng với điều này, chúng ta sẽ xem cách thiết lập môi trường ảo cho Thiết lập Môi trường data science và nhập các Gói data science. Hôm nay, chúng tôi sẽ hướng dẫn bạn thiết lập máy để bạn có thể bắt đầu hành trình của mình với data science.

Các bài viết liên quan:

Trước khi bắt đầu, chúng tôi khuyên bạn nên đọc phần Giới thiệu về data science Python để giúp mọi thứ trôi chảy dễ dàng hơn khi bạn quay lại.

Vì vậy, hãy bắt đầu Thiết lập Môi trường data science Python.

Cài đặt Python

Trước bất kỳ điều gì khác, bạn nên tải Python trên máy tính của mình. Bạn có thể tham khảo Hướng dẫn từng bước để cài đặt Python trên Windows để biết điều này.

Trong khi 2.7 được áp dụng rộng rãi, 3.x sẽ tiếp quản trong tương lai và đã bắt đầu để lại dấu ấn. Ngoài ra, một số phần mềm và tính năng không tương thích ngược. Vì vậy, hãy lựa chọn của bạn.

Nhận Anaconda để thiết lập môi trường data science

Anaconda là một bản phân phối Python cho data science và máy học . Nó miễn phí và mã nguồn mở  , giúp cho việc quản lý và triển khai các gói trở nên đơn giản.

Nó có hơn 1000 gói data science và gói Conda. Các công cụ khác mà nó đi kèm là Python cốt lõi, IPython, trong số những công cụ khác.

Anaconda Navigator

Anaconda đi kèm với một trình quản lý môi trường ảo – Anaconda Navigator. Đây là GUI dành cho máy tính để bàn cho phép bạn khởi chạy ứng dụng và quản lý các gói, môi trường và kênh cho chung cư. Điều này cho phép bạn bỏ qua các lệnh dòng lệnh.

Bộ điều hướng tìm kiếm một gói trên Anaconda Cloud hoặc trong kho lưu trữ cục bộ cho Anaconda và cài đặt, chạy và cập nhật chúng. Nó có các ứng dụng sau-

  • Glueviz
  • Máy tính xách tay Jupyter
  • JupyterLab
  • Ứng dụng Orange 3
  • VSCode
  • RStudio
  • Rodeo
  • Spyder
  • QTConsole

Anaconda sẽ cung cấp cho bạn hai trình quản lý gói – gói và chung cư. Khi một số gói không có sẵn với conda, bạn có thể sử dụng pip để cài đặt chúng. Lưu ý rằng việc sử dụng pip để cài đặt các gói cũng có sẵn cho conda có thể gây ra lỗi cài đặt.

Cài đặt Anaconda

Để tải xuống bản phân phối Anaconda, bạn có thể sử dụng trang tải xuống chính thức:

https://www.anaconda.com/download/

Tại đây, bạn có thể chọn nền tảng của mình và sau đó chọn trình cài đặt. Đối với điều này, bạn có thể chọn phiên bản bạn muốn và 32-bit hay 64-bit.

Để cài đặt một gói với conda, bạn có thể sử dụng lệnh sau :

conda install scipy

Cài đặt Miniconda

Miniconda là một trình cài đặt tối thiểu cho chung cư; một phiên bản bootstrap nhỏ của Anaconda. Nó miễn phí và được vận chuyển với conda, Python và các gói như pip và zlib. Điều này cho phép bạn cài đặt hơn 720 gói từ conda. Vì Miniconda là phiên bản nhẹ hơn của Anaconda nên nó cho phép bạn tải xuống nhanh hơn.

Để cài đặt Miniconda, bạn có thể truy cập trang sau-

https://conda.io/miniconda.html

Tại đây, chọn nền tảng của bạn và sau đó chọn trình cài đặt 32 bit hoặc 64 bit tùy theo nhu cầu của máy tính của bạn.

Thiết lập môi trường ảo

Vì, ở đây, chúng ta nói về việc thiết lập môi trường data science với Python, hãy cùng tìm hiểu môi trường ảo là gì. Một môi trường ảo cho phép chúng tôi tạo các phiên bản Python khác nhau với các gói chúng tôi muốn hoặc theo nhu cầu của dự án.

Môi trường như vậy giúp chúng tôi đảm bảo rằng không có xung đột giữa các phiên bản của gói và của Python và các trình quản lý gói của nó. Bạn nên xem blog này về Cách tạo môi trường ảo Python và cài đặt gói .

Bây giờ, hãy xem cách chúng ta có thể tạo một cái với Anaconda. Sử dụng lệnh sau trong lời nhắc Anaconda của bạn-

Điều này sẽ cung cấp cho bạn ý tưởng về lời nhắc Anaconda trông như thế nào. Bây giờ, để kích hoạt môi trường này, bạn có thể gõ:

conda activate demo

Điều này cho phép bạn bắt đầu sử dụng nó. Bây giờ để hủy kích hoạt nó, hãy thử-

conda deactivate

Lệnh sau cho bạn biết tất cả các môi trường tồn tại; dấu hoa thị (*) đánh dấu hiện tại-

conda info -e

Các gói data science Python quan trọng

Làm việc với data science, trong số hơn 1000 gói có sẵn, bạn sẽ cần một vài gói cho phép bạn triển khai các chức năng cơ bản. Chúng ta hãy xem nhanh một số gói đó .

NumPy

Như đã thảo luận nhiều lần trước đó, NumPy cho phép bạn xử lý các ma trận và mảng lớn, đa chiều. Để thực hiện những điều này, nó cũng cung cấp cho chúng ta các hàm toán học cấp cao khác nhau.

SciPy

Dữ liệu Python gói Khoa học – SciPy

Scipy là một thư viện Python cho tính toán khoa học và kỹ thuật, miễn phí và mã nguồn mở. Các mô-đun từ SciPy bao gồm những mô-đun dành cho-

  • Tối ưu hóa
  • Đại số tuyến tính
  • Hội nhập
  • Phép nội suy
  • Chức năng đặc biệt
  • FFT
  • Xử lý tín hiệu và hình ảnh
  • Bộ giải ODE

Matplotlib

Cho đến nay, chúng tôi đã sử dụng Matplotlib để vẽ nhiều số liệu mà chúng tôi cần để bắt đầu hình dung. Một số trong số này là biểu đồ bong bóng và biểu đồ phân tán. Đây là một thư viện vẽ đồ thị bằng Python và mở rộng NumPy.

Với một API hướng đối tượng, nó cho phép bạn nhúng các lô vào các ứng dụng. Đối với điều này, nó sử dụng các bộ công cụ GUI như Tkinter, Qt, GTK + và wxPython.

Pandas

Chúng tôi đã thực hiện một Hướng dẫn mở rộng về Gấu trúc . Bây giờ, đã đến lúc tóm tắt nhanh. pandas là một thư viện phần mềm cho Python được cho là phục vụ cho thao tác và phân tích dữ liệu. Nó miễn phí và cho phép bạn thao tác với các bảng số và chuỗi thời gian bằng cách sử dụng các cấu trúc và phép toán dữ liệu.

Scikit-learn

Scikit-learning là một thư viện máy học phần mềm cho Python. Nó miễn phí và cung cấp các thuật toán khác nhau để phân loại, hồi quy và phân cụm-

  • SVM
  • Rừng ngẫu nhiên
  • Tăng cường độ dốc
  • K-có nghĩa là
  • DBSCAN

Chúng tôi thường sử dụng nó cùng với NumPy và SciPy.

Seaborn 

Cuối cùng, seaborn là một thư viện trực quan hóa cho Python và dựa trên matplotlib. Nó cho phép chúng tôi thực hiện trực quan hóa dữ liệu theo cách thống kê với giao diện cấp cao mang lại đồ họa hấp dẫn.

Hãy sửa đổi biểu thức chính quy Python

Cài đặt Jupyter?

Như chúng ta đã thấy trước đó, Jupyter đi kèm với Anaconda. Để chạy nó, bạn có thể vào môi trường ảo của mình và nhập như sau:

jupyter notebook

Bạn cũng có thể cài đặt nó bằng pip-

python3 -m pip install –upgrade pip

python3 -m pip install jupyter

Cuốn sổ trông giống như thế này-

Bạn có thể tìm thấy điều này tại http: // localhost: 8888 /

Bây giờ để chạy Python ở đây, bạn có thể tạo một tệp mới. Nó trông như thế này-

Bạn có thể thoát bằng cách sử dụng nút đăng xuất ở góc trên bên phải.

Hãy sửa lại Mô-đun Mảng Python

Vì vậy, đây là tất cả trong Thiết lập Môi trường data science với Python. Hy vọng bạn thích giải thích của chúng tôi.

Kết luận: 

Do đó, trong hướng dẫn Thiết lập Môi trường data science Python này, chúng ta đã thảo luận về tất cả những điều cần cài đặt cho Thiết lập Môi trường data science. Hơn nữa, chúng tôi xem xét các gói Python là Numpy, Scipy, matplotlib. 

Với điều này, chúng tôi kết thúc hướng dẫn thiết lập môi trường data science, về cách thiết lập máy của bạn cho data science. Tuy nhiên, nếu có bất kỳ câu hỏi nào liên quan đến thiết lập Môi trường data science Python, vui lòng thả câu hỏi của bạn trong phần nhận xét bên dưới.

Leave a Reply

Call now
%d bloggers like this: