Rate this post

OpenCV là gì?

OpenCV là một thư viện mã nguồn mở Python, được sử dụng cho thị giác máy tính trong Trí tuệ nhân tạo, Học máy, nhận dạng khuôn mặt, v.v.

Trong OpenCV, CV là một dạng viết tắt của tầm nhìn máy tính, được định nghĩa là một lĩnh vực nghiên cứu giúp máy tính hiểu được nội dung của hình ảnh kỹ thuật số như ảnh và video.

Các bài viết liên quan:

Mục đích của thị giác máy tính là để hiểu nội dung của hình ảnh. Nó trích xuất mô tả từ các hình ảnh, có thể là một đối tượng, một mô tả văn bản và mô hình ba chiều, v.v. Ví dụ: ô tô có thể được tạo điều kiện với thị giác máy tính, có thể xác định và các đối tượng khác nhau xung quanh đường, chẳng hạn như đèn giao thông, người đi bộ, biển báo giao thông, v.v. và hành động phù hợp.

Thị giác máy tính cho phép máy tính thực hiện các nhiệm vụ giống như con người với cùng hiệu quả. Có hai nhiệm vụ chính được xác định dưới đây:

  • Phân loại đối tượng – Trong phân loại đối tượng, chúng tôi đào tạo một mô hình trên tập dữ liệu của các đối tượng cụ thể và mô hình phân loại các đối tượng mới thuộc một hoặc nhiều danh mục đào tạo của bạn.
  • Nhận dạng đối tượng – Trong nhận dạng đối tượng, mô hình của chúng tôi sẽ xác định một trường hợp cụ thể của một đối tượng – ví dụ: phân tích cú pháp hai khuôn mặt trong một hình ảnh và gắn thẻ một khuôn mặt là Virat Kohli và một khuôn mặt khác là Rohit Sharma.

Lịch sử

OpenCV là viết tắt của Open Source Computer Vision Library, được sử dụng rộng rãi để nhận dạng hình ảnh. Nó được chính thức ra mắt vào năm 1999 bởi Intel. Nó được viết bằng C / C ++ trong giai đoạn đầu, nhưng bây giờ nó cũng thường được sử dụng bằng Python cho thị giác máy tính.

Phiên bản alpha đầu tiên của OpenCV đã được phát hành cho mục đích sử dụng phổ biến tại Hội nghị IEEE về Thị giác Máy tính và Nhận dạng Mẫu vào năm 2000, và từ năm 2001 đến 2005, năm bản beta đã được phát hành. Phiên bản 1.0 đầu tiên được phát hành vào năm 2006.

Phiên bản thứ hai của OpenCV được phát hành vào tháng 10 năm 2009 với những thay đổi đáng kể. Phiên bản thứ hai có một sự thay đổi lớn đối với giao diện C ++, nhằm hướng đến việc triển khai dễ dàng hơn, an toàn hơn với kiểu mẫu, và tốt hơn. Hiện tại, việc phát triển được thực hiện bởi một nhóm độc lập của Nga và phát hành phiên bản mới hơn sau mỗi sáu tháng.

Các bài viết liên quan:

Cách thức hoạt động

Làm thế nào để máy tính nhận dạng hình ảnh?

Đôi mắt của con người cung cấp nhiều thông tin dựa trên những gì họ nhìn thấy. Máy móc được tạo điều kiện để nhìn thấy mọi thứ, chuyển đổi tầm nhìn thành các con số và lưu vào bộ nhớ. Ở đây câu hỏi đặt ra là làm thế nào máy tính chuyển đổi hình ảnh thành số. Vì vậy, câu trả lời là giá trị pixel được sử dụng để chuyển đổi hình ảnh thành số. Pixel là đơn vị nhỏ nhất của hình ảnh hoặc đồ họa kỹ thuật số có thể được hiển thị và biểu diễn trên thiết bị hiển thị kỹ thuật số.

Cường độ hình ảnh tại một vị trí cụ thể được biểu thị bằng các con số. Trong hình trên, chúng tôi đã chỉ ra các giá trị pixel cho hình ảnh thang độ xám chỉ bao gồm một giá trị, cường độ của màu đen tại vị trí đó.

Có hai cách phổ biến để xác định hình ảnh:

  1. Thang đọ xám (Grayscale)

Hình ảnh thang độ xám là những hình ảnh chỉ chứa hai màu đen và trắng. Phép đo cường độ tương phản được coi là màu đen là cường độ yếu nhất và màu trắng là cường độ mạnh nhất. Khi chúng ta sử dụng hình ảnh thang độ xám, máy tính sẽ chỉ định mỗi giá trị pixel dựa trên mức độ tối của nó.

  1. RGB

RGB là sự kết hợp của màu đỏ, xanh lá cây, xanh lam cùng nhau tạo nên một màu mới. Máy tính lấy giá trị đó từ mỗi pixel và đưa kết quả vào một mảng để được diễn giải.

Tại sao OpenCV được sử dụng cho thị giác máy tính

  • OpenCV có sẵn miễn phí.
  • Vì thư viện OpenCV được viết bằng C / C ++, nên nó thoát nhanh. Bây giờ nó có thể được sử dụng với Python.
  • Nó yêu cầu ít RAM hơn để sử dụng, có thể là 60-70 MB.
  • Computer Vision có tính di động dưới dạng OpenCV và có thể chạy trên bất kỳ thiết bị nào có thể chạy trên C.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Call now