Những ngày này, nhiều nghiên cứu khác nhau đang được tiến hành trong lĩnh vực Data mining. Data mining giáo dục là một lĩnh vực nghiên cứu quan trọng được gọi là EDM. Nó sử dụng nhiều thuật toán để cải thiện kết quả giáo dục và giải thích các quy trình giáo dục để đưa ra quyết định sau này.
Các bài viết liên quan:
Ở đây, chúng ta sẽ thảo luận về một số thuật toán Data mining được áp dụng cho lĩnh vực liên quan đến giáo dục. Các thuật toán này được sử dụng để khai thác kiến thức từ dữ liệu giáo dục và nghiên cứu các thuộc tính có thể thêm vào để tăng hiệu suất. Việc học ban đầu bắt đầu trong lớp học và dựa trên các mô hình hành vi, tâm lý và xây dựng. Mô hình hành vi phụ thuộc vào những thay đổi có thể quan sát được trong hành vi của học sinh để xác định kết quả học tập. Các mô hình tâm lý dựa trên sự tham gia hiệu quả của giáo viên vào quá trình học tập. Trong các mô hình xây dựng, học sinh cần tự học từ các nguồn sẵn có khác nhau.
Theo Siemens, học tập không còn là một hoạt động nội bộ, cô lập. Nó được xem như một cuộc biểu tình trong một mạng lưới các nút giúp cải thiện trải nghiệm học tập của sinh viên và giảm bớt yêu cầu về việc ngay lập tức được đưa vào giảng dạy của một giáo sư. Môi trường học tập thông thường đã dần thay đổi thành các điều kiện học tập dựa vào cộng đồng.
Data mining giáo dục là gì?
EDM là viết tắt của Data mining giáo dục. Nó có thể được định nghĩa là kỹ thuật tìm kiếm các loại dữ liệu cụ thể đến từ hệ thống giáo dục và thực hiện các kỹ thuật đó để hiểu học sinh và hệ thống tốt hơn. EDM là quá trình chuyển đổi dữ liệu thô thu được từ các hệ thống giáo dục thành dữ liệu hữu ích có thể được sử dụng để đưa ra các quyết định theo hướng dữ liệu. Sự phát triển của khai thác và phân tích dữ liệu trong lĩnh vực giáo dục là tương đối muộn so với các lĩnh vực khác. Tuy nhiên, việc Data mining giáo dục qua web là một thách thức vì các tính năng cụ thể của nó trên dữ liệu. Trong khi nhiều loại dữ liệu có các khía cạnh tuần tự, việc phân phối thông tin giáo dục theo thời gian có các thuộc tính đặc biệt.
Các kỹ thuật Data mining giáo dục đã rất hiệu quả và tạo ra một loạt các hiện tượng liên quan đến việc học tập của học sinh trên nền tảng trực tuyến và đạt được độ chính xác tốt hơn một cách nhất quán. Có những khía cạnh quan trọng cần được xem xét để biện minh cho sự tiến bộ phi thường của dữ liệu giáo dục, vốn đang phát triển sự thừa nhận rằng không phải tất cả dữ liệu quan trọng đều được lưu trữ trong một luồng dữ liệu.
Nghiên cứu trong giáo dục đã dẫn đến một số cải tiến giáo dục mới. Những đổi mới dựa trên máy tính đã thay đổi cách chúng ta sống và học tập. Ngày nay, việc sử dụng thông tin thu thập được thông qua những tiến bộ này đang hỗ trợ vòng chuyển đổi thứ hai trong tất cả các lĩnh vực và học tập với nhiều thành tựu khác nhau. Khai phá dữ liệu là kỹ thuật mạnh mẽ nhất với tiềm năng đáng kinh ngạc để giúp các trường học và đại học tập trung vào thông tin quan trọng nhất trong bộ dữ liệu mà họ đã thu thập về hành vi của sinh viên và những người học tiềm năng.
Data mining sử dụng các công cụ của nó để tìm các mẫu và mối quan hệ chưa biết trước đây trong các tập dữ liệu khổng lồ. Các công cụ này có thể kết hợp các mô hình thống kê, thuật toán toán học và kỹ thuật máy học. Các kỹ thuật này có thể tìm thấy thông tin trong dữ liệu mà các truy vấn và báo cáo không thể tiết lộ một cách hiệu quả.
Xem thêm Các loại kỹ thuật Data mining
Các cách tiếp cận Data mining trong dữ liệu giáo dục:
Data mining là một nhánh của khoa học máy tính nhằm mục đích khám phá các yếu tố và mẫu khác nhau để giúp đưa ra quyết định. Mô hình trong hình đã cho nhằm mục đích thiết kế Data mining giáo dục. Data mining có thể khuyến khích bộ nhớ thể chế. Khai phá dữ liệu, còn được gọi là KDD (Khám phá tri thức trong cơ sở dữ liệu), đề cập đến “Khai thác” hoặc trích xuất dữ liệu có kiến thức từ các tập dữ liệu khổng lồ. Một hệ thống giáo dục thường có một cơ sở dữ liệu giáo dục khổng lồ. Dữ liệu này có thể bao gồm dữ liệu của giáo viên, dữ liệu tài khoản, dữ liệu của học sinh, dữ liệu của cựu sinh viên, v.v. Data mining giáo dục tập trung vào các kỹ thuật phát triển để khám phá các loại dữ liệu đặc biệt bắt nguồn từ bối cảnh giáo dục. Những dữ liệu này bắt nguồn từ nhiều nguồn khác nhau, bao gồm dữ liệu từ môi trường lớp học trực diện truyền thống, phần mềm giáo dục trực tuyến, phần mềm giáo dục, v.v.
Các phương pháp Data mining được sử dụng để vận hành trên các tập dữ liệu khổng lồ nhằm tìm ra các mẫu và mối quan hệ ẩn, điều này rất hữu ích cho nhiều tổ chức trong việc đưa ra các quyết định dựa trên dữ liệu. Các kỹ thuật và thuật toán khác nhau như Phân cụm, Phân loại, Hồi quy, Mạng thần kinh, Trí tuệ nhân tạo, Quy tắc kết hợp, Thuật toán di truyền, Cây quyết định, v.v. được sử dụng để khám phá kiến thức từ cơ sở dữ liệu.
Phân cụm:
Phân cụm đề cập đến quá trình xác định và phân loại các đối tượng thành các nhóm khác nhau, việc phân đoạn một tập dữ liệu thành các tập con (cụm) để dữ liệu trong mỗi tập con có chung một số đặc điểm của các lớp đối tượng tương tự.
Phân loại:
Phân loại đề cập đến quá trình mô tả các mối quan hệ dữ liệu và thể hiện các giá trị để quan sát trong tương lai. Phân loại là nhiệm vụ của việc học một hàm mục tiêu ánh xạ mỗi tập thuộc tính A đến một trong các cấp độ lớp được xác định trước B. Có nhiều kỹ thuật phân loại khác nhau, đó là Phương pháp dựa trên cây quyết định, Suy luận dựa trên bộ nhớ, Phương pháp dựa trên quy tắc, Naïve Bayes và Mạng tín ngưỡng Bayes, Mạng thần kinh. Trong phân loại, dữ liệu thử nghiệm được sử dụng để ước tính độ chắc chắn của các quy tắc phân loại. Nếu độ chắc chắn là chấp nhận được, các quy tắc có thể được áp dụng cho các bộ dữ liệu mới. Thuật toán đào tạo trình phân loại sử dụng các ví dụ đã được phân loại trước này để xác định cách sắp xếp các tham số cần thiết để phân biệt thích hợp.
Sự dự đoán:
Các kỹ thuật hồi quy có thể được điều chỉnh để dự đoán. Nó có thể được sử dụng để chứng minh mối liên hệ giữa một hoặc nhiều biến độc lập và phụ thuộc. Trong Data mining, các biến độc lập là các thuộc tính đã được biết trước và các yếu tố phản hồi là những gì chúng ta cần dự đoán. Thật không may, nhiều vấn đề hàng ngày trong thế giới thực không dễ dự đoán. Do đó, các kỹ thuật tiên tiến hơn như hồi quy logistic, lưới thần kinh và cây quyết định có thể rất quan trọng để dự báo các giá trị trong tương lai.
Data mining giáo dục trong tương lai sắp tới:
Miền phổ biến mới nổi, được gọi là Data mining giáo dục quan tâm đến việc tạo ra các chiến lược tìm kiếm dữ liệu hữu ích có nguồn gốc từ môi trường giáo dục. Data mining là một lĩnh vực cực kỳ rộng lớn kết hợp sử dụng nhiều kỹ thuật và thuật toán khác nhau để tìm ra các mẫu.