Chương 23. Dữ liệu hóa học tập: nhìn thấy hay giám sát?

Một học sinh không đăng nhập ba ngày.

Dashboard đổi màu.

Vàng.

Rồi đỏ.

Hệ thống gửi cảnh báo:

“Learner at risk.”

Giáo viên nhìn thấy.

Cố vấn học tập nhìn thấy.

Quản lý chương trình nhìn thấy.

Phụ huynh có thể nhìn thấy.

Một hệ thống khác ghi nhận:

em xem video ít hơn trung bình lớp,

nộp bài trễ hơn nhóm cùng trình độ,

làm quiz nhanh bất thường,

đọc tài liệu lúc nửa đêm,

không tương tác diễn đàn,

không mở phản hồi của giáo viên,

không trả lời tin nhắn nhắc nhở.

Nếu không có dữ liệu, có thể không ai biết.

Nếu có dữ liệu, có thể một người lớn sẽ hỏi:

“Em ổn không?”

Và câu hỏi đó có thể cứu một học kỳ.

Nhưng cũng có thể câu chuyện khác xảy ra.

Học sinh ấy không đăng nhập vì đang chăm người thân ốm.

Em xem ít video vì đã tải tài liệu về đọc offline.

Em làm quiz nhanh vì đã học trước.

Em đọc lúc nửa đêm vì ban ngày phải đi làm.

Em không viết diễn đàn vì sợ bị chê.

Em không mở phản hồi vì app gửi thông báo lỗi.

Em không trả lời tin nhắn vì tin nhắn nghe như cảnh cáo.

Dashboard không biết chuyện đó.

Nó chỉ biết dấu vết.

Và dấu vết không phải con người.

Đây là mâu thuẫn của chương này:

Dữ liệu học tập có thể làm giáo dục bớt mù.

Nhưng dữ liệu học tập cũng có thể làm giáo dục tưởng rằng mình đã nhìn thấy đủ.

Nó có thể giúp trường phát hiện người học đang rơi.

Nó cũng có thể biến mỗi cú click thành một bằng chứng chống lại người học.

Nó có thể làm giáo viên quan tâm sớm hơn.

Nó cũng có thể làm giáo viên nhìn học sinh qua màu cảnh báo trước khi nghe giọng của em.

Nó có thể giúp người học hiểu mình hơn.

Nó cũng có thể khiến người học tự kiểm duyệt, tự tối ưu hành vi theo dashboard, tự đóng vai “người học tốt” thay vì thật sự học.

Nó có thể giúp lãnh đạo phân bổ hỗ trợ.

Nó cũng có thể giúp tổ chức quản lý rủi ro hình ảnh, retention, chi phí và trách nhiệm pháp lý.

Nó có thể là care.

Nó có thể là surveillance.

Và trong giáo dục, hai thứ này nguy hiểm ở chỗ:

chúng có thể dùng cùng một giao diện.

1. Cảnh mở: một cảnh báo màu đỏ

Hãy tưởng tượng một trường đại học dùng hệ thống learning analytics.

Mỗi sinh viên có một hồ sơ học tập.

Không phải hồ sơ theo nghĩa truyền thống:

tên,

mã số,

ngành,

điểm,

tín chỉ.

Mà là hồ sơ động:

thời điểm học,

tần suất xem video,

tốc độ làm bài,

số lần dừng video,

thời gian đọc tài liệu,

số bài nộp,

số câu hỏi trên forum,

network interaction,

quiz attempts,

assignment submission,

message response,

attendance,

course progress,

risk score.

Một buổi sáng, cố vấn học tập mở dashboard.

Danh sách sinh viên được xếp theo rủi ro.

Đỏ ở trên.

Vàng ở giữa.

Xanh ở dưới.

Một sinh viên từng học ổn bỗng chuyển đỏ.

Hệ thống gợi ý:

“Send intervention message.”

Một nút bấm.

Một mẫu email.

Một câu mở đầu lịch sự:

“Chúng tôi nhận thấy em có dấu hiệu giảm tương tác.”

Nếu cố vấn tốt, email ấy có thể mở ra một cuộc trò chuyện.

Nếu cố vấn quá tải, nó có thể là email thứ 500 trong tuần.

Nếu sinh viên đang xấu hổ, nó có thể nghe như:

“Hệ thống đã thấy em thất bại.”

Nếu trường dùng dữ liệu để hỗ trợ, cảnh báo đỏ là lời mời quan tâm.

Nếu trường dùng dữ liệu để quản trị rủi ro, cảnh báo đỏ là nhãn.

Nếu giáo viên dùng dữ liệu như câu hỏi, nó hữu ích.

Nếu giáo viên dùng dữ liệu như kết luận, nó nguy hiểm.

Vấn đề không chỉ là thuật toán đúng hay sai.

Vấn đề là dữ liệu được đặt vào quan hệ quyền lực nào.

Ai thấy?

Ai bị thấy?

Ai được giải thích?

Ai được phản hồi?

Ai được sửa dữ liệu?

Ai chịu hậu quả nếu nhãn sai?

Ai hưởng lợi nếu hệ thống làm trường có vẻ “data-driven”?

Ở đây, EdTech không còn là công cụ học.

Nó là hệ thống nhìn.

Và mọi hệ thống nhìn đều đặt ra một câu hỏi đạo đức:

nhìn để làm gì?

2. Các bên trong cuộc tranh luận

Người làm sản phẩm nói:

“Không có dữ liệu thì cá nhân hóa chỉ là khẩu hiệu.”

Họ không hoàn toàn sai.

Nếu một nền tảng không biết người học đang ở đâu,

không biết họ sai dạng bài nào,

không biết họ bỏ cuộc ở bước nào,

không biết tài liệu nào gây nghẽn,

không biết lớp nào có tỷ lệ hoàn thành thấp,

thì sản phẩm chỉ có thể phục vụ đại trà.

Dữ liệu giúp phát hiện pattern.

Dữ liệu giúp cải thiện nội dung.

Dữ liệu giúp đo ma sát.

Dữ liệu giúp cảnh báo sớm.

Dữ liệu giúp A/B test.

Dữ liệu giúp phân bổ nguồn lực.

Dữ liệu giúp người học thấy tiến độ.

Dữ liệu giúp giáo viên bớt đoán mò.

Nhưng người học có thể nói:

“Tôi không muốn mọi lúc yếu đuối của mình trở thành dữ liệu.”

Họ cũng không sai.

Học tập là quá trình có thử, sai, lười, sợ, hoãn, quay lại, lạc hướng, xấu hổ, tò mò, im lặng, thất bại riêng tư.

Nếu mọi dấu hiệu ấy đều bị ghi,

phân tích,

so sánh,

chấm điểm,

dự đoán,

lưu lại,

chia sẻ,

thì người học không còn chỉ học.

Họ biểu diễn việc học trước một hệ thống.

Giáo viên có thể nói:

“Tôi cần dữ liệu để biết ai đang cần giúp.”

Đúng.

Một lớp đông có thể khiến người học yếu biến mất rất lâu trước khi ai nhận ra.

Dashboard có thể kéo họ trở lại tầm nhìn của giáo viên.

Nhưng giáo viên cũng có thể nói:

“Tôi không muốn biến thành nhân viên xử lý alert.”

Cũng đúng.

Nếu mỗi ngày hệ thống tạo ra hàng chục cảnh báo,

nhưng trường không giảm tải,

không tăng cố vấn,

không cho thời gian gặp người học,

không có quy trình hỗ trợ,

thì analytics không tạo care.

Nó tạo queue.

Lãnh đạo trường nói:

“Chúng tôi cần biết chương trình nào đang thất bại.”

Đúng.

Dữ liệu tổng hợp có thể phát hiện vấn đề thiết kế chương trình.

Một môn có tỷ lệ rớt cao bất thường.

Một module làm người học bỏ cuộc.

Một nhóm sinh viên bị ảnh hưởng bởi lịch học.

Một nhóm người học online thiếu hỗ trợ.

Nhưng người học có thể hỏi:

“Tại sao mọi rủi ro của hệ thống lại được ghi lên hồ sơ cá nhân của tôi?”

Đó là câu hỏi sắc.

Vì nhiều vấn đề học tập không nằm trong người học.

Nó nằm trong thiết kế khóa học.

Trong workload.

Trong lịch thi.

Trong việc giáo viên phản hồi muộn.

Trong tài liệu khó hiểu.

Trong ngôn ngữ không bao gồm.

Trong học phí.

Trong công việc bán thời gian.

Trong đường truyền.

Trong gia đình.

Trong sức khỏe tinh thần.

Nếu hệ thống chỉ đo hành vi của người học, nó dễ biến vấn đề xã hội thành vấn đề cá nhân.

Phụ huynh nói:

“Tôi muốn biết con tôi có đang tụt lại không.”

Đúng.

Nhưng con cái có thể nói:

“Tôi cũng cần một vùng riêng để lớn lên.”

Cũng đúng.

Nhà quản lý nhà nước nói:

“Dữ liệu giúp minh bạch chất lượng.”

Đúng.

Nhưng xã hội có thể hỏi:

“Minh bạch cho ai, và ai bị biến thành đối tượng bị đo?”

Công ty EdTech nói:

“Chúng tôi chỉ tối ưu trải nghiệm.”

Có khi đúng.

Nhưng mô hình kinh doanh có thể thì thầm:

“Càng nhiều dữ liệu, sản phẩm càng khó bị thay thế.”

Đây là cuộc tranh luận thật.

Không có bên nào hoàn toàn ngây thơ.

Không có bên nào hoàn toàn xấu.

Nhưng mọi bên đều có lợi ích riêng.

Và dữ liệu là nơi lợi ích ấy gặp quyền lực.

3. Dữ liệu làm hiện ra những điều trước đây bị cảm tính che khuất

Ta không nên bắt đầu chương này bằng thái độ ghét dữ liệu.

Đó là phản ứng dễ dãi.

Giáo dục trước dữ liệu không phải thiên đường.

Nó cũng có mù lòa.

Một giáo viên có thể nghĩ lớp mình hiểu bài vì vài học sinh giỏi trả lời tốt.

Dữ liệu quiz có thể cho thấy 60 phần trăm lớp sai cùng một khái niệm.

Một trường có thể nghĩ sinh viên bỏ học vì “thiếu cố gắng”.

Dữ liệu có thể cho thấy nhóm bỏ học tập trung ở người đi làm, người học xa, người nhận hỗ trợ tài chính thấp, hoặc người phải học môn nền quá tải.

Một khóa online có thể được đánh giá tốt vì nội dung hay.

Dữ liệu completion có thể cho thấy phần lớn người học rơi ở tuần 3.

Một sản phẩm có thể tin rằng video 40 phút đang hiệu quả.

Dữ liệu có thể cho thấy người học dừng sau phút thứ 7.

Một giáo viên có thể không thấy học sinh yếu vì em im lặng.

Dữ liệu có thể cho thấy em làm đi làm lại cùng dạng bài và chưa qua được.

Một cố vấn học tập có thể không đủ thời gian gọi từng người.

Early alert có thể ưu tiên danh sách để gọi trước.

Đây là điểm mạnh thật của learning analytics:

nó biến một số tín hiệu rời rạc thành khả năng chú ý.

Nó không tạo ra sự quan tâm.

Nhưng nó có thể hướng sự quan tâm đến nơi cần thiết.

Nó không hiểu người học.

Nhưng nó có thể khiến người lớn hỏi người học sớm hơn.

Nó không thay thế giáo viên.

Nhưng nó có thể cho giáo viên một bản đồ thô về lớp học.

Nó không giải quyết bất bình đẳng.

Nhưng nó có thể làm một số bất bình đẳng bớt ẩn.

Nếu dùng ở cấp hệ thống, dữ liệu còn giúp đặt câu hỏi mà trực giác cá nhân khó trả lời:

Môn nào thường làm người học mất đà?

Nhóm nào cần hỗ trợ onboarding?

Nội dung nào tạo nhiều lỗi?

Loại feedback nào được đọc?

Can thiệp nào có tác dụng?

Thời điểm nào là quá muộn để nhắc?

Những câu hỏi ấy không tầm thường.

Giáo dục luôn cần bằng chứng.

Không có bằng chứng, ta dễ quản trị bằng ấn tượng.

Không có dữ liệu, người có giọng mạnh nhất trong phòng họp dễ thắng.

Không có phân tích, những nhóm ít nói dễ biến mất.

Vì vậy, phê phán datafication không có nghĩa là quay lại cảm tính.

Nó có nghĩa là hỏi:

dữ liệu nào,

cho mục đích nào,

với quyền gì,

với giới hạn nào,

và với cơ chế sửa sai nào?

4. Nhưng dữ liệu học tập luôn là bản dịch nghèo của một quá trình sống

Học tập không diễn ra hoàn toàn trong nền tảng.

Một phần diễn ra trong đầu.

Một phần trong cuộc trò chuyện.

Một phần trong vở nháp.

Một phần trong im lặng.

Một phần khi người học đi bộ về nhà và bất ngờ hiểu ra.

Một phần khi họ giải thích lại cho bạn.

Một phần khi họ bỏ cuộc một ngày rồi quay lại.

Một phần khi họ xấu hổ nhưng vẫn hỏi.

Một phần khi họ cãi giáo viên.

Một phần khi họ tự nhận ra mình sai.

Một phần khi họ thay đổi cách nhìn thế giới.

Không phải phần nào cũng tạo log.

Và không phải log nào cũng có nghĩa giáo dục.

Một người học có thể đăng nhập nhiều vì lo lắng.

Một người học khác đăng nhập ít vì tập trung tốt.

Một người học xem video ba lần vì chưa hiểu.

Một người học xem ba lần vì muốn ghi chú sâu.

Một người học làm quiz nhanh vì đoán bừa.

Một người học làm nhanh vì đã thành thạo.

Một người học không tham gia forum vì không quan tâm.

Một người học khác im lặng vì sợ tiếng Anh của mình bị đánh giá.

Một người học mở tài liệu nhưng không đọc.

Một người học in tài liệu ra đọc nên nền tảng tưởng rằng em biến mất.

Một người học xem bài giảng lúc 2 giờ sáng vì trì hoãn.

Một người học khác xem lúc 2 giờ sáng vì sau ca làm mới có thời gian.

Đây là vấn đề căn bản:

dữ liệu hành vi không tự mang ý nghĩa.

Nó cần bối cảnh.

Nó cần đối thoại.

Nó cần hiểu biết về khóa học.

Nó cần hiểu biết về người học.

Nó cần giáo viên.

Nó cần khiêm tốn.

Nếu thiếu những thứ đó, dashboard trở thành một máy kể chuyện quá tự tin.

Nó lấy một dấu vết nhỏ và dựng thành chân dung.

Nó lấy một khoảng lặng và gọi là disengagement.

Nó lấy một nhịp học khác và gọi là risk.

Nó lấy một cách học không giống trung bình và gọi là abnormal.

Học tập là quá trình sống.

Dữ liệu là bản dịch.

Bản dịch có thể hữu ích.

Nhưng bản dịch luôn mất mát.

Và trong giáo dục, mất mát ấy có thể thành bất công nếu ta quên rằng nó là mất mát.

5. Click, thời lượng xem, số bài làm và điểm quiz nói gì?

Click nói rằng người học tương tác với hệ thống.

Nó không nói họ hiểu.

Thời lượng xem nói rằng video được mở trong một khoảng thời gian.

Nó không nói mắt có nhìn hay trí có nghĩ.

Số bài làm nói rằng người học có hoạt động.

Nó không nói hoạt động ấy là luyện tập sâu hay làm cho xong.

Điểm quiz nói rằng người học trả lời đúng một số câu trong một cấu trúc đo cụ thể.

Nó không nói họ có chuyển được kiến thức sang tình huống khác không.

Tần suất forum nói rằng người học phát ngôn.

Nó không nói phát ngôn ấy có chất lượng, có an toàn, có thật sự giúp học không.

Tốc độ hoàn thành nói rằng người học đi qua nội dung nhanh hay chậm.

Nó không nói tốc độ ấy phù hợp hay bất thường.

Tỷ lệ completion nói rằng người học đi đến cuối.

Nó không nói họ đã thay đổi cách hiểu.

Điều này nghe như phê phán quá mức.

Nhưng nó là yêu cầu tối thiểu của measurement.

Một chỉ số tốt phải biết mình đo gì.

Và phải biết mình không đo gì.

Nếu completion được dùng để đo completion, ổn.

Nếu completion được dùng để đo learning, phải cẩn thận.

Nếu time-on-task được dùng để gợi ý “người học có thể đang cần hỗ trợ”, có thể hữu ích.

Nếu time-on-task được dùng để kết luận “người này chăm hơn người kia”, rất nguy hiểm.

Nếu quiz score được dùng để phát hiện misconception, tốt.

Nếu quiz score được dùng để gắn người học vào nhóm năng lực cố định, rủi ro.

Nếu forum participation được dùng để hiểu tương tác lớp, được.

Nếu forum participation được dùng để đánh giá engagement mà không tính văn hóa, ngôn ngữ, tính cách, cảm giác an toàn, nguy hiểm.

Các nghiên cứu về clickstream cho thấy dữ liệu này rất hấp dẫn vì nó chi tiết và có thể thu ở quy mô lớn, nhưng cũng “partial and noisy”: nó chỉ ghi dấu một phần hành động, không biết điều gì xảy ra giữa hai cú click, không biết nội dung ngoài LMS, và không đo được nhiều cơ chế tâm lý như lo âu hay động lực.[^baker-clickstream]

Nói thẳng:

nếu sản phẩm nói “chúng tôi đo learning” bằng click,

ta nên hỏi lại:

“Anh đang đo learning, hay đo trace của interaction?”

Trace không vô nghĩa.

Nhưng trace không phải người học.

6. Predictive analytics: cứu sớm hay đóng băng kỳ vọng?

Predictive analytics trong giáo dục thường hứa một điều rất hấp dẫn:

đừng chờ người học rớt rồi mới giúp.

Hãy dự đoán sớm.

Hãy can thiệp sớm.

Hãy giảm dropout.

Hãy giữ người học lại.

Lập luận này mạnh.

Và có cơ sở thực tế.

Nếu một sinh viên có dấu hiệu mất nhịp trong tuần 2, chờ đến cuối kỳ mới biết là quá muộn.

Nếu một học sinh liên tục sai cùng kỹ năng, chờ đến bài thi lớn mới phản hồi là bất công.

Nếu một khóa học có điểm nghẽn ở module 4, chờ đến khảo sát cuối khóa mới sửa là lãng phí.

Early alert có thể hữu ích vì nó chuyển thời điểm can thiệp từ sau thảm họa sang trước thảm họa.

Các dự án như Open Academic Analytics Initiative đã nghiên cứu việc thu thập, tổ chức, khai thác dữ liệu để dự đoán academic risk, thử tính portability của mô hình qua bối cảnh, và xem kết quả can thiệp với nhóm at-risk.[^oaai]

Nhưng một systematic review về learning analytics trong giáo dục đại học cũng cho thấy bằng chứng nghiêm ngặt ở quy mô lớn vẫn còn thiếu, và nhiều nghiên cứu tập trung vào độ chính xác thuật toán hơn là ý nghĩa giáo dục của “study success”.[^ifenthaler-yau]

Nhưng “dự đoán sớm” không tự động là “giúp sớm”.

Một cảnh báo không phải can thiệp.

Một email không phải hỗ trợ.

Một risk score không phải kế hoạch học tập.

Một dashboard không phải quan hệ.

Nếu hệ thống dự đoán đúng nhưng trường không có nguồn lực hỗ trợ, nó chỉ làm tổ chức biết trước ai sẽ thất bại.

Nếu hệ thống dự đoán sai nhưng người học bị đối xử theo nhãn đó, nó tạo ra thất bại.

Nếu hệ thống dự đoán dựa trên lịch sử bất bình đẳng, nó có thể làm bất bình đẳng trở thành “khả năng thống kê”.

Nếu hệ thống dự đoán dựa trên hành vi nền tảng, nó có thể phạt người học có cách học nằm ngoài nền tảng.

Nếu hệ thống dự đoán dựa trên dữ liệu nền như tài chính, nơi ở, tuổi, lịch sử học tập, nó có thể trộn hỗ trợ với phân tầng xã hội.

Đây là chỗ mâu thuẫn rất thật:

Dự đoán có thể là công cụ chăm sóc.

Dự đoán cũng có thể là công cụ triage.

Care hỏi:

“Ta cần làm gì để người này có thêm cơ hội?”

Triage hỏi:

“Ai đáng đầu tư, ai có khả năng mất?”

Hai câu hỏi này khác nhau.

Nhưng trong bảng tính, chúng có thể trông giống nhau.

7. Khi “at risk” trở thành căn tính

Một trong những câu nguy hiểm nhất trong data-driven education là:

“Em là học sinh rủi ro cao.”

Câu đúng hơn phải là:

“Một số dữ liệu hiện tại gợi ý rằng em có thể cần hỗ trợ trong bối cảnh này.”

Khác biệt không nhỏ.

Câu thứ nhất biến người học thành nhãn.

Câu thứ hai biến dữ liệu thành giả thuyết.

Câu thứ nhất đóng.

Câu thứ hai mở.

Câu thứ nhất dễ làm giáo viên hạ kỳ vọng.

Câu thứ hai mời giáo viên hỏi.

Câu thứ nhất khiến người học tự nhìn mình qua thiếu hụt.

Câu thứ hai giữ lại khả năng thay đổi.

Nhãn “at risk” rất dễ trượt từ mô tả tình huống sang mô tả con người.

Ban đầu:

“Sinh viên này có nguy cơ rớt môn.”

Sau đó:

“Sinh viên này thuộc nhóm rủi ro.”

Sau nữa:

“Sinh viên này là người học yếu.”

Và cuối cùng:

“Đừng kỳ vọng quá nhiều.”

Vấn đề không chỉ là ngôn ngữ.

Ngôn ngữ thay đổi hành vi.

Nếu giáo viên thấy nhãn trước khi gặp người học, kỳ vọng có thể bị chỉnh xuống.

Nếu cố vấn thấy risk score, cuộc trò chuyện có thể bắt đầu bằng phòng thủ.

Nếu người học thấy mình bị xếp đỏ, họ có thể mất agency.

Nếu hệ thống liên tục nhắc rằng em đang tụt, em có thể tin rằng mình là người tụt.

Các phân tích phê phán về predictive learning analytics nhấn mạnh rằng công nghệ dự đoán không chỉ mô tả tương lai, mà còn tham gia tạo tương lai: nó định nghĩa điều gì là rủi ro, ai là người mang rủi ro, và ai phải hành động để quản lý rủi ro ấy.[^zakharova-risk]

Đây là lý do “accuracy” không đủ.

Một mô hình có thể dự đoán đúng xác suất.

Nhưng cách tổ chức dùng dự đoán ấy có thể sai về giáo dục.

Nếu dự đoán khiến người học bị bỏ qua, nó xấu.

Nếu dự đoán khiến người học bị kiểm soát hơn thay vì được hỗ trợ hơn, nó xấu.

Nếu dự đoán làm giáo viên mất tò mò về người học, nó xấu.

Nếu dự đoán làm tổ chức tự hào vì “biết trước dropout” nhưng không sửa nguyên nhân dropout, nó xấu.

Trong giáo dục, một dự đoán tốt phải được đánh giá bằng câu hỏi:

nó có mở thêm khả năng cho người học không?

Hay nó chỉ làm tương lai của người học có vẻ đã được tính xong?

8. Can thiệp là hành động giáo dục, không phải thông báo tự động

Một trong những ảo tưởng phổ biến của EdTech là:

phát hiện xong là gần như giải quyết xong.

Không đúng.

Phát hiện chỉ là mở cửa.

Đi qua cánh cửa đó cần con người,

thời gian,

kỹ năng,

nguồn lực,

thiết kế hỗ trợ.

Một cảnh báo “low engagement” có thể dẫn tới nhiều kiểu can thiệp:

một email nhắc chung,

một tin nhắn cá nhân,

một cuộc gọi,

một buổi học bù,

một thay đổi deadline,

một đề xuất học nhóm,

một cuộc gặp cố vấn,

một hỗ trợ tài chính,

một điều chỉnh khóa học,

một lời xin lỗi vì thiết kế bài học quá khó.

Không phải can thiệp nào cũng giống nhau.

Và không phải mọi vấn đề đều nằm ở người học.

Nếu nhiều người rơi ở cùng bài, can thiệp đúng có thể là sửa bài.

Nếu một nhóm người học luôn rơi sau tuần đi thực tập, can thiệp đúng có thể là đổi lịch.

Nếu người học không mở feedback vì feedback quá muộn, can thiệp đúng là quy trình phản hồi.

Nếu người học không tương tác forum vì forum độc hại, can thiệp đúng là văn hóa lớp.

Nếu người học không đăng nhập vì không có thiết bị, can thiệp đúng là hạ tầng.

Nếu người học bị cảnh báo vì phải đi làm, can thiệp đúng không phải nhắc chăm chỉ.

Learning analytics thất bại khi nó biến mọi tín hiệu thành vấn đề cá nhân:

em không đăng nhập,

em không xem,

em không làm,

em không tương tác,

em có nguy cơ.

Learning analytics tốt hỏi thêm:

khóa học đang làm gì với em?

trường đang thiếu gì?

giáo viên cần hỗ trợ gì?

thiết kế có gây rơi không?

chỉ số có hiểu sai không?

Nếu không có tầng này, hệ thống trở thành máy gửi lời nhắc.

Và một nền giáo dục đầy lời nhắc chưa chắc là nền giáo dục biết chăm sóc.

9. Dữ liệu lớp học có thể giúp giáo viên, nhưng cũng có thể làm nghèo nghề giáo

Giáo viên thường phải đọc nhiều tín hiệu cùng lúc.

Ánh mắt.

Im lặng.

Bài làm.

Câu hỏi.

Cách học sinh tránh nhìn.

Cách một nhóm mất động lực.

Cách một em giỏi bỗng sai những lỗi lạ.

Cách một em yếu vẫn cố.

Dữ liệu số có thể thêm một lớp tín hiệu.

Nó có thể nói:

em này đang luyện đều nhưng không tiến bộ,

nhóm này sai cùng một concept,

bài này mất nhiều attempt,

feedback này không được đọc,

video này bị bỏ ở đoạn giải thích quan trọng,

quiz này có câu gây nhiễu,

người học mới không hiểu onboarding.

Đây là dữ liệu tốt cho nghề giáo.

Nó giúp giáo viên điều chỉnh.

Nó giúp giáo viên bớt dựa vào trí nhớ.

Nó giúp giáo viên thấy người im lặng.

Nó giúp giáo viên có bằng chứng để đòi sửa chương trình.

Nhưng dữ liệu cũng có thể làm nghèo nghề giáo nếu tổ chức biến nó thành công cụ giám sát giáo viên.

“Lớp của cô có engagement thấp.”

“Tỷ lệ hoàn thành của thầy dưới chuẩn.”

“Feedback response time chưa đạt KPI.”

“Sinh viên đỏ trong lớp này cao hơn trung bình.”

Một số câu có thể cần thiết.

Nhưng nếu dùng sai, chúng đẩy giáo viên vào hành vi tối ưu chỉ số.

Dạy để tăng login.

Thiết kế hoạt động để tăng click.

Gửi feedback nhanh nhưng cạn.

Chia bài thành nhiều nhiệm vụ nhỏ để completion đẹp hơn.

Né nội dung khó vì làm dashboard xấu.

Đẩy trách nhiệm “engagement” về giáo viên mà không nhìn workload, sĩ số, bối cảnh người học.

Khi đó, learning analytics không còn giúp giáo viên hiểu lớp.

Nó làm giáo viên bị lớp dữ liệu quản lý.

Một hệ thống tốt phải bảo vệ hai thứ cùng lúc:

quyền được hỗ trợ của người học,

và phẩm giá nghề nghiệp của giáo viên.

Nếu dữ liệu làm giáo viên mạnh hơn, nó đáng dùng.

Nếu dữ liệu làm giáo viên sợ dashboard hơn sợ mất người học, nó đã lệch.

10. Người học nhìn dashboard không giống tổ chức nhìn dashboard

Một dashboard có thể được thiết kế “cho người học”.

Tiến độ.

Mục tiêu.

Điểm mạnh.

Điểm yếu.

So sánh với lớp.

Streak.

Risk.

Gợi ý việc cần làm tiếp.

Về lý thuyết, điều này giúp self-regulation.

Người học thấy mình đang ở đâu.

Biết nên ôn gì.

Biết mình chậm phần nào.

Biết deadline.

Biết thói quen.

Biết cần xin giúp đỡ.

Nhưng dashboard không chỉ truyền thông tin.

Nó tạo cảm xúc.

Một thanh tiến độ có thể khích lệ.

Nó cũng có thể làm người học thấy mình mãi tụt.

Một so sánh với lớp có thể định vị.

Nó cũng có thể làm người học xấu hổ.

Một risk score có thể cảnh báo.

Nó cũng có thể làm người học hoảng.

Một streak có thể tạo nhịp.

Nó cũng có thể biến học tập thành trò giữ chuỗi.

Một gợi ý cá nhân hóa có thể giúp chọn bước tiếp theo.

Nó cũng có thể làm người học phụ thuộc vào hệ thống.

Nghiên cứu về dashboard hướng tới student agency nhấn mạnh rằng thiết kế không thể chỉ data-driven; nó cần hiểu người học, có sự tham gia của sinh viên, và có nền tảng sư phạm.[^student-agency]

Đây là điểm thường bị bỏ qua:

minh bạch dữ liệu không chỉ là cho người học xem số.

Minh bạch phải giúp họ hiểu:

số này được tạo như thế nào,

nó đo gì,

nó không đo gì,

nó ảnh hưởng quyết định nào,

ai có thể nhìn thấy,

họ có thể phản hồi ra sao,

họ có quyền sửa hay giải thích dữ liệu không.

Nếu dashboard chỉ đưa chỉ số mà không trao quyền diễn giải, nó là gương méo.

Nếu dashboard giúp người học tự hiểu và tự chọn hành động, nó là công cụ học.

Hai thứ này nhìn bề ngoài rất giống nhau.

Khác biệt nằm ở agency.

11. Ranh giới giữa care và surveillance

Care và surveillance đều bắt đầu bằng quan sát.

Nhưng chúng khác nhau ở mục đích.

Care nhìn để giúp.

Surveillance nhìn để kiểm soát.

Care hỏi người học đang cần gì.

Surveillance hỏi người học có lệch chuẩn không.

Care giữ bối cảnh.

Surveillance rút bối cảnh thành tín hiệu.

Care mời đối thoại.

Surveillance tạo hồ sơ.

Care có giới hạn.

Surveillance muốn mở rộng.

Care chấp nhận không biết hết.

Surveillance muốn thấy mọi thứ.

Care đặt quyền lợi người học ở trung tâm.

Surveillance thường đặt an toàn tổ chức, quản trị rủi ro, compliance hoặc năng suất ở trung tâm.

Trong thực tế, trường học có thể nói:

“Chúng tôi giám sát để chăm sóc.”

Và đôi khi đúng.

Nếu một hệ thống phát hiện nguy cơ tự hại và giúp người lớn can thiệp đúng lúc, ta không thể nói đơn giản rằng mọi monitoring đều xấu.

Nếu một dashboard giúp giáo viên nhận ra học sinh bị bỏ quên, ta không thể nói dữ liệu là kẻ thù.

Nhưng cũng không thể để chữ “care” trở thành giấy phép nhìn vô hạn.

Một người học không mất quyền riêng tư chỉ vì trường nói rằng trường quan tâm.

Một đứa trẻ không mất quyền được sai riêng tư chỉ vì nền tảng nói rằng dữ liệu giúp cá nhân hóa.

Một sinh viên không mất quyền tự chủ chỉ vì tổ chức muốn giảm dropout.

Human Rights Watch từng phân tích 163 sản phẩm EdTech được nhiều chính phủ khuyến nghị trong đại dịch và kết luận phần lớn có khả năng hoặc đã theo dõi trẻ em theo cách xâm phạm hoặc đe dọa quyền của các em; báo cáo cũng nhấn mạnh trẻ em thường không thể từ chối theo dõi nếu muốn tiếp tục học.[^hrw-edtech]

Các tranh luận về phần mềm giám sát học sinh ở K-12 tại Mỹ cũng chỉ ra một điểm khó chịu: công cụ được bán bằng ngôn ngữ an toàn, nhưng có thể tạo chilling effect, lo ngại về kỷ luật, chia sẻ với lực lượng thực thi pháp luật, và tác động mạnh hơn lên nhóm dễ tổn thương.[^aclu-surveillance][^cdt-monitoring]

UNESCO cũng đặt vấn đề ở cấp hệ thống: công nghệ giáo dục phải được quản trị bằng điều kiện do giáo dục đặt ra, phục vụ trải nghiệm học tập và wellbeing, hỗ trợ giáo viên, và không thay thế tương tác người-người.[^unesco-tech]

Đây là bài học cho learning analytics nói chung:

một hệ thống có mục tiêu tốt vẫn có thể tạo quan hệ giám sát.

Và khi giám sát trở thành bình thường trong giáo dục, người học học thêm một bài học ẩn:

“Đừng để lộ quá nhiều.”

“Đừng tìm kiếm điều nhạy cảm.”

“Đừng viết điều thật.”

“Đừng thử điều có thể bị hiểu sai.”

“Đừng học theo cách dashboard không công nhận.”

Một nền giáo dục làm người học sợ dấu vết của chính mình là nền giáo dục đã mất một phần linh hồn.

12. Consent trong giáo dục không đơn giản

Trong nhiều sản phẩm số, ta nói về consent như thể người dùng có lựa chọn.

Đồng ý hoặc không.

Tick hoặc không tick.

Nhưng trong giáo dục, consent phức tạp hơn.

Một học sinh không thể nói:

“Em không đồng ý dùng nền tảng nhà trường yêu cầu.”

mà vẫn chắc chắn không bị thiệt.

Một sinh viên không thể luôn từ chối learning analytics nếu hệ thống gắn với LMS, bài nộp, điểm, attendance, feedback, học bổng, cố vấn.

Một phụ huynh không phải lúc nào cũng hiểu sản phẩm thu gì, chia sẻ gì, lưu bao lâu.

Một giáo viên không phải lúc nào cũng có quyền chọn nền tảng khác.

Một trường nhỏ có thể không đủ năng lực đàm phán với vendor.

Vì vậy, “người học đã đồng ý” không phải câu trả lời đủ.

Đồng ý trong bối cảnh bất cân xứng quyền lực không có cùng ý nghĩa với đồng ý trong thị trường tiêu dùng thông thường.

Một bài nghiên cứu về learning analytics và privacy trong đại học lập luận rằng privacy như quyền kiểm soát thông tin giúp bảo vệ autonomy, nhưng Big Data làm consent truyền thống yếu đi vì người học thường không biết các luồng dữ liệu phức tạp quanh mình.[^jones-privacy]

Điều này không có nghĩa là consent vô dụng.

Nó có nghĩa là consent phải đi cùng governance.

Cần nói rõ:

dữ liệu nào được thu,

thu vì mục đích gì,

không dùng cho mục đích gì,

ai được truy cập,

dữ liệu lưu bao lâu,

khi nào xóa,

có chia sẻ với bên thứ ba không,

dashboard ảnh hưởng quyết định nào,

người học có thể xem dữ liệu của mình không,

có thể sửa dữ liệu sai không,

có thể phản đối nhãn không,

có thể yêu cầu giải thích không,

có thể chọn không tham gia phần nào không,

không tham gia thì có bị thiệt không.

Jisc Code of Practice for Learning Analytics đặt các nguyên tắc như transparency and consent, privacy, validity, access, enabling positive interventions, minimising adverse impacts và stewardship of data; nó cũng nhấn mạnh analytics nên phục vụ lợi ích người học, minh bạch về dữ liệu/mục đích/metrics/quyền truy cập, kiểm định validity, hạn chế tác hại của nhãn, và giữ dữ liệu ở mức tối thiểu cần thiết.[^jisc-code]

Nói cách khác:

không thể biến learning analytics thành “bật tính năng”.

Nó là một cam kết quản trị.

Nếu tổ chức không đủ năng lực giải thích, kiểm định, sửa sai và chịu trách nhiệm, tổ chức chưa nên dùng analytics ở mức tác động cao.

Điều này càng quan trọng khi hệ thống AI được dùng để quyết định access, admission, đánh giá learning outcomes, định tuyến mức học hoặc giám sát hành vi trong kiểm tra, vì EU AI Act xếp các trường hợp giáo dục như vậy vào nhóm high-risk.[^eu-ai-act]

13. Vendor muốn dữ liệu, trường muốn insight, người học muốn quyền

Trong lý tưởng, ba bên này có thể cùng thắng.

Vendor cần dữ liệu để cải thiện sản phẩm.

Trường cần insight để cải thiện dạy và học.

Người học cần feedback để tự điều chỉnh.

Nhưng thực tế thường căng hơn.

Vendor có động lực mở rộng data capture.

Nhiều dữ liệu hơn giúp model tốt hơn.

Nhiều dữ liệu hơn giúp tính năng phong phú hơn.

Nhiều dữ liệu hơn giúp lock-in mạnh hơn.

Nhiều dữ liệu hơn giúp phân tích thị trường.

Nhiều dữ liệu hơn giúp sản phẩm có câu chuyện “AI-powered”.

Trường có động lực giảm dropout, tăng retention, chứng minh chất lượng, giảm chi phí hỗ trợ, có dashboard cho lãnh đạo.

Người học có động lực hoàn thành khóa, được giúp đúng lúc, không bị hiểu sai, không bị theo dõi quá mức, không bị hồ sơ dữ liệu đi theo mình.

Xung đột xuất hiện khi insight của trường và lợi ích của vendor cần nhiều dữ liệu hơn mức người học thấy hợp lý.

Một sản phẩm có thể nói:

“Chúng tôi cần mọi interaction để cá nhân hóa.”

Người học có thể hỏi:

“Có thể cá nhân hóa tốt mà thu ít hơn không?”

Một trường có thể nói:

“Chúng tôi cần biết ai có rủi ro.”

Người học có thể hỏi:

“Ai được thấy rủi ro ấy, và tôi có quyền kể câu chuyện của mình không?”

Một vendor có thể nói:

“Dữ liệu đã được anonymized.”

Nhà nghiên cứu privacy có thể hỏi:

“Có thể re-identify khi ghép với dữ liệu khác không?”

Một lãnh đạo có thể nói:

“Dashboard giúp accountability.”

Giáo viên có thể hỏi:

“Accountability cho cải thiện hay accountability để đổ lỗi?”

Một phụ huynh có thể nói:

“Tôi muốn biết con tôi đang làm gì.”

Thiếu niên có thể hỏi:

“Con có được một vùng riêng để trưởng thành không?”

Các câu hỏi này không phá sản phẩm.

Chúng làm sản phẩm trưởng thành hơn.

EdTech nghiêm túc phải thiết kế cho xung đột lợi ích, không giả vờ rằng mọi bên tự nhiên cùng mục tiêu.

14. Data minimization không phải cản trở đổi mới

Một phản ứng quen thuộc của sản phẩm dữ liệu là:

“Nếu thu ít dữ liệu thì làm sao thông minh?”

Câu trả lời:

thông minh không đồng nghĩa với tham dữ liệu.

Trong giáo dục, data minimization không phải tư duy phòng thủ.

Nó là nguyên tắc sư phạm.

Vì dữ liệu giáo dục không phải dữ liệu vô hại.

Nó tiết lộ:

năng lực,

thói quen,

điểm yếu,

ngôn ngữ,

tốc độ,

stress,

quan hệ,

thời gian biểu,

khả năng tài chính,

thiết bị,

địa điểm,

sức khỏe,

khủng hoảng,

gia đình.

Nếu một sản phẩm có thể đưa feedback tốt bằng dữ liệu bài làm, không cần thu vị trí.

Nếu có thể phát hiện misconception bằng câu trả lời, không cần theo dõi mọi trang web người học mở.

Nếu có thể gợi ý ôn tập bằng lịch sử luyện tập, không cần phân tích tin nhắn riêng.

Nếu có thể cải thiện khóa học bằng dữ liệu tổng hợp, không cần lưu hồ sơ cá nhân dài hạn.

Nếu có thể đo completion ở cấp lớp, không cần tạo risk score cá nhân.

Nếu có thể hỗ trợ người học bằng opt-in, không nên mặc định thu dữ liệu nhạy cảm.

Đổi mới tốt đặt câu hỏi:

“Dữ liệu tối thiểu nào đủ để tạo lợi ích này?”

Đổi mới lười đặt câu hỏi:

“Thu được gì thì thu trước, sau này tính.”

Trong giáo dục, “sau này tính” là nguy hiểm.

Vì người học không phải nguồn nguyên liệu dữ liệu.

Họ là chủ thể đang phát triển.

Và chủ thể đang phát triển cần quyền được thử mà không bị lưu vĩnh viễn.

15. Benchmark đúng cho learning analytics

Benchmark tệ hỏi:

mô hình dự đoán dropout chính xác bao nhiêu?

Benchmark tốt hỏi thêm:

dự đoán ấy dẫn tới hỗ trợ nào?

Hỗ trợ ấy có cải thiện kết quả không?

Tác động có khác nhau giữa nhóm xã hội không?

False positive gây hại gì?

False negative bỏ sót ai?

Người học có hiểu vì sao mình bị cảnh báo không?

Giáo viên có thời gian xử lý cảnh báo không?

Alert có làm tăng workload không?

Dashboard có làm người học xấu hổ không?

Nhãn có ảnh hưởng kỳ vọng của giáo viên không?

Người học có quyền phản hồi nhãn không?

Dữ liệu có được xóa khi hết mục đích không?

Mô hình có được kiểm định lại theo khóa học, bối cảnh, năm học không?

Tổ chức có sửa khóa học khi dữ liệu cho thấy vấn đề thuộc thiết kế không?

Benchmark tệ hỏi:

dashboard có nhiều chỉ số không?

Benchmark tốt hỏi:

chỉ số nào dẫn tới hành động giáo dục tốt hơn?

Benchmark tệ hỏi:

người học có đăng nhập nhiều hơn không?

Benchmark tốt hỏi:

người học có hiểu sâu hơn, tự chủ hơn, ít cô đơn hơn, được hỗ trợ đúng lúc hơn không?

Benchmark tệ hỏi:

AI có phát hiện rủi ro sớm hơn không?

Benchmark tốt hỏi:

phát hiện sớm có mở thêm tương lai cho người học không?

Đánh giá learning analytics phải đi qua nhiều tầng:

technical validity,

pedagogical validity,

equity impact,

privacy impact,

workflow impact,

student agency,

teacher workload,

governance maturity,

appeal and correction,

long-term trust.

Nếu một hệ thống chỉ thắng ở tầng technical validity, nó chưa đủ.

Nếu nó dự đoán tốt nhưng làm người học mất niềm tin, nó chưa tốt.

Nếu nó tạo insight nhưng không tạo năng lực hành động, nó chưa tốt.

Nếu nó làm trường thấy nhiều hơn nhưng người học có ít quyền hơn, nó chưa tốt.

16. Đừng dùng dữ liệu để tránh câu hỏi khó

Một tổ chức rất dễ yêu dashboard vì dashboard làm vấn đề trông quản lý được.

Dropout trở thành tỷ lệ.

Engagement trở thành đường biểu diễn.

Wellbeing trở thành heatmap.

Risk trở thành màu.

Equity trở thành filter.

Learning trở thành score.

Nhưng nhiều câu hỏi giáo dục không thể được giải quyết bằng việc nhìn dashboard lâu hơn.

Tại sao khóa học này quá nặng?

Tại sao sinh viên nghèo phải chọn giữa đi làm và học?

Tại sao giáo viên không có thời gian phản hồi?

Tại sao người học không tin trường?

Tại sao lớp học không an toàn để hỏi?

Tại sao chương trình đo completion nhiều hơn hiểu biết?

Tại sao sản phẩm tối ưu retention hơn phẩm giá?

Tại sao dữ liệu của trẻ em lại chảy qua quá nhiều bên thứ ba?

Tại sao người học không có quyền mặc cả?

Những câu hỏi này không biến mất khi ta có dữ liệu.

Đôi khi dữ liệu còn giúp tổ chức né chúng.

Thay vì hỏi vì sao người học bỏ cuộc, ta tối ưu nudge.

Thay vì hỏi vì sao môn học gây rơi hàng loạt, ta gửi cảnh báo cá nhân.

Thay vì hỏi vì sao giáo viên quá tải, ta yêu cầu phản hồi nhanh hơn.

Thay vì hỏi vì sao người học không có cộng đồng, ta tăng gamification.

Thay vì hỏi vì sao chương trình không phù hợp, ta xây mô hình dự đoán ai sẽ thất bại trong chương trình đó.

Đây là cám dỗ của quản trị bằng dữ liệu:

nó thích câu hỏi có thể đo.

Nhưng giáo dục thường đau ở những chỗ khó đo.

Một hệ thống analytics tốt phải làm ngược lại:

dùng dữ liệu để mở câu hỏi khó,

không dùng dữ liệu để đóng câu hỏi khó.

17. Thiết kế sản phẩm: từ dashboard quyền lực sang dashboard đối thoại

Nếu phải thiết kế một hệ thống learning analytics từ tinh thần của chương này, tôi sẽ không bắt đầu bằng “risk engine”.

Tôi sẽ bắt đầu bằng câu hỏi:

ai cần thấy gì để giúp người học có thêm lựa chọn?

Với người học, dashboard nên ưu tiên:

tiến độ có thể hiểu,

feedback có thể hành động,

gợi ý bước tiếp theo,

giải thích chỉ số,

quyền ẩn một số so sánh gây hại,

không dùng ngôn ngữ định danh như “yếu” hay “rủi ro cao”,

khả năng ghi chú bối cảnh,

khả năng yêu cầu hỗ trợ,

khả năng phản hồi khi dữ liệu sai.

Với giáo viên, dashboard nên ưu tiên:

misconception của lớp,

điểm nghẽn nội dung,

nhóm cần hỗ trợ,

tín hiệu bất thường cần hỏi lại,

không xếp hạng học sinh như bảng thành tích ngược,

không biến giáo viên thành người chạy theo alert,

không tạo KPI phi giáo dục.

Với cố vấn học tập, dashboard nên ưu tiên:

người cần liên hệ sớm,

lịch sử hỗ trợ,

ngữ cảnh đã biết,

khuyến nghị hành động có nguồn lực thật,

không chỉ gửi mẫu email,

không để risk score là câu cuối.

Với lãnh đạo, dashboard nên ưu tiên:

vấn đề ở thiết kế chương trình,

vấn đề ở workload,

vấn đề ở hỗ trợ,

vấn đề ở equity,

không chỉ chỉ ra người học “rủi ro”.

Với phụ huynh, nhất là với trẻ nhỏ, dashboard nên ưu tiên:

thông tin đủ để hỗ trợ,

không quá chi tiết để biến gia đình thành phần mở rộng của hệ thống giám sát,

không dùng dữ liệu để gây áp lực liên tục,

có giải thích sư phạm.

Với vendor, hệ thống nên có:

data minimization by design,

purpose limitation,

retention policy,

audit log,

role-based access,

model validation,

bias monitoring,

explainability,

incident reporting,

export and deletion,

contract rõ về không bán dữ liệu,

không dùng dữ liệu giáo dục cho mục đích ngoài giáo dục nếu không có cơ sở rõ ràng.

Nói gọn:

dashboard tốt không phải bảng nhìn xuống người học.

Nó là bàn làm việc chung để hỏi:

“Điều gì đang xảy ra, và ta nên giúp thế nào?”

18. Một nguyên tắc đơn giản: dữ liệu phải làm cuộc trò chuyện tốt hơn

Nếu phải giữ lại một nguyên tắc cho chương này, tôi chọn:

dữ liệu học tập chỉ đáng dùng khi nó làm cuộc trò chuyện giáo dục tốt hơn.

Tốt hơn nghĩa là:

đúng lúc hơn,

cụ thể hơn,

công bằng hơn,

ít xấu hổ hơn,

có bối cảnh hơn,

có quyền phản hồi hơn,

có hành động hỗ trợ hơn,

có trách nhiệm hơn.

Nếu dữ liệu khiến giáo viên hỏi người học sớm hơn:

tốt.

Nếu dữ liệu khiến giáo viên kết luận trước khi hỏi:

xấu.

Nếu dữ liệu giúp người học hiểu mình đang mắc ở đâu:

tốt.

Nếu dữ liệu làm người học thấy mình là tập hợp thiếu hụt:

xấu.

Nếu dữ liệu giúp trường sửa khóa học:

tốt.

Nếu dữ liệu giúp trường đổ lỗi cho người học:

xấu.

Nếu dữ liệu giúp phụ huynh hỗ trợ con:

tốt.

Nếu dữ liệu biến phụ huynh thành người giám sát từng phút:

xấu.

Nếu dữ liệu giúp vendor cải thiện sư phạm:

tốt.

Nếu dữ liệu chủ yếu giúp vendor tích lũy quyền lực nền tảng:

xấu.

Nếu dữ liệu giúp xã hội nhìn thấy bất bình đẳng:

tốt.

Nếu dữ liệu biến bất bình đẳng thành dự đoán cá nhân:

xấu.

Điểm ranh không nằm ở việc có dùng dữ liệu hay không.

Nó nằm ở việc dữ liệu có làm con người hiểu nhau hơn hay ít hơn.

19. Lập trường của chương này

Chương này không chống learning analytics.

Một nền giáo dục không có dữ liệu dễ rơi vào cảm tính,

thiên kiến,

trì hoãn,

và những câu chuyện đẹp không được kiểm chứng.

Dữ liệu có thể giúp ta thấy:

người học bị bỏ quên,

khóa học bị thiết kế sai,

feedback không đến nơi,

nhóm yếu thế bị rơi nhiều hơn,

can thiệp nào có tác dụng,

nơi nào hệ thống đang thất bại.

Nhưng chương này cũng không tôn thờ learning analytics.

Dữ liệu học tập không phải học tập.

Risk score không phải số phận.

Click không phải hiểu biết.

Time-on-task không phải chăm chỉ.

Completion không phải chuyển hóa.

Engagement không phải wellbeing.

Dashboard không phải care.

Prediction không phải support.

Transparency không phải chỉ là privacy policy dài.

Consent không phải một checkbox.

Và “vì lợi ích người học” không phải giấy phép thu mọi thứ.

Lập trường của chương này là:

dữ liệu hóa học tập chỉ chính đáng khi nó tăng năng lực chăm sóc, tăng agency của người học, tăng trách nhiệm của tổ chức, và giảm bất công.

Nếu nó chỉ làm giáo dục nhìn thấy nhiều hơn mà không lắng nghe nhiều hơn, nó là giám sát.

Nếu nó chỉ làm trường dự đoán tốt hơn mà không hỗ trợ tốt hơn, nó là quản trị rủi ro.

Nếu nó chỉ làm sản phẩm thông minh hơn mà người học ít quyền hơn, nó là khai thác.

Nếu nó chỉ làm dashboard đẹp hơn mà lớp học ít nhân tính hơn, nó là sai hướng.

Dữ liệu tốt trong giáo dục phải biết tự giới hạn.

Nó phải bước vào lớp học như một người nhắc khiêm tốn:

“Có thể có điều gì đó đáng chú ý ở đây.”

Không phải như một thẩm phán:

“Tôi đã biết em là ai.”

Trong giáo dục, được nhìn thấy là một nhu cầu sâu sắc.

Bị giám sát là một tổn thương sâu sắc.

EdTech trưởng thành là EdTech biết phân biệt hai điều đó.

Và biết rằng đường ranh giữa chúng không nằm trong khẩu hiệu sản phẩm.

Nó nằm trong thiết kế,

quyền lực,

quy trình,

nguồn lực,

và cách một người lớn dùng dữ liệu để hỏi người học:

“Có chuyện gì đang xảy ra, và tôi có thể giúp gì?”

Ghi chú nguồn cho chương

[^jisc-code]: Jisc, Code of practice for learning analytics (published 2015, updated 2023). Tài liệu định nghĩa learning analytics là việc dùng dữ liệu về sinh viên và hoạt động của họ để hiểu, cải thiện quá trình giáo dục và hỗ trợ người học; đồng thời nêu các trách nhiệm về transparency/consent, privacy, validity, access, positive interventions, minimising adverse impacts và stewardship of data. Nguồn: https://www.jisc.ac.uk/guides/code-of-practice-for-learning-analytics

[^jones-privacy]: Kyle M. L. Jones, “Learning analytics and higher education: a proposed model for establishing informed consent mechanisms to promote student privacy and autonomy” (International Journal of Educational Technology in Higher Education, 2019). Bài viết bàn về việc learning analytics theo dõi, tổng hợp và phân tích hồ sơ cùng hành vi số/ngoài số của sinh viên, tạo promise để “mở hộp đen” giáo dục nhưng cũng đặt ra vấn đề privacy, autonomy, consent và data flows phức tạp. Nguồn: https://doi.org/10.1186/s41239-019-0155-0

[^baker-clickstream]: Rachel Baker, Di Xu, Jihyun Park, Renzhe Yu, Qiujie Li, Bianca Cung, Christian Fischer, Fernando Rodriguez, Mark Warschauer & Padhraic Smyth, “The benefits and caveats of using clickstream data to understand student self-regulatory behaviors” (International Journal of Educational Technology in Higher Education, 2020). Bài viết cho thấy clickstream có thể cung cấp tín hiệu quy mô lớn về hành vi học online nhưng chỉ là bản ghi một phần và nhiễu; số click không trực tiếp đo time-on-task và không biết người học làm gì giữa hai lần click. Nguồn: https://doi.org/10.1186/s41239-020-00187-1

[^oaai]: Sandeep M. Jayaprakash, Erik W. Moody, Eitel J. M. Lauría, James R. Regan & Joshua D. Baron, “Early Alert of Academically At-Risk Students: An Open Source Analytics Initiative” (Journal of Learning Analytics, 2014). Bài viết mô tả Open Academic Analytics Initiative, tập trung vào việc thu thập, tổ chức, khai thác dữ liệu để dự đoán academic risk, kiểm tra predictive performance, portability và kết quả can thiệp với nhóm at-risk. Nguồn: https://doi.org/10.18608/jla.2014.11.3

[^ifenthaler-yau]: Dirk Ifenthaler & Jane Yin-Kim Yau, “Utilising learning analytics to support study success in higher education: a systematic review” (Educational Technology Research and Development, 2020). Review từ 6.220 kết quả ban đầu còn 46 nghiên cứu chính; kết luận learning analytics có tiềm năng hỗ trợ study success và người học có nguy cơ dropout, nhưng bằng chứng nghiêm ngặt ở quy mô lớn còn thiếu, và nhiều nghiên cứu tập trung vào độ chính xác thuật toán hơn là ý nghĩa giáo dục của study success. Nguồn: https://doi.org/10.1007/s11423-020-09788-z

[^zakharova-risk]: Irina Zakharova & Juliane Jarke, “Do Predictive Analytics Dream of Risk-Free Education? The Politics of Risk Mitigation” (Postdigital Science and Education, 2024; online 2023). Bài viết phân tích predictive learning analytics như công nghệ hướng tương lai, định nghĩa điều gì là rủi ro, ai bị xem là người mang rủi ro và ai phải hành động; qua đó nhấn mạnh chính trị của việc dự đoán và quản trị rủi ro trong giáo dục dữ liệu hóa. Nguồn: https://doi.org/10.1007/s42438-023-00411-x

[^student-agency]: Anceli Kaveri, Anni Silvola & Hanni Muukkonen, “Supporting Student Agency with a Student-Facing Learning Analytics Dashboard” (Journal of Learning Analytics, 2023). Bài viết cho rằng dashboard học tập cho sinh viên cần nền tảng sư phạm, hiểu biết về người học và sự tham gia của sinh viên trong quá trình thiết kế, thay vì chỉ data-driven. Nguồn: https://doi.org/10.18608/jla.2023.7729

[^hrw-edtech]: Human Rights Watch, “Online Learning Products Enabled Surveillance of Children” (2022), dựa trên báo cáo How Dare They Peep into My Private Life?. HRW phân tích 163 sản phẩm EdTech được chính phủ khuyến nghị trong đại dịch và cho rằng 145 sản phẩm, tương đương 89 phần trăm, đã hoặc có khả năng giám sát trẻ em theo cách ảnh hưởng đến quyền riêng tư và quyền trẻ em; nhiều trường hợp trẻ em không thể từ chối theo dõi nếu muốn tiếp tục học. Nguồn: https://www.hrw.org/news/2022/07/12/online-learning-products-enabled-surveillance-children

[^aclu-surveillance]: American Civil Liberties Union, Digital Dystopia: The Danger in Buying What the EdTech Surveillance Industry is Selling (2023). Báo cáo phê phán ngành EdTech surveillance trong K-12, nêu rủi ro về marketing dựa trên sợ hãi, thiếu bằng chứng độc lập về hiệu quả, tác động lên quyền riêng tư, tự do biểu đạt, phân biệt đối xử và niềm tin giữa học sinh với nhà trường. Nguồn: https://www.aclu.org/publications/digital-dystopia-the-danger-in-buying-what-the-edtech-surveillance-industry-is-selling

[^cdt-monitoring]: Center for Democracy & Technology, Student Activity Monitoring Software: Research Insights and Recommendations (2021) và các báo cáo liên quan về student activity monitoring. CDT ghi nhận các công cụ theo dõi hoạt động học sinh được dùng rộng rãi để lọc nội dung, theo dõi tìm kiếm, lịch sử duyệt web, email/tin nhắn/mạng xã hội và màn hình thời gian thực; đồng thời nêu lo ngại về privacy, equity, chilling effect và việc dữ liệu bị dùng trong kỷ luật hoặc chia sẻ ngoài bối cảnh. Nguồn: https://cdt.org/insights/student-activity-monitoring-software-research-insights-and-recommendations/

[^unesco-tech]: UNESCO Global Education Monitoring Report Team, Technology in education: A tool on whose terms? (2023). UNESCO nhấn mạnh công nghệ trong giáo dục cần được quản trị và điều tiết phù hợp, phải phục vụ trải nghiệm học tập và wellbeing của người học/giáo viên, hỗ trợ giáo viên và không thay thế tương tác người-người. Nguồn: https://www.unesco.org/gem-report/en/publication/technology và thông cáo: https://www.unesco.org/gem-report/en/articles/unesco-issues-urgent-call-appropriate-use-technology-education

[^eu-ai-act]: European Commission / AI Act Service Desk, Annex III: High-risk AI systems. EU AI Act xếp một số hệ thống AI trong giáo dục và đào tạo nghề vào nhóm high-risk, gồm hệ thống dùng để quyết định access/admission, đánh giá learning outcomes, xác định mức giáo dục phù hợp hoặc giám sát/detect prohibited behaviour trong tests. Nguồn: https://ai-act-service-desk.ec.europa.eu/en/ai-act/annex-3