Chương 12: Đạo đức & Thiên kiến trong AI Giáo dục

Khi thuật toán quyết định tương lai học sinh — ai chịu trách nhiệm khi nó sai?

---

Bối cảnh

Tháng 8 năm 2020, hàng trăm nghìn học sinh Anh Quốc nhận kết quả A-level được chấm bởi thuật toán — thay vì bài thi thực tế bị huỷ vì COVID-19. Thuật toán của Ofqual dùng kết quả lịch sử của TRƯỜNG để điều chỉnh điểm giáo viên dự đoán cho từng HỌC SINH. Kết quả: học sinh giỏi ở trường nghèo bị hạ điểm vì trường họ "lịch sử yếu," trong khi học sinh trung bình ở trường giàu được nâng điểm vì trường họ "lịch sử mạnh."

Phản ứng dữ dội. Biểu tình nổ ra. Chính phủ Anh buộc phải huỷ kết quả thuật toán và quay lại dùng điểm giáo viên dự đoán. Nhưng thiệt hại đã xảy ra: nhiều học sinh mất chỗ đại học vì kết quả thuật toán ban đầu, và niềm tin vào AI trong giáo dục bị tổn thương nghiêm trọng.

Vụ Ofqual không phải ngoại lệ — nó là minh hoạ rõ nhất cho câu hỏi trung tâm của chương này: khi AI đưa ra quyết định ảnh hưởng đến cuộc đời học sinh, những câu hỏi đạo đức nào cần được đặt ra TRƯỚC KHI triển khai, không phải sau khi thảm hoạ xảy ra?

---

Nền tảng lý thuyết

Công bằng thuật toán — Không có định nghĩa duy nhất

Cuộc tranh luận COMPAS (ProPublica, 2016) — thuật toán dự đoán tái phạm trong tư pháp hình sự Mỹ — đã làm lộ một sự thật toán học khó chịu: KHÔNG THỂ đồng thời thoả mãn tất cả các định nghĩa "công bằng." ProPublica cho thấy bị cáo da đen bị gán nhãn "nguy cơ cao" sai nhiều hơn bị cáo da trắng. Northpointe (nhà phát triển) phản bác rằng thuật toán có "predictive parity" — tỷ lệ chính xác giống nhau cho cả hai nhóm.

Cả hai đều đúng — và đó chính là vấn đề. Kleinberg, Mullainathan & Raghavan (2016) chứng minh toán học rằng khi tỷ lệ cơ bản (base rate) khác nhau giữa các nhóm, không thể đồng thời đạt cả equalized false positive rates VÀ predictive parity. Phải CHỌN — và lựa chọn đó là lựa chọn ĐẠO ĐỨC, không phải kỹ thuật.

Trong giáo dục, vấn đề tương tự: thuật toán dự đoán "at-risk" dựa trên dữ liệu lịch sử. Nếu lịch sử cho thấy sinh viên thu nhập thấp bỏ học nhiều hơn, thuật toán sẽ gán nhãn at-risk cho sinh viên thu nhập thấp nhiều hơn. Đây là "chính xác" về mặt thống kê — nhưng có thể gây hại nếu nhãn at-risk dẫn đến giảm kỳ vọng, ít cơ hội, hoặc self-fulfilling prophecy (Chương 6).

Ba khung đạo đức cho AI giáo dục

UNESCO AI Ethics Recommendation (2021): Khung đạo đức toàn diện nhất, nhấn mạnh: (1) Human oversight — con người phải kiểm soát quyết định AI, (2) Transparency — hệ thống phải giải thích được, (3) Fairness — không phân biệt đối xử, (4) Privacy — bảo vệ dữ liệu.

Holmes (AIED, 2019): Đề xuất "ethical AI by design" — tích hợp đạo đức VÀO thiết kế, không phải thêm VÀO sau. AI giáo dục phải trả lời: "Ai được lợi? Ai bị hại? Ai quyết định? Ai chịu trách nhiệm?"

Selwyn (2019): Cảnh báo rằng "ethics washing" — dùng ngôn ngữ đạo đức để che đậy thực hành khai thác — là rủi ro thực sự. Nhiều EdTech company có "AI Ethics Board" nhưng không có quyền veto quyết định kinh doanh.

---

12.1. Thiên kiến trong dữ liệu — Garbage In, Bias Out

AI học từ dữ liệu. Nếu dữ liệu phản ánh bất bình đẳng lịch sử, AI sẽ tái tạo và khuếch đại bất bình đẳng đó.

Trong giáo dục, thiên kiến xuất hiện ở nhiều tầng:

Tầng 1: Training data. LLMs được train chủ yếu trên dữ liệu tiếng Anh, phương Tây. Khi dùng cho sinh viên Việt Nam, ĐNA, hoặc Global South — nội dung mang bias văn hoá phương Tây mà không ai nhận ra vì nó "có vẻ đúng."

Tầng 2: Historical patterns. Thuật toán admissions dùng dữ liệu lịch sử để dự đoán "ai sẽ thành công." Nếu lịch sử cho thấy sinh viên trường giàu thành công hơn (vì được hỗ trợ tốt hơn, không phải vì giỏi hơn), thuật toán sẽ ưu tiên sinh viên trường giàu — tái tạo bất bình đẳng dưới vỏ bọc "khách quan."

Tầng 3: Proxy variables. Mã bưu chính (zip code) không phải biến chủng tộc — nhưng tương quan mạnh với chủng tộc do lịch sử phân biệt nhà ở. Thuật toán dùng zip code → gián tiếp phân biệt chủng tộc mà không bao giờ nhắc đến chủng tộc. Đây là "proxy discrimination" — hợp pháp về kỹ thuật, bất công về thực tế.

Case study: Ofqual 2020. Thuật toán dùng kết quả lịch sử của TRƯỜNG để điều chỉnh điểm cá nhân. Trường nhỏ, nghèo có ít data → thuật toán dựa nhiều vào baseline thấp → học sinh giỏi bị kéo xuống. Trường lớn, giàu có nhiều data → thuật toán tin tưởng baseline cao → học sinh trung bình được đẩy lên. Kết quả: bất bình đẳng xã hội được MÃ HOÁ vào thuật toán.

Case study: Amazon Hiring AI. Amazon phát triển AI tuyển dụng, train trên lịch sử 10 năm — thời kỳ ngành tech chủ yếu nam giới. AI học rằng "women's" (trong "women's chess club") tương quan với rejection → penalize CV có từ liên quan đến phụ nữ. Amazon huỷ dự án, nhưng bài học phổ quát: AI tái tạo bias trong data, không tạo bias mới — nhưng khuếch đại nó ở quy mô máy móc.

---

12.2. Quyền riêng tư học sinh — Ai sở hữu dữ liệu?

EdTech thu thập lượng dữ liệu chưa từng có: mỗi click, mỗi keystroke, thời gian trên trang, pattern sai, biểu cảm khuôn mặt (nếu có camera). Dữ liệu này phục vụ learning analytics (Chương 6) — nhưng cũng tạo ra hồ sơ chi tiết về mỗi học sinh mà không ai yêu cầu.

Khung pháp lý hiện tại:

FERPA (Mỹ): Bảo vệ hồ sơ giáo dục. Nhưng có "school official exception" — trường có thể chia sẻ dữ liệu với vendor EdTech mà không cần phụ huynh đồng ý, nếu vendor cam kết bảo mật. Trong thực tế, cam kết bảo mật thường nằm trong Terms of Service dài hàng chục trang mà không ai đọc.

COPPA (Mỹ): Bảo vệ trẻ dưới 13 — yêu cầu consent phụ huynh. Nhưng EdTech company dùng "school consent" exception — trường đồng ý thay phụ huynh. Nhiều phụ huynh không biết data nào con mình tạo ra, ai giữ, và dùng để làm gì.

GDPR (EU): Nghiêm ngặt nhất — yêu cầu transparency, data minimization, right to be forgotten. Nhiều trường EU bắt buộc dùng Moodle self-hosted vì GDPR (Chương 7). Mô hình GDPR đặt quyền kiểm soát VỀ PHÍA NGƯỜI DÙNG — ngược lại với mô hình Mỹ nơi quyền kiểm soát ở phía nhà trường và vendor.

Tại Việt Nam và ĐNA: Luật bảo vệ dữ liệu cá nhân đang phát triển (Việt Nam: Nghị định 13/2023/NĐ-CP) nhưng enforcement yếu, và awareness trong giáo dục gần như chưa có. Trường học dùng Google Classroom, Zoom, LMS thương mại mà ít kiểm tra data flows.

Vấn đề cốt lõi: Học sinh (đặc biệt K-12) KHÔNG THỂ consent có ý nghĩa. Trẻ 8 tuổi không hiểu "data privacy." Phụ huynh thường không có lựa chọn thực sự — trường yêu cầu dùng platform X, không có phương án thay thế. "Consent" trong bối cảnh này là hình thức, không phải thực chất.

---

12.3. Transparency & Explainability — Hộp đen trong lớp học

Phần lớn AI trong giáo dục là "hộp đen" (black box): đưa input (bài làm, hành vi) → nhận output (điểm, nhãn, gợi ý) mà không biết LOGIC GIỮA. Đây là vấn đề khi output ảnh hưởng đến cuộc đời:

AES chấm điểm essay → ảnh hưởng GPA → ảnh hưởng admission
Predictive analytics gán nhãn "at-risk" → ảnh hưởng cách GV nhìn nhận → self-fulfilling prophecy
AI recommendation → học sinh được/không được tiếp cận nội dung nâng cao

Khi GV chấm điểm, học sinh có thể hỏi "tại sao em bị trừ điểm?" và nhận giải thích bằng ngôn ngữ người. Khi AI chấm điểm, không có "tại sao" — chỉ có con số. Right to explanation (quyền được giải thích) — đã có trong GDPR Article 22 — gần như chưa được áp dụng cho AI giáo dục.

Holmes (AIED, 2019) đề xuất "glass box AI" thay vì black box: hệ thống phải giải thích được lý do cho mọi quyết định ảnh hưởng đến học sinh. Không nhất thiết phải giải thích thuật toán chi tiết — nhưng phải giải thích bằng ngôn ngữ mà GV và phụ huynh hiểu được.

---

12.4. Surveillance vs. Safety — Ranh giới mỏng

AI monitoring trong trường học — theo dõi keystroke, browsing, email, thậm chí biểu cảm khuôn mặt — thường được biện minh bằng "student safety" (phát hiện bắt nạt, tự hại, bạo lực). Nhưng ranh giới giữa safety và surveillance rất mong manh.

Nghiên cứu ACLU và advocacy groups chỉ ra "chilling effect": khi học sinh biết mình bị theo dõi, họ tự kiểm duyệt — không tìm kiếm thông tin nhạy cảm (sức khoẻ tâm thần, giới tính, chính trị), không viết thật trong journal — vì sợ bị flag. Chính hệ thống được thiết kế để "bảo vệ" lại khiến học sinh cần bảo vệ nhất KHÔNG DÁM tìm kiếm sự giúp đỡ.

Trung Quốc triển khai camera nhận diện biểu cảm trong lớp học (2018) — theo dõi "mức độ tập trung" của học sinh. Phản ứng quốc tế cực kỳ tiêu cực, nhưng công nghệ tương tự (dưới dạng "engagement analytics") đang được bán ở phương Tây với ngôn ngữ marketing khác.

---

Phân tích phản biện

"AI khách quan hơn con người." Sai — AI kế thừa bias từ data, và bias thuật toán NGUY HIỂM hơn bias con người vì nó hoạt động ở QUY MÔ (hàng triệu quyết định) và có VẺ NGOÀI khách quan (con số, thuật toán). Một GV có bias ảnh hưởng 30 học sinh. Một thuật toán có bias ảnh hưởng 30 triệu.

"Nếu không dùng AI, con người cũng có bias." Đúng — nhưng hai sai không thành một đúng. Giải pháp không phải chọn giữa bias người và bias máy — mà thiết kế hệ thống PHÁT HIỆN và GIẢM THIỂU bias ở cả hai.

"Data privacy vs. student safety — phải chọn một." False dichotomy. Có thể vừa bảo vệ privacy vừa đảm bảo safety — thông qua data minimization (thu thập ít nhất cần thiết), transparency, và human oversight. Không cần theo dõi MỌI keystroke để phát hiện rủi ro.

---

Nguyên tắc thiết kế

1. Bias audit trước deployment. Kiểm tra thuật toán trên các subgroup (chủng tộc, giới tính, SES, ngôn ngữ) TRƯỚC khi triển khai. Không có audit = không triển khai.

2. Glass box, not black box. Mọi quyết định AI ảnh hưởng đến học sinh phải giải thích được bằng ngôn ngữ GV/phụ huynh hiểu. Right to explanation = quyền cơ bản.

3. Data minimization. Thu thập CHỈ dữ liệu cần thiết cho mục đích giáo dục. Không thu thập "phòng khi cần." Mỗi data point thêm = một rủi ro thêm.

4. Human override luôn có sẵn. Con người phải có quyền override quyết định AI trong mọi trường hợp — đặc biệt high-stakes (grading, admissions, disciplinary).

5. Student agency. Học sinh (hoặc phụ huynh cho K-12) phải biết data nào được thu thập, ai nhìn, và có quyền yêu cầu xoá. Consent phải THỰC CHẤT, không hình thức.

---

Tổng kết chương

1. Ofqual 2020 là case study kinh điển: thuật toán mã hoá bất bình đẳng xã hội, ảnh hưởng hàng trăm nghìn học sinh, và bị huỷ sau biểu tình. Bài học: test trước, không test trên học sinh thật.

2. Công bằng thuật toán không có định nghĩa duy nhất — phải CHỌN loại công bằng nào, và lựa chọn đó là đạo đức, không phải kỹ thuật (Kleinberg et al., 2016).

3. Thiên kiến dữ liệu hoạt động ở 3 tầng: training data (bias văn hoá), historical patterns (bias cấu trúc), proxy variables (bias gián tiếp). Amazon Hiring AI là ví dụ kinh điển.

4. Privacy pháp lý có nhưng enforcement yếu: FERPA/COPPA có exceptions rộng, GDPR mạnh nhất nhưng chỉ ở EU. ĐNA/Việt Nam gần như chưa có enforcement trong giáo dục.

5. Surveillance ≠ Safety. Chilling effect: học sinh cần giúp đỡ nhất lại KHÔNG DÁM tìm kiếm khi biết mình bị theo dõi.

6. Bias thuật toán nguy hiểm hơn bias con người — vì quy mô lớn hơn và vẻ ngoài khách quan hơn.

Chương tiếp — Chương 13 — sẽ phân tích khoảng cách số và công bằng tiếp cận: AI mang lại cơ hội hay mở rộng hố giàu-nghèo?

---

Tài liệu tham khảo

Ofqual. (2020). A-level grading algorithm and subsequent reversal. UK Government.
Angwin, J. et al. (2016). "Machine Bias." ProPublica. [COMPAS investigation]
Kleinberg, J., Mullainathan, S., & Raghavan, M. (2016). "Inherent Trade-Offs in the Fair Determination of Risk Scores." ITCS.
Dastin, J. (2018). "Amazon scraps secret AI recruiting tool that showed bias against women." Reuters.
Holmes, W., Bialik, M., & Fadel, C. (2019). AI in Education. CCR. [Ethical AI by design, Glass box]
UNESCO. (2021). Recommendation on the Ethics of Artificial Intelligence.
Selwyn, N. (2019). Should Robots Replace Teachers? Polity Press. [Ethics washing]
FERPA. Family Educational Rights and Privacy Act. U.S. Department of Education.
COPPA. Children's Online Privacy Protection Act. U.S. FTC.
GDPR. General Data Protection Regulation, Article 22. European Union.
Nghị định 13/2023/NĐ-CP. Bảo vệ dữ liệu cá nhân. Chính phủ Việt Nam.
ACLU. Student surveillance and chilling effects research.