Chương 16: Research Gaps — Bản đồ những gì chưa biết

Tổng hợp từ 50+ systematic reviews: những lỗ hổng nghiên cứu mà EdTech tương lai phải lấp.

---

Bối cảnh

Cuốn sách này tổng hợp hàng trăm nghiên cứu — nhưng điều quan trọng không kém là nhận ra NHỮNG GÌ CHƯA CÓ nghiên cứu. Một lĩnh vực có thể trông "mature" vì có nhiều paper, nhưng thực ra đầy lỗ hổng nếu phần lớn paper nghiên cứu cùng một thứ (STEM, Higher Ed, ngắn hạn) và bỏ qua những thứ khác (K-12, non-STEM, dài hạn, đạo đức).

Zawacki-Richter et al. (2019) — systematic review kinh điển nhất về AI trong giáo dục — phát hiện rằng chỉ ~6% nghiên cứu có tác giả từ ngành giáo dục. 94% còn lại đến từ computer science và STEM. Nghĩa là: phần lớn AI giáo dục được xây bởi người hiểu CÔNG NGHỆ nhưng không hiểu SƯ PHẠM. Crompton & Jones (2022) xác nhận gap tương tự cho K-12.

Chương này tổng hợp 8 research gaps lớn nhất — mỗi gap là lời kêu gọi nghiên cứu, đầu tư, và hành động.

---

16.1. Research Gaps Matrix

Trước khi đi vào từng gap, nhìn tổng thể:

Gap	Mô tả	Mức nghiêm trọng	Chương liên quan
Longitudinal	Gần như không có RCT > 1 năm	Rất cao	Ch.5, 9
K-12	Phần lớn nghiên cứu ở Higher Ed	Cao	Ch.5, 6, 14
Non-STEM	90% nghiên cứu về Math/Science	Cao	Ch.3, 4
Affective	Bỏ qua cảm xúc, motivation, wellbeing	Cao	Ch.6, 10
Teacher PD	Thiếu mô hình đào tạo quy mô	Rất cao	Ch.11, 14
Ethics framework	Thiếu khung đạo đức hệ thống cho K-12	Cao	Ch.12, 14
Global South	Anglo-centric, thiếu context đa dạng	Rất cao	Ch.13
Transfer	Đo recall/completion, bỏ qua transfer	Cao	Ch.8, 9, 10

---

16.2. Gap 1: Thiếu nghiên cứu dài hạn (Longitudinal)

Đây có lẽ là gap nghiêm trọng nhất. Phần lớn RCT về AI giáo dục kéo dài dưới 1 học kỳ — thường 4-12 tuần. Trong khoảng thời gian ngắn đó, novelty effect (Chương 10) chưa biến mất, và learning gains có thể phản ánh hào hứng ban đầu hơn là hiệu quả thực sự.

Những câu hỏi chưa có câu trả lời:

AI tutoring hiệu quả sau 1 năm? 3 năm? Hay chỉ tạo "spike" rồi plateau?
Cognitive offloading (Chương 10) tích luỹ theo thời gian không? Sinh viên dùng AI 4 năm đại học có metacognition yếu hơn không?
Spaced repetition AI (Chương 9) duy trì retention sau 1 năm không dùng app không?
Learning gains transfer sang môn khác, kỹ năng khác, bối cảnh thực tế không?

Tại sao gap tồn tại: Nghiên cứu dài hạn ĐẮT (theo dõi nhiều năm), KHÓ (attrition cao — người bỏ ngang), và KHÔNG SEXY cho publication (journal thích kết quả nhanh). VC-funded EdTech cũng không muốn RCT dài hạn — vì nếu kết quả tiêu cực, sản phẩm đã bán cho hàng triệu người.

---

16.3. Gap 2: K-12 bị bỏ quên

Zawacki-Richter (2019) phát hiện phần lớn nghiên cứu AI giáo dục ở Higher Education. K-12 — nơi AI ảnh hưởng đến TRẺ EM, đối tượng dễ bị tổn thương nhất — lại có ít nghiên cứu nhất.

Vấn đề: kết quả từ sinh viên đại học 20 tuổi KHÔNG tự động áp dụng cho học sinh 10 tuổi. Khác biệt:

Nhận thức: Trẻ em có working memory nhỏ hơn → CLT constraints nghiêm ngặt hơn (Chương 8)
Metacognition: Trẻ em metacognition yếu hơn → dễ bị cognitive offloading hơn (Chương 10)
Consent: Trẻ em không thể consent có ý nghĩa cho data collection (Chương 12)
Social development: K-12 là giai đoạn phát triển kỹ năng xã hội — AI thay thế tương tác người-người có thể gây hại mà Higher Ed không gặp (Chương 11)
Digital literacy: Trẻ em thiếu kỹ năng đánh giá output AI → dễ tin hallucination hơn

EU AI Act đúng khi xếp AI giáo dục là high-risk — nhưng nghiên cứu chưa đủ để biết HIGH-RISK ở mức nào.

---

16.4. Gap 3: Non-STEM bị bỏ rơi

Ước tính ~90% nghiên cứu AI giáo dục tập trung vào Math và Science. Lý do: Math/Science có đáp án đúng/sai rõ ràng → dễ đo → dễ publish. AES cho essay (Chương 4) tồn tại nhưng chất lượng kém hơn nhiều so với chấm MCQ toán.

Những lĩnh vực gần như KHÔNG có nghiên cứu AI:

Văn học: AI phân tích thơ, tiểu thuyết? AI dạy cảm thụ văn chương? Không.
Lịch sử: AI dạy tư duy sử học (source analysis, multiple perspectives)? Rất ít.
Nghệ thuật: AI tạo nội dung nghệ thuật — nhưng AI ĐÁNH GIÁ sáng tạo? Gần như không.
Đạo đức/Triết học: AI dạy tư duy đạo đức? Ironic — lĩnh vực cần nhất lại thiếu nhất.
Giáo dục thể chất, âm nhạc, kịch: Hoàn toàn ngoài radar nghiên cứu.

Hệ quả: EdTech bị kéo về STEM → giáo dục bị kéo về STEM → humanities bị giảm giá trị → mất cân bằng. Trong khi kỹ năng humanities (tư duy phản biện, empathy, communication, ethics) là chính xác những kỹ năng AI KHÔNG THỂ thay thế.

---

16.5. Gap 4: Affective Domain bị bỏ qua

Bloom's Taxonomy có 3 domain: Cognitive (nhận thức), Affective (cảm xúc/thái độ), Psychomotor (vận động). EdTech gần như CHỈ nghiên cứu Cognitive — test scores, recall, problem-solving.

Affective outcomes gần như không được đo:

AI tutoring có tăng yêu thích môn học không? Hay chỉ tăng điểm?
AI feedback có ảnh hưởng self-efficacy (niềm tin vào khả năng bản thân) không?
Học với AI nhiều có tăng anxiety không? (Nghiên cứu gợi ý có, nhưng data ít)
AI thay thế tương tác GV có giảm sense of belonging không?
Gamification tăng extrinsic motivation nhưng giảm intrinsic motivation không? (Chương 10 gợi ý có)

Wellbeing — chủ đề nóng trong giáo dục sau COVID — gần như chưa được nghiên cứu trong bối cảnh AI. Mỗi giờ trẻ dùng AI = 1 giờ không tương tác với người. Tác động lên phát triển xã hội-cảm xúc chưa ai đo.

---

16.6. Gap 5: Teacher Professional Development

Chương 11 và 14 đã phân tích: PD là bottleneck lớn nhất của AI giáo dục. Nhưng mô hình PD hiệu quả cho AI gần như chưa tồn tại.

Câu hỏi mở:

PD bao lâu là đủ? Workshop 1 ngày? 1 tuần? 1 học kỳ embedded?
PD cần nội dung gì? Technical (cách dùng tool) hay Pedagogical (khi nào dùng, khi nào không)?
Ai dạy PD? GV peer? IT specialist? External trainer? Kết hợp?
PD có khác nhau theo cấp học (K-5 vs K-12 vs Higher Ed)?
UNESCO AI Competency Framework (2024) đã được test thực tế chưa?

Singapore có mô hình PD mạnh nhất (i-TPACK, Chương 14) — nhưng đó là nước nhỏ, giàu, và hệ thống tập trung. Liệu mô hình đó chuyển được sang VN, Indonesia, hay Nigeria? Chưa ai biết.

---

16.7. Gap 6: Ethics Framework cho K-12

UNESCO (2021) và EU AI Act (2024) đưa ra khung đạo đức — nhưng ở mức quốc tế/khu vực, chưa operationalise cho từng trường. Những câu hỏi chưa có đồng thuận:

Tuổi tối thiểu dùng AI độc lập? UNESCO đề xuất 13, nhưng bằng chứng cho con số này yếu.
Data retention: Dữ liệu học sinh giữ bao lâu? Đến khi nào? Ai quyết định xoá?
Algorithmic transparency: Trường có quyền audit thuật toán của vendor không? Phần lớn contract nói "không."
Liability: Khi AI chấm sai → ai chịu trách nhiệm? GV? Trường? Vendor? Chưa có case law.
Opt-out: HS/phụ huynh có quyền từ chối dùng AI mà không bị bất lợi? Phần lớn trường chưa có option này.

---

16.8. Gap 7: Global South & Đa dạng văn hoá

Chương 13 đã phân tích: nghiên cứu EdTech chủ yếu Anglo-centric. Mở rộng:

Sample bias: Phần lớn RCT với sinh viên đại học Mỹ/UK. Kết quả có generalise sang VN, Ấn Độ, Nigeria không? Khả năng cao là KHÔNG hoàn toàn — vì khác văn hoá học tập, khác mối quan hệ thầy-trò, khác hệ thống giáo dục.
Language bias: LLMs yếu ở non-English → AI giáo dục yếu ở non-English countries → nghiên cứu cũng ít vì tool không hoạt động tốt.
Pedagogical bias: Constructivism và student-centered learning phổ biến ở phương Tây. Nhiều hệ thống giáo dục châu Á truyền thống hơn (teacher-centered). AI được thiết kế cho pedagogy phương Tây có conflict với pedagogy địa phương?
Infrastructure bias: RCT giả định internet ổn định, device cá nhân. Kết quả không áp dụng cho shared-device, low-bandwidth settings.

---

16.9. Gap 8: Transfer — Metric cuối cùng bị bỏ qua

Chương 8 (Mayer), Chương 9 (Make It Stick), Chương 10 (Metacognition) đều nhấn mạnh: mục tiêu cuối cùng của học tập là transfer — khả năng áp dụng kiến thức vào bối cảnh MỚI, KHÁC với bối cảnh đã học.

Nhưng phần lớn EdTech đo: task completion, quiz scores, time-on-task, engagement. Không metric nào trong số này đo transfer. Sinh viên có thể hoàn thành 100% bài tập trên AI platform mà không transfer được gì (Chương 5: Harvard CS50 — 100% completion, 0% transfer khi không có AI).

Transfer research trong bối cảnh AI gần như không tồn tại. Câu hỏi mở:

Kiến thức học VỚI AI có transfer khi KHÔNG CÓ AI?
Kỹ năng problem-solving phát triển qua AI tutoring có transfer sang domain khác?
Transfer xa (far transfer) — áp dụng sang lĩnh vực hoàn toàn khác — có xảy ra với AI-assisted learning?

Nếu câu trả lời là "không" — thì phần lớn learning gains mà EdTech báo cáo có thể là ảo: chỉ hoạt động TRONG hệ thống, không hoạt động BÊN NGOÀI.

---

Phân tích phản biện

"Nghiên cứu sẽ tự theo kịp công nghệ." Không — vì incentive ngược. Nghiên cứu mất 2-5 năm, AI thay đổi mỗi 6 tháng. Khi RCT về GPT-3.5 kết thúc, GPT-5 đã ra. Gap sẽ TĂNG, không giảm, trừ khi có cơ chế funding riêng cho nghiên cứu giáo dục dài hạn.

"Không cần nghiên cứu hoàn hảo để hành động." Đúng — chờ bằng chứng hoàn hảo là chờ mãi. Nhưng hành động MÀ KHÔNG BIẾT gap ở đâu = hành động mù. Chương này không nói "đừng dùng AI" — mà nói "BIẾT mình không biết gì."

"Industry research đủ rồi." Không — vì conflict of interest. EdTech company nghiên cứu sản phẩm của mình → publication bias cực đoan. Cần nghiên cứu ĐỘC LẬP, do university và tổ chức phi lợi nhuận thực hiện, với funding công.

---

Lời kêu gọi hành động

Cho nhà nghiên cứu:

Ưu tiên RCT dài hạn (≥1 năm) với follow-up
Nghiên cứu K-12, non-STEM, Global South
Đo affective outcomes và transfer, không chỉ test scores
Collaborate với giáo viên — không chỉ computer scientists

Cho nhà tài trợ:

Funding riêng cho nghiên cứu giáo dục AI dài hạn
Yêu cầu diverse samples (không chỉ WEIRD — Western, Educated, Industrialized, Rich, Democratic)
Funding cho negative result publication — biết "cái gì không hoạt động" quan trọng bằng "cái gì hoạt động"

Cho EdTech company:

Cho phép independent audit sản phẩm
Chia sẻ data (anonymised) cho nghiên cứu độc lập
Ngừng claim "evidence-based" khi evidence chỉ là 1 pilot 6 tuần

Cho chính phủ:

Yêu cầu evidence trước khi approve tool cho trường công
Thành lập EdTech evaluation body độc lập (mô hình FDA cho thuốc — EdTech cần tương đương)
Đầu tư nghiên cứu giáo dục ngang với đầu tư công nghệ giáo dục

---

Tổng kết chương

1. 8 research gaps lớn nhất: Longitudinal, K-12, Non-STEM, Affective, Teacher PD, Ethics K-12, Global South, Transfer — mỗi gap là lỗ hổng ảnh hưởng đến hàng triệu học sinh.

2. 94% nghiên cứu AI giáo dục bởi computer scientists, 6% bởi giáo dục (Zawacki-Richter, 2019). Công nghệ dẫn dắt, sư phạm theo sau — ngược lại với những gì cần.

3. Transfer — metric quan trọng nhất — gần như không được đo. EdTech báo cáo task completion và quiz scores — nhưng không ai biết liệu kiến thức có transfer ra ngoài platform không.

4. Nghiên cứu dài hạn gần như không tồn tại. Novelty effect biến mất sau vài tháng — nhưng phần lớn RCT kết thúc trước khi nó biến mất.

5. Industry research ≠ Independent research. Conflict of interest đòi hỏi cần cơ chế evaluation ĐỘC LẬP — mô hình "FDA cho EdTech."

6. "Biết mình không biết gì" là bước đầu tiên. Chương này không nói "đừng dùng AI" — mà nói: dùng, nhưng BIẾT rằng bằng chứng còn yếu ở nhiều nơi, và hành động với sự thận trọng tương ứng.

Chương cuối — Chương 17 — sẽ rút gọn toàn bộ cuốn sách thành bộ nguyên tắc hành động: Manifesto cho EdTech có trách nhiệm.

---

Tài liệu tham khảo

Zawacki-Richter, O., Marín, V.I., Bond, M., & Gouverneur, F. (2019). "Systematic review of research on artificial intelligence applications in higher education — where are the educators?" International Journal of Educational Technology in Higher Education, 16(39). [94% CS, 6% education]
Crompton, H., Jones, D., & Burke, D. (2022). "Affordances and challenges of artificial intelligence in K-12 education: A systematic review." Journal of Research on Technology in Education.
Bahroun, Z. et al. (2023). "Transforming education: A comprehensive review of generative AI in educational settings." Sustainability, 15(16).
Samala, A.D. et al. (2024). "AI in education: A systematic literature review." Education and Information Technologies.
Wang, T. et al. (2024). Systematic review of AI-assisted assessment in education.
UNESCO. (2021). Recommendation on the Ethics of Artificial Intelligence.
UNESCO. (2024). AI Competency Framework for Teachers.
European Union. (2024). EU AI Act.
Bloom, B.S. (1984). "The 2 Sigma Problem." Educational Researcher, 13(6), 4-16.
Henrich, J., Heine, S.J., & Norenzayan, A. (2010). "The Weirdest People in the World?" Behavioral and Brain Sciences, 33, 61-83. [WEIRD bias]