Chương 24: Những câu hỏi nghiên cứu còn mở

Bối cảnh / Vấn đề

Một cuốn sách về EdTech và AI không nên kết thúc bằng cảm giác mọi thứ đã rõ. Nếu hai mươi ba chương trước làm được việc gì, thì việc đó không phải là đóng lại tranh luận, mà là làm tranh luận bớt mơ hồ. Ta đã có đủ bằng chứng để không còn tin vào lời hứa chung chung: công nghệ không tự cải thiện học tập; AI không tự tạo cá nhân hóa tốt; dữ liệu không tự thành hiểu biết; dashboard không tự thành can thiệp; feedback không tự thành hành động; giáo viên không tự được “giải phóng” nếu tổ chức không giảm tải thật; privacy không tự được bảo vệ bằng một văn bản chính sách.

Nhưng ta cũng chưa biết đủ để đưa ra công thức cuối cùng. Làn sóng GenAI còn quá mới. Nhiều nghiên cứu vẫn ngắn hạn, mẫu nhỏ, tập trung vào higher education, tiếng Anh, STEM hoặc các nhiệm vụ dễ đo. Nhiều kết quả tích cực đo điểm ngay sau can thiệp, engagement, satisfaction hoặc sản phẩm cuối, trong khi các câu hỏi khó hơn như metacognition, transfer, agency, identity, wellbeing, deskilling, bias dài hạn, teacher workload và sustainability vẫn còn thiếu bằng chứng. Một sản phẩm có thể tăng điểm quiz trong bốn tuần, nhưng ta chưa biết nó làm người học nghĩ về việc học của mình thế nào sau một năm. Một chatbot có thể giúp viết bài tốt hơn, nhưng ta chưa biết nó làm giọng viết, quyền tác giả và khả năng chịu khó đọc nguồn thay đổi ra sao. Một dashboard có thể phát hiện rủi ro, nhưng ta chưa biết nó làm người học bị gắn nhãn thế nào qua thời gian.

Chương 23 đã tổng hợp bộ nguyên tắc thiết kế EdTech thực chứng. Chương này đặt phần còn lại của bản đồ: những câu hỏi nghiên cứu cần được ưu tiên nếu lĩnh vực này muốn trưởng thành. “Câu hỏi nghiên cứu” ở đây không chỉ dành cho đại học. Nó dành cho nhà phát triển sản phẩm, trường học, trung tâm đào tạo, tổ chức kiểm định, nhà quản lý, funder, procurement team và teacher community. Mỗi quyết định triển khai nghiêm túc đều là một giả thuyết về học tập. Nếu không đặt câu hỏi rõ, tổ chức vẫn đang nghiên cứu, chỉ là nghiên cứu ngầm, không đo, không học và thường để người học chịu rủi ro.

Các câu hỏi mở trong chương này không phải danh sách “cái gì chưa biết” theo kiểu liệt kê. Chúng là bảy vùng then chốt:

1. AI có giúp metacognition hay làm người học lười siêu nhận thức hơn? 2. Cá nhân hóa dài hạn ảnh hưởng thế nào đến agency, identity và transfer? 3. Làm sao đo năng lực phức hợp mà không biến giáo dục thành giám sát toàn diện? 4. Human-AI teaming tối ưu khác nhau thế nào theo môn học, lứa tuổi và bối cảnh văn hóa? 5. Làm sao đưa asset-based personalization vào hệ thống thật thay vì chỉ sửa lỗi theo deficit model? 6. Những ngành ngoài STEM, ngoài tiếng Anh và ngoài đại học cần taxonomy riêng nào? 7. EdTech có thể bền vững về kinh tế mà vẫn bảo vệ dữ liệu, công bằng và phẩm giá người học không?

Bảy câu hỏi này nối trực tiếp với các nguyên tắc của chương 23. Nếu bắt đầu từ nhiệm vụ học tập, ta phải biết nhiệm vụ nào thật sự phát triển metacognition và transfer. Nếu giữ ma sát nhận thức đúng chỗ, ta phải biết AI làm mất hay tăng self-monitoring. Nếu feedback phải dẫn đến hành động, ta phải đo feedback uptake chứ không chỉ đo số nhận xét. Nếu cá nhân hóa có giới hạn đạo đức, ta phải nghiên cứu hậu quả dài hạn của lộ trình thuật toán. Nếu teacher-in-the-loop là thật, ta phải biết mô hình human-AI teaming nào tốt cho từng môn, từng tuổi. Nếu đo điều kiện hiệu quả, ta phải mở rộng nghiên cứu ra ngoài nhóm người học dễ đo. Nếu không tô hồng, không bi quan dễ dãi, ta phải nói rõ cái gì biết, cái gì chưa biết, và cần thiết kế nghiên cứu nào.

Một dấu hiệu trưởng thành của một lĩnh vực không phải là có ít câu hỏi hơn. Nó là có câu hỏi tốt hơn. Những câu hỏi trong chương này có thể gây khó chịu vì chúng không cho phép câu trả lời nhanh. Nhưng chính vì vậy chúng đáng theo đuổi.

Nền tảng lý thuyết

Có bốn lý do khiến nghiên cứu EdTech và AI cần bước sang giai đoạn sâu hơn.

Thứ nhất, hiệu quả trung bình không đủ. Các meta-analysis gần đây về GenAI và ChatGPT trong giáo dục thường cho thấy tác động tích cực ở một số outcome như achievement, language skills, motivation hoặc higher-order thinking. Nhưng các tác động này biến thiên theo cấp học, môn học, thiết kế hoạt động, vai trò AI, thời lượng và bối cảnh. Một meta-analysis năm 2025 về GenAI với sinh viên đại học tổng hợp 57 nghiên cứu và 97 ước lượng, báo effect size lớn với một số outcome, nhưng không tìm thấy hiệu ứng có ý nghĩa thống kê với metacognition (Educational Research Review, 2025). Một meta-analysis khác về ChatGPT năm 2026 trên 35 nghiên cứu thực nghiệm cũng nhấn mạnh cần xem các moderator và thiết kế học tập cụ thể (Wu et al., 2026). Điều này củng cố luận điểm của cuốn sách: “AI có hiệu quả không?” là câu hỏi quá ngắn.

Thứ hai, nhiều nghiên cứu vẫn đo gần. Điểm ngay sau can thiệp, bài quiz gần với nội dung luyện tập, self-report về hài lòng hoặc perceived usefulness là những thước đo dễ thu. Nhưng giáo dục quan tâm đến retention, transfer, metacognition, agency, identity, equity và wellbeing. Những thứ này cần thiết kế nghiên cứu dài hơn, công cụ đo tốt hơn, dữ liệu hỗn hợp và nhiều bối cảnh hơn. Lintner systematic review năm 2024 về AI literacy scales cho thấy 16 thang đo được xác thực trong 22 nghiên cứu, nhưng gần như không có thang nào kiểm tra cross-cultural validity, measurement error, interpretability đầy đủ; phần lớn là self-report thay vì performance-based (Lintner, 2024). Nếu ngay cả AI literacy còn đo chưa ổn, ta phải cẩn trọng với các tuyên bố rộng hơn về năng lực.

Thứ ba, AI làm mờ ranh giới giữa công cụ, môi trường và tác nhân. Một textbook số, một LMS và một video bài giảng chủ yếu là môi trường hoặc công cụ. GenAI có thể đối thoại, gợi ý, phản biện, tạo nội dung, đóng vai, chấm, khuyến nghị, nhắc nhở và mô phỏng quan hệ xã hội. Vì vậy, nghiên cứu cần đọc AI như một thành phần trong hệ thống hoạt động, không chỉ như treatment. Memarian và Doleck review human-in-the-loop trong AIEd năm 2024 chỉ ra rằng nhiều nghiên cứu còn mô tả quan hệ giữa các thực thể quá đơn giản: thường chỉ hai hoặc ba entity, quan hệ một chiều, ít thuộc tính và thiếu phân tích cấu trúc quyền quyết định (Memarian & Doleck, 2024). Nếu ta không mô tả rõ ai làm gì, quyền ở đâu, dữ liệu đi đâu, trách nhiệm thuộc ai, sẽ khó hiểu vì sao AI có tác động.

Thứ tư, rủi ro không chỉ là lỗi kỹ thuật. Nó là rủi ro sư phạm, xã hội, kinh tế và chính sách. Multimodal learning analytics có thể giúp đo năng lực phức hợp, nhưng cũng có thể thu video, audio, sinh trắc và hành vi quá sâu. AI personalization có thể giúp người học yếu, nhưng cũng có thể khóa họ vào lộ trình hẹp. EdTech business model có thể giúp sản phẩm sống được, nhưng cũng có thể làm dữ liệu người học thành tài sản kinh tế. Komljenovic, Birch và Sellar năm 2024 cho thấy EdTech startups trong higher education đang thử nhiều cách làm dữ liệu người dùng có giá trị kinh tế, từ data outputs, analytics, matching services đến data products, đồng thời gặp khó khăn về minh bạch, chứng minh use value và quan hệ với nhà đầu tư (Komljenovic et al., 2024). Vì vậy, nghiên cứu EdTech không thể chỉ hỏi outcome học tập; nó phải hỏi mô hình kinh tế và quyền lực dữ liệu.

Từ bốn lý do này, chương 24 dùng một tiêu chuẩn: câu hỏi nghiên cứu tốt phải đồng thời có giá trị khoa học, giá trị thiết kế và giá trị quản trị. Nó giúp ta hiểu học tập hơn, thiết kế tốt hơn và ra quyết định có trách nhiệm hơn.

AI Có Giúp Metacognition Hay Làm Người Học Lười Siêu Nhận Thức Hơn?

Metacognition là năng lực người học hiểu và điều khiển quá trình học của mình: biết mình biết gì, chưa biết gì, chiến lược nào đang dùng, mức chắc chắn ra sao, khi nào cần kiểm tra, khi nào cần đổi cách học. Trong một môi trường có AI, metacognition trở thành năng lực sống còn. Người học không chỉ phải hiểu nội dung; họ phải biết khi nào nên hỏi AI, khi nào nên tự nghĩ, khi nào nên kiểm chứng, khi nào nên bỏ gợi ý, khi nào đang bị câu trả lời trôi chảy làm mình tưởng đã hiểu.

Vấn đề là AI có thể đi hai hướng. Hướng tích cực: AI có thể hỏi người học tự đánh giá trước khi nhận feedback, yêu cầu confidence rating, gợi kế hoạch học, nhắc kiểm chứng nguồn, so sánh bản nháp trước-sau, giúp người học phản tư về chiến lược. Hướng tiêu cực: AI có thể trả lời quá nhanh, tóm tắt quá mượt, sửa quá trọn, làm người học không cần tự theo dõi hiểu biết. Khi một chatbot luôn sẵn sàng giải thích lại, người học có thể thấy mình học dễ hơn, nhưng thực ra ít luyện năng lực nhận ra mình chưa hiểu.

Các nghiên cứu hiện có chưa trả lời đủ. Lan và Zhou systematic review năm 2025 về AI-empowered SRL trong higher education tổng hợp 14 nghiên cứu dùng chatbot, adaptive feedback, serious games và e-textbooks để hỗ trợ autonomy. Họ phân biệt human-centred SRL, nơi AI hỗ trợ người học tự điều chỉnh, với AI-centred SRL, nơi AI điều hành quá trình học; review nhấn mạnh cần giữ self-efficacy và agency (Lan & Zhou, 2025). Banihashem và cộng sự năm 2025 mapping review về AI và SRL cũng cho thấy lĩnh vực này tăng nhanh nhưng còn thiếu hiểu biết hệ thống về giao điểm AI-SRL, cần phân loại rõ hơn vai trò AI, giai đoạn SRL và cách hỗ trợ (Banihashem et al., 2025). Một review khác về chatbot hỗ trợ SRL cho thấy chatbot thường hỗ trợ tìm tài nguyên, chiến lược học và monitoring, nhưng ít hỗ trợ đặt mục tiêu, lập kế hoạch và reflection dài hạn (Guan et al., 2024).

Điều này tạo câu hỏi nghiên cứu đầu tiên: AI hỗ trợ metacognition bằng cơ chế nào, trong điều kiện nào, và khi nào nó làm suy yếu metacognition?

Câu hỏi này cần tách thành nhiều câu nhỏ.

Thứ nhất, AI prompt nào làm người học tự giám sát tốt hơn? Ví dụ, trước khi đưa lời giải, AI hỏi “em chắc bao nhiêu phần trăm?”, “em đã thử bước nào?”, “em nghĩ lỗi có thể nằm ở đâu?”. Sau feedback, AI hỏi “em chọn sửa gì trước và vì sao?”. Những prompt này có làm người học kiểm soát học tập tốt hơn sau khi AI biến mất không, hay chỉ tạo compliance bề mặt?

Thứ hai, mức hỗ trợ nào tối ưu? Nếu AI hỏi quá nhiều, người học thấy phiền. Nếu hỏi quá ít, người học đi đường tắt. Cần nghiên cứu adaptive metacognitive scaffolding: khi nào yêu cầu self-explanation, khi nào cho gợi ý, khi nào rút scaffold, khi nào chuyển sang giáo viên.

Thứ ba, metacognition có chuyển giao không? Một người học dùng AI tutor có confidence rating trong môn Toán có tự dùng chiến lược đánh giá độ chắc chắn trong môn Lịch sử không? Một sinh viên được AI yêu cầu phản tư khi viết luận có tự phản tư khi đọc nghiên cứu không? Nếu không có transfer, hỗ trợ chỉ là tính năng trong app.

Thứ tư, AI làm thay metacognition ở đâu? Một hệ thống gợi kế hoạch, nhắc lịch, chọn bài, đánh giá độ hiểu, đề xuất sửa có thể giúp người học yếu bắt đầu. Nhưng nếu luôn làm thay, người học có học cách tự lập kế hoạch không? Cần nghiên cứu “fading” trong SRL-AI: hỗ trợ giảm dần thế nào để người học tự chủ hơn.

Thứ năm, metacognition khác nhau theo tuổi. Học sinh tiểu học cần scaffold cụ thể và ngôn ngữ đơn giản. Học sinh trung học cần học cách kiểm chứng và quản lý offloading. Sinh viên đại học cần phán đoán nguồn, phương pháp và quyền tác giả. Người học trưởng thành cần metacognition trong công việc thật. Không nên dùng cùng một mô hình SRL-AI cho mọi lứa tuổi.

Phương pháp nghiên cứu cần vượt qua self-report. Người học có thể nói “AI giúp em hiểu hơn” nhưng không thật sự hiểu. Cần kết hợp think-aloud, log tương tác, confidence calibration, delayed test, transfer task, phân tích bản nháp, phỏng vấn và quan sát lớp. Cần đo không chỉ kết quả học, mà cả quality of monitoring: người học dự đoán đúng mức hiểu của mình không, biết khi nào cần kiểm chứng không, biết từ chối gợi ý sai không.

Câu hỏi metacognition là trung tâm vì nó quyết định AI làm người học mạnh hơn hay phụ thuộc hơn. Nếu AI chỉ tăng sản phẩm học tập mà không tăng năng lực tự học, giáo dục đang thuê ngoài phần quan trọng nhất.

Cá Nhân Hóa Dài Hạn Ảnh Hưởng Thế Nào Đến Agency, Identity Và Transfer?

Cá nhân hóa thường được đo ngắn hạn: người học làm đúng nhiều hơn, hoàn thành nhiều hơn, hài lòng hơn, hoặc học nhanh hơn. Nhưng câu hỏi sâu hơn là cá nhân hóa dài hạn làm người học trở thành kiểu người học nào. Một hệ thống luôn chọn bài, điều chỉnh độ khó, nhắc lịch, giải thích, sửa lỗi và khen thưởng có thể giúp người học đi xa hơn trong nền tảng. Nhưng nó có làm họ tự chọn mục tiêu tốt hơn không? Có làm họ thấy mình có năng lực hơn không? Có mở rộng bản sắc học tập của họ không? Có giúp transfer sang nhiệm vụ không được cá nhân hóa không?

Các systematic reviews gần đây cho thấy AI-based personalized learning phát triển nhanh, nhưng khái niệm và bằng chứng còn phân tán. Farhood và cộng sự review 125 nghiên cứu từ 2015 đến giữa 2025 về AI-based personalised learning, phân loại ứng dụng, thuật toán và tác động đến dạy, học, đánh giá, đồng thời nêu nhiều cơ hội và thách thức (Farhood et al., 2025). Khalifeh, Santiago và Palau review 2019-2025 và cho thấy thuật ngữ personalized learning, adaptive learning, intelligent tutoring và các khái niệm liên quan được dùng không nhất quán, cần thống nhất hơn để nghiên cứu và thực hành có ý nghĩa (Khalifeh et al., 2026). Bayly-Castaneda, Ramirez-Montoya và Morita-Alexander review về personalized learning paths cho lifelong learning cũng nhấn mạnh tiềm năng nhưng cần nghiên cứu sâu hơn về thiết kế lộ trình, công nghệ và bối cảnh (Bayly-Castaneda et al., 2024).

Vấn đề không chỉ là thiếu bằng chứng, mà là thiếu outcome đúng. Cá nhân hóa thường được đánh giá bằng performance trong hệ thống. Nhưng agency, identity và transfer là outcome dài hơi hơn.

Agency hỏi: người học có quyền hiểu và điều khiển lộ trình không? Họ có biết vì sao hệ thống gợi bài này? Có quyền chọn thử thách cao hơn? Có học cách tự đặt mục tiêu? Có biết khi nào không theo hệ thống? Nếu cá nhân hóa là “máy quyết định để người học đi theo”, agency giảm. Nếu cá nhân hóa là “máy làm rõ lựa chọn để người học quyết định tốt hơn”, agency tăng.

Identity hỏi: người học nhìn mình như ai? Một dashboard luôn nói “em yếu kỹ năng X” có thể giúp sửa lỗi, nhưng cũng có thể làm người học nhận mình là người yếu. Một hệ thống cho bài dễ để giữ tỷ lệ đúng có thể tạo cảm giác thành công, nhưng không nuôi bản sắc “tôi có thể làm việc khó”. Một hệ thống asset-based có thể giúp người học thấy thế mạnh, kinh nghiệm và ngôn ngữ của mình là tài nguyên học tập. Nghiên cứu EdTech cần đo identity formation, không chỉ mastery estimate.

Transfer hỏi: năng lực có rời khỏi hệ thống không? Người học dùng adaptive practice tốt hơn trong app có giải được bài mở trên giấy không? Người học dùng AI writing feedback có viết tốt hơn khi không có AI không? Người học theo lộ trình cá nhân hóa có tự thiết kế lộ trình học cho dự án mới không? Nếu không, personalization có thể đang tối ưu trong hệ thống hơn là phát triển năng lực.

Câu hỏi nghiên cứu dài hạn nên có dạng:

1. Sau một học kỳ hoặc một năm dùng AI personalization, người học tự đặt mục tiêu và chọn chiến lược tốt hơn hay kém hơn? 2. Learner profiles có làm người học tự giới hạn mình không? 3. Hệ thống có cho cơ hội vượt nhãn không? 4. Cá nhân hóa theo sở thích có mở rộng hay thu hẹp vùng tiếp xúc tri thức? 5. Cá nhân hóa có làm giảm peer learning và relatedness không? 6. Hiệu quả của personalization có còn khi scaffold rút đi không? 7. Người học yếu thế có được mở cơ hội hay bị đưa vào remediation kéo dài?

Phương pháp nghiên cứu cần longitudinal mixed-method. Dữ liệu log chỉ cho thấy lộ trình trong hệ thống. Cần phỏng vấn người học, phân tích sản phẩm ngoài hệ thống, nhiệm vụ transfer, quan sát tương tác nhóm, và đo cảm nhận agency. Cần so sánh không chỉ “personalized vs non-personalized”, mà nhiều loại personalization: teacher-mediated, learner-choice, algorithm-driven, asset-based, adaptive scaffold, recommendation-only. Cần xem tác động theo tuổi, môn, nền tảng kiến thức, ngôn ngữ và bối cảnh xã hội.

Câu hỏi này quan trọng vì personalization là một trong những lời hứa lớn nhất của EdTech. Nếu nghiên cứu chỉ đo ngắn hạn, ta có thể xây những hệ thống làm người học đi nhanh hơn nhưng tự chủ ít hơn.

Làm Sao Đo Năng Lực Phức Hợp Mà Không Biến Giáo Dục Thành Giám Sát Toàn Diện?

Các năng lực giáo dục quan trọng nhất thường khó đo: tư duy phản biện, hợp tác, sáng tạo, giao tiếp, đạo đức nghề nghiệp, metacognition, năng lực nghiên cứu, empathy, lãnh đạo, giải quyết vấn đề trong bối cảnh thật. AI và learning analytics mở ra khả năng thu nhiều bằng chứng quá trình hơn: bản nháp, lịch sử chỉnh sửa, hội thoại nhóm, code commits, audio, video, thao tác trong mô phỏng, eye-tracking, sensor, phản hồi AI, peer comments. Điều này có thể giúp đánh giá năng lực phức hợp tốt hơn bài thi một lần. Nhưng nó cũng có thể biến học tập thành giám sát toàn diện.

Multimodal learning analytics (MMLA) là ví dụ rõ. MMLA kết hợp audio, video, physiological signals, logs, spatial trails và các dòng dữ liệu khác để phân tích quá trình học khó nắm bắt bằng một modality. Các review gần đây cho thấy MMLA có tiềm năng trong collaborative learning, simulation, engagement, SRL và feedback, nhưng đi kèm thách thức lớn về noise, missing data, data fusion, interpretability, privacy, fairness và deployment thực tế (Kostopoulos et al., 2026; de Mooij et al., 2025). Caskurlu, Ocak và Dai review MMLA trong K-8 chỉ tìm thấy 14 nghiên cứu thực nghiệm từ 2011-2023, và ghi nhận nhiều nghiên cứu ít nói rõ data fusion, ethics và transparency; họ nhấn mạnh cần hướng dẫn và hiểu biết chung hơn để nghiên cứu MMLA có chất lượng (Caskurlu et al., 2025). Điều này đặc biệt quan trọng vì K-8 là nhóm tuổi cần bảo vệ mạnh.

Trong educational measurement, Ho năm 2024 cảnh báo AI tạo cả cơ hội và đe dọa: có thể hỗ trợ item generation, scale maintenance, test security, scoring và score reporting, nhưng misuses có thể gây biased scores, construct underrepresentation và differential impact theo thời gian; ông kêu gọi tiêu chuẩn AI trong đo lường giáo dục chú ý đến context of test use và ongoing monitoring of bias/scale drift (Ho, 2024). Đây là vấn đề cốt lõi: đo được nhiều hơn không có nghĩa đo đúng hơn.

Câu hỏi nghiên cứu thứ ba là: Làm sao đo năng lực phức hợp bằng dữ liệu giàu hơn mà vẫn giữ quyền riêng tư, agency và phẩm giá người học?

Có vài hướng cần nghiên cứu.

Thứ nhất, evidence selection. Không phải mọi dấu vết đều đáng thu. Với hợp tác nhóm, ta có thể thu audio toàn bộ, video, eye gaze và physiological data. Nhưng có cần không? Có thể chỉ cần sản phẩm nhóm, peer reflection, role log, transcript tự chọn và quan sát giáo viên? Nghiên cứu cần xác định modality tối thiểu đủ để suy luận có trách nhiệm, thay vì thêm modality vì có thể.

Thứ hai, construct validity. Một hệ thống nhận diện “collaboration quality” từ số lần nói có thể sai. Người nói ít có thể là người ghi chú, người lắng nghe, người suy nghĩ, người bị loại trừ, hoặc người không hiểu. Một hệ thống đo “engagement” từ mắt nhìn màn hình có thể nhầm người đọc giấy hoặc người neurodivergent. Cần nghiên cứu cách nối dữ liệu hành vi với construct giáo dục bằng lý thuyết, không chỉ bằng prediction.

Thứ ba, privacy-preserving assessment. Có thể dùng dữ liệu cục bộ, aggregation, anonymization, differential privacy, edge processing, hoặc student-controlled portfolios không? Có thể thiết kế assessment dựa trên artifact và reflection thay vì sensor liên tục không? Cần so sánh các kiến trúc đo lường theo mức xâm phạm và giá trị tăng thêm.

Thứ tư, contestability. Nếu AI đánh giá teamwork, creativity hoặc ethical reasoning, người học có quyền xem bằng chứng và phản biện không? Với năng lực phức hợp, contestability càng quan trọng vì construct luôn có tranh luận. Nghiên cứu cần thiết kế quy trình appeal và human review, không chỉ mô hình scoring.

Thứ năm, proportionality. Tác vụ high-stakes cần bằng chứng mạnh nhưng cũng không được xâm phạm quá mức. Một bài đánh giá formative có thể dùng dữ liệu nhẹ. Một certification nghề nghiệp có thể cần simulation và human assessor. Nghiên cứu cần khung quyết định: loại năng lực nào, mức stakes nào, dữ liệu nào tương xứng?

Thứ sáu, effect on behavior. Khi người học biết mọi tương tác nhóm được phân tích, họ có nói khác đi không? Có perform collaboration cho hệ thống không? Có tránh thử nghiệm vì sợ bị đánh giá không? Đánh giá quá trình có thể làm quá trình thay đổi. Cần nghiên cứu reactivity và chilling effects.

Một mô hình đáng theo đuổi là “bounded evidence”: thu bằng chứng ở những điểm có ý nghĩa, trong thời gian giới hạn, với mục tiêu rõ, quyền giải thích và cơ hội phản biện. Ví dụ, thay vì quay video mọi buổi học để đo collaboration, một dự án có thể yêu cầu nhóm nộp decision log, bản ghi thảo luận 10 phút tự chọn, peer assessment, sản phẩm cuối, và oral defense. AI có thể hỗ trợ phân tích, nhưng giáo viên và người học vẫn thấy bằng chứng.

Đo năng lực phức hợp là cần thiết. Nhưng nếu giải pháp là giám sát toàn diện, ta đã đánh mất phần nhân văn của giáo dục để đo phần nhân văn ấy.

Human-AI Teaming Tối Ưu Khác Nhau Thế Nào Theo Môn Học, Lứa Tuổi Và Bối Cảnh Văn Hóa?

Chương 17 đã phân tích các vai trò AI: tutor, tool, tutee, peer, coach. Nhưng ta vẫn chưa biết đủ về cấu hình tối ưu giữa người học, giáo viên, bạn học và AI trong từng bối cảnh. AI as tutor có thể tốt trong vật lý nhập môn nếu thiết kế chặt. AI as tool có thể tốt trong viết khi người học giữ quyền tác giả. AI as tutee có thể giúp learning-by-teaching. AI as peer có thể giúp phản biện. AI as coach có thể hỗ trợ SRL. Nhưng vai trò nào tốt cho môn nào, tuổi nào, trình độ nào, văn hóa lớp nào?

Human-AI teaming không phải thêm AI vào nhóm người. Nó là phân công quyền và trách nhiệm. Ai đặt mục tiêu? Ai đưa gợi ý? Ai đánh giá? Ai có quyền phủ quyết? Ai chịu trách nhiệm khi sai? Ai học từ ai? Nếu AI làm tutor, người học có còn hỏi bạn không? Nếu AI làm peer reviewer, peer review người thật có giảm không? Nếu AI làm coach, giáo viên có thấy dấu hiệu cần hỗ trợ không? Nếu AI làm tutee, người học có thật sự dạy hay chỉ điều khiển máy tạo câu trả lời?

Memarian và Doleck 2024 cho thấy nghiên cứu human-in-the-loop trong AIEd còn thiếu mô hình cấu trúc về entity, relationship và attributes (Memarian & Doleck, 2024). Vaccaro, Almaatouq và Malone meta-analysis năm 2024 về human-AI combinations ngoài riêng giáo dục cũng cho thấy không phải cứ kết hợp người và AI là tốt hơn; hiệu quả phụ thuộc loại nhiệm vụ, khả năng của người/AI, cách kết hợp và điều kiện quyết định (Vaccaro et al., 2024). Điều này rất quan trọng cho giáo dục: “human-AI collaboration” không tự là thiết kế tốt.

Cần nghiên cứu ít nhất sáu biến.

Biến thứ nhất là môn học. Trong toán, AI tutor có thể hỗ trợ scaffold theo bước, nhưng cần tránh cho lời giải quá sớm. Trong viết, AI tool có thể hỗ trợ phản biện và chỉnh ngôn ngữ, nhưng cần giữ quyền tác giả và voice. Trong lịch sử, AI peer có thể mô phỏng quan điểm, nhưng cần kiểm chứng nguồn và bối cảnh. Trong khoa học, AI có thể tạo giả thuyết hoặc mô phỏng, nhưng cần gắn với evidence và lab practice. Trong nghệ thuật, AI collaborator đặt câu hỏi về phong cách và bản quyền. Trong giáo dục nghề, AI simulation cần chuẩn an toàn và human supervision.

Biến thứ hai là lứa tuổi. Học sinh nhỏ cần AI phạm vi hẹp, ranh giới rõ, nhiều người lớn trong vòng. Học sinh trung học cần học cách kiểm chứng và khai báo. Sinh viên đại học cần AI như công cụ nghề nghiệp có trách nhiệm. Người học trưởng thành cần AI gắn với công việc và transfer. Không nên dùng cùng một chatbot mở cho mọi độ tuổi.

Biến thứ ba là mức thành thạo. Người mới dễ bị AI làm thay vì chưa có tiêu chí đánh giá. Người trung cấp có thể dùng AI để nhận feedback và mở rộng ví dụ. Người có kinh nghiệm có thể dùng AI như sparring partner hoặc productivity tool. Human-AI teaming cần theo expertise reversal: hỗ trợ tốt cho người mới có thể gây cản trở hoặc phụ thuộc cho người giỏi.

Biến thứ tư là văn hóa lớp học. Ở lớp nơi học sinh ngại hỏi, AI có thể là rehearsal space. Ở lớp nơi thảo luận mạnh, AI có thể mở rộng quan điểm. Ở văn hóa coi giáo viên là nguồn thẩm quyền chính, AI có thể gây lẫn lộn quyền lực. Ở bối cảnh đa ngôn ngữ, AI translation có thể mở quyền tham gia nhưng cũng có thể làm mất sắc thái. Nghiên cứu cần đi ra khỏi giả định lớp học phương Tây, cá nhân chủ nghĩa, tiếng Anh và thiết bị đầy đủ.

Biến thứ năm là teacher role. Cùng một AI tutor có thể khác tác động nếu giáo viên dùng report để dạy lại, hoặc để mặc học sinh tự học. Cùng một AI writing tool có thể tốt nếu giáo viên thiết kế process portfolio, xấu nếu chỉ chấm sản phẩm cuối. Nghiên cứu human-AI teaming phải mô tả giáo viên làm gì, không chỉ mô tả tool.

Biến thứ sáu là stakes. AI as coach cho luyện tập thấp rủi ro khác AI as evaluator cho kỳ thi. Human oversight cần mạnh hơn khi stakes cao. Cấu hình teaming phải theo rủi ro.

Phương pháp nghiên cứu nên đi từ “tool comparison” sang “role configuration comparison”. Thay vì hỏi ChatGPT có tốt hơn không, hãy so bốn điều kiện: AI as tutor, AI as peer reviewer, AI as tutee, AI as tool; cùng mục tiêu, cùng môn, cùng thời lượng; đo learning, metacognition, dependency, collaboration và workload. Hoặc so “AI feedback trước peer review” với “peer review trước AI feedback”. Hoặc so “teacher dashboard weekly meeting” với “student-only AI tutor”.

Human-AI teaming tốt có thể làm giáo dục giàu hơn. Nhưng nếu không nghiên cứu cấu hình, ta sẽ tiếp tục dùng một công cụ chung cho nhiều vai trò và rồi tranh luận chung chung về AI tốt hay xấu.

Làm Sao Đưa Asset-Based Personalization Vào Hệ Thống Thật Thay Vì Chỉ Sửa Lỗi Theo Deficit Model?

Phần lớn EdTech cá nhân hóa bắt đầu từ thiếu hụt: người học sai gì, yếu kỹ năng nào, có nguy cơ gì, chưa làm gì, chậm ở đâu. Cách này hữu ích. Giáo viên cần biết lỗi. Hệ thống cần phát hiện lỗ hổng. Nhưng nếu chỉ nhìn thiếu hụt, người học bị mô hình hóa như một danh sách vấn đề cần sửa. Đây là deficit model.

Asset-based approach hỏi ngược lại: người học đã có nguồn lực nào? Ngôn ngữ nhà, kinh nghiệm gia đình, sở thích, chiến lược tự học, quan hệ cộng đồng, năng lực thực hành, bản sắc, động lực, funds of knowledge, khả năng giải thích cho bạn, kinh nghiệm nghề, khả năng sáng tạo, sự kiên trì. Những thứ này không phải phần thưởng tinh thần. Chúng có thể là dữ liệu thiết kế học tập.

Ocumpaugh, Roscoe, Baker, Hutt và Aguilar năm 2024 lập luận rằng AIED đã thành công trong nhiều outcome nhưng vẫn thường đi theo logic phát hiện thiếu hụt rồi sửa; họ đề xuất asset-based instruction and assessment để hỗ trợ người học, đặc biệt nhóm từng bị marginalised hoặc “deficit-ized” (Ocumpaugh et al., 2024). Stewart, Mills và Hutt năm 2024 dùng góc nhìn data feminism để thảo luận cách kết hợp asset-based và deficit-based trong learning analytics, nhấn mạnh cần xem xét quyền lực, thách thức cấu trúc quyền lực và tránh các nhị phân/hệ thứ bậc làm nghèo hình ảnh người học (Stewart et al., 2024).

Câu hỏi nghiên cứu ở đây là: asset-based personalization có thể được vận hành trong hệ thống số như thế nào mà không trở thành khẩu hiệu?

Có năm thách thức.

Thứ nhất, asset khó đo hơn deficit. Lỗi sai dễ ghi từ bài quiz. Funds of knowledge, identity, community expertise, bilingual repertoires, practical intelligence khó đo hơn. Nếu cố đo bằng checklist, ta lại làm nghèo asset. Cần phương pháp hỗn hợp: learner profiles do người học đồng tạo, portfolio, teacher notes, self-reflection, community artifacts, project work, peer recognition.

Thứ hai, asset có thể bị essentialize. Nếu hệ thống nói “học sinh này thuộc nhóm X nên có asset Y”, nó đang gắn nhãn văn hóa. Asset-based không phải stereotype tích cực. Nó phải cho người học quyền tự mô tả, thay đổi và từ chối.

Thứ ba, asset phải nối với mục tiêu học. Nói người học có kinh nghiệm gia đình, ngôn ngữ hay sở thích không đủ. Thiết kế phải chuyển asset thành cầu học tập: dùng kinh nghiệm lao động để hiểu tỷ lệ, dùng song ngữ để so sánh khái niệm, dùng sở thích âm nhạc để học pattern, dùng kỹ năng chăm sóc em nhỏ để phân tích responsibility trong giáo dục công dân.

Thứ tư, giáo viên cần vai trò trung tâm. AI có thể gợi kết nối asset, nhưng giáo viên hiểu bối cảnh và quan hệ. Một hệ thống tự suy luận asset từ dữ liệu hành vi có rủi ro cao. Asset-based personalization nên là co-constructed: người học, giáo viên và hệ thống cùng xây.

Thứ năm, assessment phải thay đổi. Nếu bài thi chỉ đo chuẩn hẹp, asset-based instruction sẽ bị kéo về remediation. Cần đánh giá cho phép nhiều cách biểu đạt, authentic tasks, portfolio, oral defense, collaborative work và reflection.

Một nghiên cứu tốt có thể so sánh hai hệ thống cá nhân hóa cùng dạy một kỹ năng. Hệ thống deficit-only phát hiện lỗi và cho bài luyện. Hệ thống asset-based cũng phát hiện lỗi nhưng thêm lựa chọn ví dụ dựa trên kinh nghiệm người học, yêu cầu người học tạo liên hệ với bối cảnh của mình, và cho cơ hội thể hiện hiểu biết bằng nhiều modality. Outcome không chỉ là điểm, mà là agency, belonging, transfer, persistence và chất lượng giải thích. Cần xem nhóm yếu thế có được lợi nhiều hơn không, và có rủi ro gắn nhãn không.

Câu hỏi này quan trọng vì AI có thể làm deficit model mạnh hơn bao giờ hết. Nó có thể phát hiện mọi lỗi, mọi khoảng trống, mọi rủi ro. Nếu không thiết kế asset-based, hệ thống giáo dục số sẽ rất giỏi nhìn người học qua cái họ thiếu.

Những Ngành Ngoài STEM, Ngoài Tiếng Anh Và Ngoài Đại Học Cần Taxonomy Riêng Nào?

Nhiều nghiên cứu AI trong giáo dục tập trung vào higher education, tiếng Anh, STEM, lập trình, viết học thuật, ngoại ngữ hoặc các nhiệm vụ có sản phẩm dễ phân tích. Đây là điều dễ hiểu: dữ liệu dễ thu, người học trưởng thành hơn, công cụ sẵn, nghiên cứu thuận tiện hơn. Nhưng giáo dục rộng hơn thế rất nhiều. Mầm non, tiểu học, giáo dục đặc biệt, giáo dục nghề, nghệ thuật, lịch sử, địa lý, giáo dục công dân, đạo đức, thể chất, âm nhạc, ngôn ngữ ít tài nguyên, lớp đa ngôn ngữ, trường vùng khó, đào tạo phi chính quy, học tập cộng đồng, giáo dục người lớn - mỗi vùng có taxonomy nhiệm vụ khác.

Qian systematic review năm 2025 về ứng dụng sư phạm GenAI trong higher education cho thấy lĩnh vực này đang phát triển nhanh nhưng vẫn cần nghiên cứu sâu hơn về collaboration giữa student-teacher-AI, overreliance và bối cảnh triển khai (Qian, 2025). Nhiều review GenAI khác cũng tập trung mạnh vào higher education. Lintner 2024 cho thấy ngay cả AI literacy measurement còn thiếu cross-cultural validity (Lintner, 2024). Các review K-12 đang tăng, như Marzano 2025 về GenAI trong K-12, nhưng so với higher education, bằng chứng vẫn ít hơn và rủi ro khác hơn (Marzano, 2025). Điều này tạo một khoảng trống lớn: taxonomy AIEd hiện nay có thể đang phản ánh nơi dễ nghiên cứu hơn là nơi giáo dục cần hiểu nhất.

Taxonomy theo ngành không chỉ là phân loại môn học. Nó phải mô tả loại nhiệm vụ, bằng chứng học tập, rủi ro AI và hình thức hỗ trợ phù hợp.

Trong STEM, nhiều nhiệm vụ có cấu trúc: giải bài, mô phỏng, lab, chứng minh, phân tích dữ liệu. AI có thể tutor, generate problems, debug, visualize, simulate. Rủi ro là làm thay bước suy luận, tối ưu bài quen, giảm thực hành lab thật.

Trong humanities, nhiệm vụ thường là diễn giải, tranh luận, nguồn, bối cảnh, nhiều quan điểm, giọng viết. AI có thể phản biện, mô phỏng nhân vật lịch sử, gợi câu hỏi nguồn, nhưng rủi ro hallucination, flattening voice, presentism và mất đọc sâu.

Trong arts, nhiệm vụ liên quan đến phong cách, vật liệu, cảm xúc, quá trình, bản quyền và bản sắc. AI có thể tạo biến thể, nhưng rủi ro đồng nhất hóa thẩm mỹ, mờ tác giả và lấy dữ liệu nghệ sĩ.

Trong vocational education, nhiệm vụ gắn với an toàn, chuẩn nghề, thiết bị, workflow, giao tiếp khách hàng, tình huống thực. AI simulation có thể hữu ích, nhưng cần supervision và assessment authentic.

Trong early childhood, nhiệm vụ là chơi, ngôn ngữ, vận động, quan hệ, tự điều chỉnh ban đầu. AI hội thoại độc lập có rủi ro cao; công nghệ nên hỗ trợ người lớn và accessibility hơn là thay tương tác.

Trong special education, công nghệ có thể mở quyền tham gia, nhưng rủi ro dữ liệu nhạy cảm, gắn nhãn và thiết kế không phù hợp sensory/cognitive needs.

Trong ngôn ngữ ít tài nguyên, vấn đề không chỉ là dịch. Cần model performance, cultural examples, dialects, script, speech recognition, curriculum terminology và community validation. Một taxonomy AI cho tiếng Việt khác taxonomy cho tiếng Anh.

Câu hỏi nghiên cứu cần đặt là: mỗi lĩnh vực cần những vai trò AI nào, loại bằng chứng nào, chuẩn đạo đức nào và outcome nào?

Một hướng làm việc là xây “domain-specific AI pedagogy maps”. Mỗi bản đồ có:

1. Nhiệm vụ học tập cốt lõi của môn/ngành. 2. Loại khó khăn người học thường gặp. 3. Vai trò AI có thể hỗ trợ. 4. Phần không nên tự động hóa. 5. Dữ liệu cần và dữ liệu không nên thu. 6. Loại feedback phù hợp. 7. Rủi ro bias/ngôn ngữ/văn hóa. 8. Cách đánh giá transfer. 9. Vai trò giáo viên/người hướng dẫn. 10. Điều kiện triển khai tối thiểu.

Nghiên cứu cũng cần đa ngôn ngữ và đa bối cảnh hơn. Không thể tiếp tục giả định kết quả từ sinh viên đại học nói tiếng Anh sẽ áp dụng cho học sinh phổ thông ở Việt Nam, giáo viên vùng nông thôn, người học nghề, hoặc lớp đa ngôn ngữ. Cross-cultural validity không phải phần phụ ở chương phương pháp; nó là điều kiện của công bằng.

Nếu lĩnh vực không xây taxonomy riêng cho các ngành ngoài STEM, ngoài tiếng Anh và ngoài đại học, AI trong giáo dục sẽ tiếp tục phát triển mạnh ở nơi dễ đo và dễ monetise, trong khi các vùng giáo dục khó hơn bị bỏ lại hoặc bị áp công cụ không phù hợp.

EdTech Có Thể Bền Vững Về Kinh Tế Mà Vẫn Bảo Vệ Dữ Liệu, Công Bằng Và Phẩm Giá Người Học Không?

Câu hỏi cuối cùng đi ra ngoài lớp học nhưng quay lại quyền người học. EdTech cần tiền để sống: đội ngũ, support, bảo mật, accessibility, localization, nghiên cứu, cloud, model usage, sales, training. Một sản phẩm không có mô hình tài chính bền có thể chết, đổi điều khoản, giảm chất lượng hoặc bán mình cho mô hình tệ hơn. Nhưng một mô hình tài chính quá phụ thuộc vào dữ liệu, upsell, lock-in, advertising, engagement hoặc premium inequality có thể làm hại giáo dục.

Chương 22 đã phân tích procurement, business models, TCO, sustainability và local market adaptation. Câu hỏi nghiên cứu còn mở là: mô hình kinh tế nào cho EdTech AI vừa đủ sống, vừa không biến người học thành sản phẩm dữ liệu hoặc tạo bất bình đẳng mới?

UNESCO GEM 2023 khuyến nghị công nghệ trong giáo dục phải phù hợp, công bằng, có bằng chứng, scalable và sustainable; đồng thời cảnh báo chi phí bị đánh giá thấp và bằng chứng độc lập còn yếu (UNESCO, 2023). Komljenovic và cộng sự năm 2024 cho thấy dữ liệu người dùng trong higher education đang được các startup thử làm thành giá trị kinh tế qua nhiều chiến lược, nhưng việc chứng minh use value, minh bạch và quản lý quan hệ đầu tư còn khó (Komljenovic et al., 2024). HolonIQ dữ liệu thị trường 2025-2026 cho thấy vốn EdTech sau thời kỳ tăng nóng đã thận trọng hơn, tập trung vào AI, workforce training, traction và revenue rõ hơn (HolonIQ, 2026). Bối cảnh này tạo áp lực: sản phẩm phải kiếm tiền rõ hơn, nhưng giáo dục không thể để mọi incentive thị trường quyết định thiết kế học tập.

Cần nghiên cứu ít nhất năm mô hình.

Mô hình thứ nhất là public-interest procurement. Nhà nước hoặc hệ thống giáo dục dùng sức mua để yêu cầu privacy, evidence, interoperability, accessibility, fair pricing và data portability. Câu hỏi: procurement như vậy có thật sự định hình thị trường không, hay chỉ làm quy trình chậm hơn? Những tiêu chí nào tạo hiệu quả tốt nhất?

Mô hình thứ hai là tiered equity pricing. Vendor có giá khác nhau cho trường giàu/nghèo, khu vực, quy mô, hoặc public mission. Câu hỏi: mô hình này có bền cho vendor không? Có tránh tạo bản nghèo kém chất lượng không? Ai xác định eligibility?

Mô hình thứ ba là open-source/open-core với service. Lõi mở, dịch vụ triển khai và support có phí. Câu hỏi: ai duy trì security, accessibility, localization? Trường yếu năng lực có dùng được không? Open có thật sự giảm lock-in không nếu triển khai vẫn phụ thuộc nhà cung cấp?

Mô hình thứ tư là data trust hoặc data cooperative. Dữ liệu người học được quản trị bởi tổ chức tin cậy, với quyền kiểm soát và mục đích rõ. Câu hỏi: mô hình này có khả thi trong trường học không? Ai chịu trách nhiệm pháp lý? Có giúp nghiên cứu và innovation mà vẫn bảo vệ người học không?

Mô hình thứ năm là outcome-based funding có guardrails. Trả tiền theo outcome có thể khuyến khích tác động, nhưng dễ gaming. Câu hỏi: outcome nào đủ rộng để tránh dạy tủ, selection bias và bỏ nhóm khó? Có thể kết hợp learning, equity, workload và wellbeing không?

Ngoài mô hình doanh thu, cần nghiên cứu sustainability môi trường. AI compute, thiết bị, e-waste, cloud storage và vòng đời phần cứng đang trở thành chi phí thật. EdTech có thể nói về tương lai nhưng vận hành bằng thiết bị thay nhanh và dữ liệu lưu mãi. Cần đo carbon, e-waste, device lifecycle và policy kéo dài tuổi thọ trong giáo dục.

Cuối cùng, cần nghiên cứu phẩm giá người học như outcome kinh tế. Một mô hình có thể rẻ và hiệu quả điểm số nhưng dùng quảng cáo, upsell, tracking, so sánh xã hội và pressure marketing. Có thể gọi đó là thành công kinh tế, nhưng không phải thành công giáo dục. Phẩm giá khó đo, nhưng có thể nghiên cứu qua quyền kiểm soát dữ liệu, cảm giác bị khai thác, quyền từ chối, sự công bằng trong access, và niềm tin của người học/phụ huynh/giáo viên.

Nếu không giải được câu hỏi kinh tế, các nguyên tắc đạo đức sẽ yếu trong thực tế. Một sản phẩm cần sống. Một trường cần ngân sách. Một vendor cần doanh thu. Một giáo viên cần support. Một người học cần quyền. Kinh tế học EdTech tương lai phải tìm điểm giao giữa những nhu cầu này.

Thực Trạng Nghiên Cứu Hiện Nay

Thực trạng nghiên cứu EdTech AI hiện nay có hai mặt. Một mặt, số lượng nghiên cứu tăng rất nhanh. Systematic reviews và meta-analyses về GenAI, ChatGPT, AI tutoring, SRL, personalized learning, MMLA, AI literacy, ethical challenges và teacher professional development liên tục xuất hiện trong 2024-2026. Đây là dấu hiệu tốt: lĩnh vực đang cố tổng hợp thay vì chỉ công bố từng thử nghiệm nhỏ.

Mặt khác, các review cũng lặp lại nhiều cảnh báo: nghiên cứu ngắn hạn, mẫu nhỏ, tập trung vào higher education, thiếu K-12, thiếu long-term effects, thiếu transfer, thiếu cross-cultural validation, thiếu performance-based measurement, thiếu mô tả implementation conditions, thiếu phân tích equity, thiếu dữ liệu về workload và sustainability. Một số lĩnh vực như MMLA có kỹ thuật tiến nhanh nhưng ethics và real-world deployment còn yếu. Một số lĩnh vực như AI literacy có nhiều thang đo nhưng cross-cultural validity gần như chưa được kiểm tra (Lintner, 2024). Một số kết quả GenAI tích cực nhưng metacognition vẫn là vùng chưa rõ (Educational Research Review, 2025).

Một vấn đề nữa là nghiên cứu thường tách lớp. Nghiên cứu learning outcomes ít đo business model. Nghiên cứu privacy ít đo learning. Nghiên cứu teacher adoption ít đo student transfer. Nghiên cứu model accuracy ít đo classroom workflow. Nhưng trong thế giới thật, các lớp này gắn nhau. Một công cụ có learning gain nhưng workload tăng sẽ không bền. Một công cụ có privacy tốt nhưng UX kém sẽ không được dùng. Một công cụ có AI mạnh nhưng business model dựa trên premium access sẽ tạo bất bình đẳng. Nghiên cứu tương lai cần interdisciplinary design mạnh hơn.

Ngoài ra, nhiều nghiên cứu vẫn lấy công cụ làm đơn vị phân tích: ChatGPT, chatbot, ITS, dashboard, VR. Đơn vị phân tích tốt hơn có thể là hoạt động học: AI-supported revision cycle, teacher-mediated error clustering, student-AI-peer debate, AI-assisted portfolio assessment, asset-based learner profile, low-data early warning workflow. Khi nghiên cứu theo hoạt động, kết quả dễ chuyển sang bối cảnh khác hơn vì ta hiểu cơ chế.

Thực trạng này không bi quan. Nó chỉ nói rằng lĩnh vực đang ở giai đoạn chuyển từ “AI có thể làm gì” sang “AI nên làm gì, trong điều kiện nào, với trách nhiệm nào”. Chuyển giai đoạn này cần câu hỏi nghiên cứu sắc hơn.

Phân Tích Phản Biện

Một chương về câu hỏi mở cũng có rủi ro. Rủi ro đầu tiên là biến mọi thứ thành “cần nghiên cứu thêm” rồi không hành động. Giáo dục không thể chờ mười năm nghiên cứu dài hạn trước khi quyết định chính sách AI trong lớp học. Người học đã dùng AI. Giáo viên đã cần hướng dẫn. Vendor đã bán sản phẩm. Trường đã mua công cụ. Vì vậy, câu hỏi mở không phải lý do trì hoãn; nó là lý do triển khai có guardrails, pilot nhỏ, đo đúng và sẵn sàng sửa.

Rủi ro thứ hai là nghiên cứu trở thành đặc quyền của nơi giàu. Longitudinal mixed-method studies, MMLA labs, randomized trials, data infrastructure và AI audit đều tốn nguồn lực. Nếu chỉ trường giàu và đại học lớn làm được, bằng chứng sẽ tiếp tục lệch. Cần thiết kế phương pháp nghiên cứu nhẹ hơn, thực dụng hơn cho trường phổ thông, trung tâm nhỏ, bối cảnh ít tài nguyên: design-based research, practitioner inquiry, networked improvement communities, shared instruments, open protocols, dữ liệu tối thiểu.

Rủi ro thứ ba là câu hỏi nghiên cứu bị thị trường định hình. Nghiên cứu về sản phẩm dễ monetise sẽ nhiều hơn nghiên cứu về người học yếu thế, ngôn ngữ ít tài nguyên, giáo dục đặc biệt, arts, civic education, hoặc local governance. Funder và chính sách công cần chủ động tài trợ vùng ít hấp dẫn thương mại nhưng quan trọng xã hội.

Rủi ro thứ tư là phương pháp đo tạo ra thứ nó đo. Nếu nghiên cứu metacognition chỉ dùng self-report, người học học cách nói mình phản tư. Nếu nghiên cứu collaboration dùng số lượt nói, nhóm học cách nói nhiều. Nếu nghiên cứu engagement dùng time-on-platform, sản phẩm học cách giữ người dùng. Nghiên cứu cần luôn hỏi: thước đo này đang làm hệ thống tối ưu điều gì?

Rủi ro thứ năm là ethics bị xử lý sau thiết kế nghiên cứu. Với AI education, ethics phải là một phần của research design: consent, data minimisation, age-appropriate design, contestability, impact on teacher workload, participant agency, quyền rút lui, và trả giá trị lại cho cộng đồng. Không thể thu dữ liệu học sinh thật sâu rồi chỉ nói đã được ethics approval.

Rủi ro cuối cùng là quá nhấn mạnh AI mà quên giáo dục. Nhiều câu hỏi tương lai nghe như câu hỏi về AI, nhưng thật ra là câu hỏi về học tập: tự chủ là gì, hiểu sâu là gì, hợp tác tốt là gì, công bằng là gì, giáo viên cần quyền gì, tổ chức học hỏi ra sao. AI chỉ làm các câu hỏi cũ trở nên cấp bách hơn.

Nguyên Tắc Thiết Kế Chương Trình Nghiên Cứu

Nếu phải biến chương này thành một agenda thực hành, có thể bắt đầu bằng mười nguyên tắc.

Thứ nhất, ưu tiên nghiên cứu dài hạn. Ít nhất một phần nghiên cứu EdTech AI cần theo dõi nhiều tháng hoặc nhiều học kỳ, có delayed outcome và transfer task.

Thứ hai, đo process và outcome cùng lúc. Không chỉ hỏi điểm tăng không, mà hỏi người học đã làm gì, AI làm gì, giáo viên làm gì, feedback được dùng ra sao, và scaffold có rút không.

Thứ ba, phân tích subgroup. Không chỉ báo effect trung bình. Cần xem ngôn ngữ, disability, kiến thức nền, giới, thu nhập, thiết bị, vùng miền, lứa tuổi và bối cảnh văn hóa.

Thứ tư, mô tả implementation conditions. Nghiên cứu phải nói rõ training, teacher role, workload, hạ tầng, policy, dữ liệu, thời lượng, mức hỗ trợ vendor. Không có điều kiện, kết quả khó dùng.

Thứ năm, dùng mixed methods. Log và điểm cần đi cùng phỏng vấn, quan sát, artifact analysis, teacher notes và learner reflection.

Thứ sáu, thiết kế privacy-preserving research. Thu ít dữ liệu nhất có thể, dùng dữ liệu cục bộ/ẩn danh khi phù hợp, giới hạn lưu trữ, giải thích rõ cho người học, và tránh sensor/sinh trắc nếu không cần.

Thứ bảy, nghiên cứu vai trò thay vì chỉ nghiên cứu công cụ. Cùng một GenAI có thể là tutor, tool, tutee, peer, coach. Cần so role configuration, không chỉ so product.

Thứ tám, đưa giáo viên và người học vào co-design nghiên cứu. Câu hỏi nghiên cứu nên xuất phát từ vấn đề lớp học thật, không chỉ từ khả năng kỹ thuật.

Thứ chín, công bố negative and null results. Nếu AI không giúp metacognition, nếu personalization tăng dependency, nếu dashboard tăng workload, cần công bố. Không có dữ liệu âm, lĩnh vực sẽ lạc quan giả.

Thứ mười, nối nghiên cứu với procurement và policy. Kết quả nghiên cứu nên giúp trường ra quyết định: dùng cho ai, điều kiện gì, rủi ro gì, chi phí gì, khi nào dừng.

Một chương trình nghiên cứu tốt không cần trả lời mọi câu hỏi cùng lúc. Nó cần đặt đúng câu hỏi ở đúng cấp: lớp học, trường, hệ thống, thị trường và chính sách.

Tổng Kết Chương

Những câu hỏi mở trong chương này không phủ định những gì cuốn sách đã kết luận. Ngược lại, chúng làm các kết luận ấy có trách nhiệm hơn. Ta biết EdTech cần bắt đầu từ nhiệm vụ học tập, nhưng vẫn cần nghiên cứu nhiệm vụ nào AI hỗ trợ tốt nhất. Ta biết cần giữ ma sát nhận thức, nhưng vẫn cần biết friction tối ưu ở từng tuổi và môn học. Ta biết feedback phải dẫn đến hành động, nhưng vẫn cần đo feedback uptake dài hạn. Ta biết cá nhân hóa có rủi ro, nhưng vẫn cần hiểu tác động lên agency, identity và transfer. Ta biết giáo viên phải ở trong vòng phán đoán, nhưng vẫn cần mô hình human-AI teaming cụ thể. Ta biết dữ liệu cần quản trị, nhưng vẫn cần cách đo năng lực phức hợp mà không giám sát toàn diện. Ta biết mô hình kinh tế quan trọng, nhưng vẫn cần mô hình bền vững không khai thác người học.

Nếu có một thông điệp cuối cùng cho cuốn sách, đó là: EdTech tốt không phải thứ khiến giáo dục trông hiện đại hơn. EdTech tốt làm hoạt động học trở nên sâu hơn, công bằng hơn, có trách nhiệm hơn và bền vững hơn trong điều kiện thật. AI có thể giúp việc đó. Nó cũng có thể làm ngược lại. Khác biệt nằm ở câu hỏi ta đặt, bằng chứng ta chấp nhận, quyền ta bảo vệ và thiết kế ta chọn.

Cuốn sách kết thúc ở đây, nhưng công việc thực sự bắt đầu ở mỗi lớp học, mỗi tổ chuyên môn, mỗi nhóm sản phẩm, mỗi quy trình procurement, mỗi chính sách dữ liệu và mỗi nghiên cứu không ngại nói rõ: chúng ta chưa biết đủ, nên phải học tiếp một cách nghiêm túc.

Tài liệu tham khảo

Banihashem, S. K., Bond, M., Bergdahl, N., Khosravi, H., & Noroozi, O. (2025). A systematic mapping review at the intersection of artificial intelligence and self-regulated learning. International Journal of Educational Technology in Higher Education, 22, 50. https://doi.org/10.1186/s41239-025-00548-8

Bayly-Castaneda, K., Ramirez-Montoya, M.-S., & Morita-Alexander, A. (2024). Crafting personalized learning paths with AI for lifelong learning: A systematic literature review. Frontiers in Education, 9, 1424386. https://doi.org/10.3389/feduc.2024.1424386

Caskurlu, S., Ocak, C., & Dai, C.-P. (2025). The scope of multimodal learning analytics in K-8: A systematic review. Journal of Learning Analytics, 12(2), 224-236. https://doi.org/10.18608/jla.2025.8505

de Mooij, S., Lämsä, J., Lim, L., Aksela, O., Athavale, S., Bistolfi, I., & colleagues. (2025). A systematic review of self-regulated learning through integration of multimodal data and artificial intelligence. Educational Psychology Review, 37, 54. https://doi.org/10.1007/s10648-025-10028-0

Farhood, H., Nyden, M., Beheshti, A., & Muller, S. (2025). Artificial intelligence-based personalised learning in education: A systematic literature review. Discover Artificial Intelligence, 5, 331. https://doi.org/10.1007/s44163-025-00598-x

Guan, R., Raković, M., Chen, G., & Gašević, D. (2024). How educational chatbots support self-regulated learning? A systematic review of the literature. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12881-y

Ho, A. D. (2024). Artificial intelligence and educational measurement: Opportunities and threats. Educational Measurement: Issues and Practice, 43(3), 45-53. https://doi.org/10.3102/10769986241248771

HolonIQ. (2026). EdTech hits $2.6B in investment as the market stabilizes. Bigger bets in AI and workforce training. https://www.holoniq.com/notes/edtech-hits-2-6b-in-investment-as-the-market-stabilizes-bigger-bets-in-ai-and-workforce-training

Khalifeh, F., Santiago, R., & Palau, R. (2026). Redefining personalized learning in the artificial intelligence era: An updated systematic review from 2019 to 2025. Smart Learning Environments, 13, 19. https://doi.org/10.1186/s40561-026-00440-6

Komljenovic, J., Birch, K., & Sellar, S. (2024). Monetising digital data in higher education: Analysing the strategies and struggles of EdTech startups. Postdigital Science and Education, 6, 1196-1215. https://doi.org/10.1007/s42438-024-00505-0

Kostopoulos, G., Kotsiantis, S., Panagiotakopoulos, T., & Kameas, A. (2026). A survey of multimodal learning analytics: Data, methods, systems, and responsible deployment. Future Internet, 18(3), 115. https://doi.org/10.3390/fi18030115

Lan, M., & Zhou, X. (2025). A qualitative systematic review on AI empowered self-regulated learning in higher education. npj Science of Learning, 10, 21. https://doi.org/10.1038/s41539-025-00319-0

Liang, W., Yuksekgonul, M., Mao, Y., Wu, E., & Zou, J. (2023). GPT detectors are biased against non-native English writers. Patterns, 4(7), 100779. https://doi.org/10.1016/j.patter.2023.100779

Lintner, T. (2024). A systematic review of AI literacy scales. npj Science of Learning, 9, 50. https://doi.org/10.1038/s41539-024-00264-4

Marzano, D. (2025). Generative Artificial Intelligence (GAI) in teaching and learning processes at the K-12 level: A systematic review. Technology, Knowledge and Learning. https://doi.org/10.1007/s10758-025-09853-7

Memarian, B., & Doleck, T. (2024). Human-in-the-loop in artificial intelligence in education: A review and entity-relationship analysis. Computers in Human Behavior: Artificial Humans, 2(1), 100053. https://doi.org/10.1016/j.chbah.2024.100053

Ocumpaugh, J., Roscoe, R. D., Baker, R. S., Hutt, S., & Aguilar, S. J. (2024). Toward asset-based instruction and assessment in artificial intelligence in education. International Journal of Artificial Intelligence in Education, 34(4), 1559-1598. https://doi.org/10.1007/s40593-023-00382-x

Qian, Y. (2025). Pedagogical applications of generative AI in higher education: A systematic review of the field. TechTrends, 69, 1105-1120. https://doi.org/10.1007/s11528-025-01100-1

Stewart, A., Mills, C., & Hutt, S. (2024). Marrying asset- and deficit-based approaches: A data feminist perspective in learning analytics. CEUR Workshop Proceedings, 3667, 292-294.

UNESCO. (2023). Global Education Monitoring Report 2023: Technology in education: A tool on whose terms? https://www.unesco.org/gem-report/en/technology

Vaccaro, M., Almaatouq, A., & Malone, T. (2024). When combinations of humans and AI are useful: A systematic review and meta-analysis. Nature Human Behaviour, 8, 2293-2303. https://doi.org/10.1038/s41562-024-02024-1

Wu, X., Zhu, P., Zhang, J., Yin, M., & Wang, Y. (2026). ChatGPT's impact on student learning outcomes: A meta-analysis of 35 experimental studies. Humanities and Social Sciences Communications, 13, 478. https://doi.org/10.1057/s41599-026-07019-z