Chương 23: Bộ nguyên tắc thiết kế EdTech thực chứng

Bối cảnh / Vấn đề

Sau hai mươi hai chương, một điều trở nên rõ: EdTech thất bại không chỉ vì công nghệ yếu. Nó thất bại khi ta bắt đầu sai câu hỏi. Ta hỏi “có AI chưa?” thay vì “nhiệm vụ học tập nào đang cần hỗ trợ?”. Ta hỏi “có cá nhân hóa không?” thay vì “cá nhân hóa đang phục vụ cơ chế học nào và có giới hạn đạo đức nào?”. Ta hỏi “dashboard có dữ liệu gì?” thay vì “dữ liệu này dẫn đến hành động nào?”. Ta hỏi “giá bao nhiêu?” thay vì “tổng chi phí vòng đời và rủi ro là gì?”. Ta hỏi “người học có thích không?” thay vì “người học có hiểu sâu hơn, nhớ bền hơn, tự chủ hơn, và được đối xử công bằng hơn không?”.

Cuốn sách này đi qua nhiều lớp của EdTech: bằng chứng, lịch sử thất bại, khoa học học tập, content AI, assessment AI, tutoring, learning analytics, accessibility, social learning, hạ tầng, lý thuyết học tập, trí nhớ, tải nhận thức, động lực, đánh giá mới, human-AI interaction, AI literacy, giáo viên, tổ chức, dữ liệu, chính sách và kinh tế học. Mỗi lớp có ngôn ngữ riêng. Nhưng khi đưa về thiết kế thực chứng, các lớp ấy quy về một số nguyên tắc cốt lõi.

Nguyên tắc không phải checklist để tick cho xong. Một checklist có thể tạo cảm giác kiểm soát giả: “có feedback”, “có AI”, “có dashboard”, “có personalization”, “có privacy policy”. Nhưng giáo dục không cải thiện bằng nhãn. Một hệ thống có feedback vẫn có thể vô dụng nếu người học không biết làm gì tiếp. Một hệ thống có AI vẫn có thể làm người học ít suy nghĩ hơn. Một hệ thống có dashboard vẫn có thể làm giáo viên thêm việc. Một hệ thống có personalization vẫn có thể khóa người học vào lộ trình hẹp. Một hệ thống có privacy policy vẫn có thể thu quá nhiều dữ liệu.

Vì vậy, chương này không đưa ra “bảy tính năng nên có”. Nó đưa ra bảy nguyên tắc như bảy câu hỏi thiết kế:

1. Nhiệm vụ học tập hoặc vận hành nào thật sự cần công nghệ? 2. Ma sát nào cần giảm, ma sát nào phải giữ? 3. Phản hồi có dẫn đến hành động học tập không? 4. Cá nhân hóa có mở rộng agency và cơ hội không, hay đang cô lập, khóa và thao túng? 5. Giáo viên có thật sự ở trong vòng phán đoán không? 6. Hiệu quả được đo cho ai, trong điều kiện nào, với chi phí và rủi ro nào? 7. Ta có đang tô hồng công nghệ hoặc bi quan dễ dãi không?

“Thực chứng” trong chương này không có nghĩa chỉ dùng thứ đã có randomized controlled trial. Giáo dục luôn phải ra quyết định trong điều kiện bằng chứng chưa hoàn hảo. Một công nghệ mới, nhất là AI, có thể xuất hiện nhanh hơn nghiên cứu dài hạn. Nhưng thực chứng cũng không có nghĩa “có vẻ hợp lý” hay “người dùng thích”. Thiết kế thực chứng là cách làm việc: dựa trên cơ chế học tập đã biết, đọc bằng chứng với bối cảnh, thử nhỏ, đo đúng, phản biện rủi ro, lắng nghe người dùng, sửa, và chỉ mở rộng khi điều kiện đủ rõ. Chương 2 đã nói evidence-based practice là vòng lặp triển khai, không phải nhãn dán marketing.

Điểm khó là các nguyên tắc này thường kéo ngược với logic sản phẩm tiêu dùng. Sản phẩm tiêu dùng muốn giảm friction tối đa; học tập cần giữ một số friction. Sản phẩm tiêu dùng muốn tăng engagement; học tập cần engagement có ý nghĩa, không chỉ thời gian màn hình. Sản phẩm tiêu dùng muốn personalization sâu để tối ưu hành vi; giáo dục cần personalization có minh bạch, lựa chọn và không khóa cơ hội. Sản phẩm tiêu dùng muốn thu dữ liệu để cải thiện sản phẩm; giáo dục cần data minimisation và contestability. Sản phẩm tiêu dùng muốn scale nhanh; giáo dục cần adaptation theo môn học, lứa tuổi, văn hóa, giáo viên và tổ chức.

Vì vậy, thiết kế EdTech thực chứng không phải lấy UX tốt của công nghệ tiêu dùng rồi thêm nội dung học. Nó là một ngành thiết kế riêng, nơi trải nghiệm người dùng, khoa học học tập, đạo đức dữ liệu, triển khai tổ chức và kinh tế học phải cùng ngồi vào bàn. Một giao diện mượt nhưng làm mất retrieval không tốt. Một AI thông minh nhưng tước quyền phán đoán của giáo viên không tốt. Một mô hình dự đoán chính xác trung bình nhưng gây hại cho nhóm yếu thế không tốt. Một sản phẩm tăng usage nhưng không tăng transfer không đủ. Một nền tảng rẻ năm đầu nhưng tạo lock-in và chi phí ẩn không rẻ.

UNESCO GEM Report 2023 đặt câu hỏi cho công nghệ trong giáo dục: “A tool on whose terms?” Công cụ phục vụ ai, theo điều kiện nào, và ai quyết định điều kiện đó? Báo cáo nhấn mạnh công nghệ cần được dùng phù hợp, công bằng, có bằng chứng, bền vững và dưới điều kiện của giáo dục, không phải chỉ dưới điều kiện của thị trường công nghệ (UNESCO, 2023). Education Endowment Foundation trong hướng dẫn về công nghệ số cũng nói rất rõ: công nghệ khó có tác động chỉ bằng việc đưa vào lớp học; nó phải cải thiện chất lượng dạy học, feedback, practice, assessment hoặc quản lý workload theo cách gắn với mục tiêu sư phạm (EEF, 2019). Hai nguồn này cùng nói một điều: công nghệ không tự định nghĩa giá trị giáo dục. Thiết kế mới định nghĩa.

Chương này là cầu nối từ phần phân tích sang phần kết của cuốn sách. Chương 24 sẽ nói về những câu hỏi nghiên cứu còn mở. Trước khi đi vào câu hỏi mở, ta cần một bộ nguyên tắc đủ chặt để không bị cuốn theo công nghệ mới tiếp theo, dù đó là GenAI, agentic AI, XR, brain-computer interface, learning analytics đa phương thức hay một hình thái chưa có tên. Công nghệ sẽ đổi. Nguyên tắc thiết kế học tập có trách nhiệm cần bền hơn chu kỳ sản phẩm.

Nền tảng lý thuyết

Bộ nguyên tắc này dựa trên năm nền tảng.

Nền tảng thứ nhất là khoa học học tập. Người học không học sâu chỉ vì được tiếp xúc với nội dung. Họ học khi phải chú ý vào thông tin liên quan, kết nối với kiến thức nền, truy hồi, giải thích, luyện tập có phản hồi, phân biệt dạng vấn đề, chuyển giao sang bối cảnh mới, phản tư và tham gia vào cộng đồng tri thức. Dunlosky và cộng sự năm 2013 tổng quan nhiều kỹ thuật học tập và cho thấy retrieval practice và distributed practice có bằng chứng mạnh hơn nhiều kỹ thuật phổ biến như rereading hoặc highlighting (Dunlosky et al., 2013). Chi và Wylie với khung ICAP phân biệt mức tương tác passive, active, constructive và interactive, nhấn mạnh rằng hoạt động tạo nghĩa và đối thoại thường sâu hơn thao tác bề mặt (Chi & Wylie, 2014). Mayer trong cognitive theory of multimedia learning cho thấy thiết kế đa phương tiện phải quản trị tải nhận thức và hướng chú ý, không chỉ thêm hình ảnh, âm thanh hoặc animation (Mayer, 2021).

Nền tảng thứ hai là feedback và assessment for learning. Feedback có hiệu quả khi nó giúp người học hiểu khoảng cách giữa hiện tại và mục tiêu, biết hành động tiếp theo, và có cơ hội dùng phản hồi để sửa. Hattie và Timperley mô tả feedback qua ba câu hỏi: Where am I going? How am I going? Where to next? (Hattie & Timperley, 2007). Shute nhấn mạnh formative feedback nên cụ thể, liên quan đến nhiệm vụ, dễ dùng, và tránh làm quá tải hoặc đe dọa người học (Shute, 2008). Brummer và cộng sự meta-analysis năm 2024 về 116 can thiệp feedback số cho thấy hiệu ứng trung bình tích cực nhưng biến thiên mạnh theo focus, môn học, loại đánh giá, learner control và publication bias (Brummer et al., 2024). Điều này củng cố luận điểm: “có feedback” không đủ; feedback phải đi vào vòng hành động.

Nền tảng thứ ba là động lực và self-regulated learning. Self-Determination Theory cho rằng động lực bền liên quan đến autonomy, competence và relatedness (Ryan & Deci, 2017). EdTech dễ hỗ trợ competence bằng phản hồi tức thời, nhưng cũng dễ làm sai autonomy bằng lộ trình máy quyết định và làm yếu relatedness nếu người học bị cô lập trong tương tác cá nhân hóa. Self-regulated learning nhắc rằng người học cần đặt mục tiêu, lập kế hoạch, giám sát, điều chỉnh và phản tư. AI có thể hỗ trợ các pha này, nhưng chỉ khi thiết kế giữ agency thay vì làm thay.

Nền tảng thứ tư là implementation science và evidence-informed practice. Một công cụ có bằng chứng không tự tạo tác động trong tổ chức thật. EEF bản cập nhật 2024 về implementation nhấn mạnh Explore, Prepare, Deliver, Sustain, đồng thời xem implementation là quá trình xã hội và thực hành ra quyết định dựa trên bằng chứng (Sharples et al., 2024). Ryan và cộng sự scoping review năm 2024 về scaling intervention trong trường học cho thấy cần báo cáo bối cảnh, rào cản, thuận lợi, implementation outcomes và intervention outcomes, thay vì chỉ đo fidelity hoặc kết quả cuối (Ryan et al., 2024). Chương 20 đã dùng nền này để nói rằng EdTech phải được đọc theo điều kiện triển khai.

Nền tảng thứ năm là AI/data governance và thiết kế lấy con người làm trung tâm. NIST AI Risk Management Framework đặt quản trị AI qua Govern, Map, Measure, Manage (NIST, 2023). OECD AI Principles nhấn mạnh human-centred values, fairness, transparency, robustness và accountability (OECD, 2024). UNESCO AI competency frameworks cho học sinh và giáo viên đặt human-centred mindset, ethics và AI pedagogy vào trung tâm (Miao et al., 2024; Miao & Cukurova, 2024). Những khung này nhắc rằng EdTech AI không chỉ cần hoạt động đúng về kỹ thuật; nó cần chính đáng về quyền, công bằng và trách nhiệm.

Từ năm nền tảng này, bộ nguyên tắc trong chương không phải ý kiến cảm tính. Nó là bản tóm tắt thực dụng của những gì khoa học học tập, đánh giá, động lực, triển khai, dữ liệu và kinh tế học đã nói trong các chương trước.

1. Bắt Đầu Từ Nhiệm Vụ Học Tập, Không Từ Tính Năng

Nguyên tắc đầu tiên: công nghệ chỉ được thêm khi nó giải quyết một khoảng cách học tập hoặc vận hành cụ thể. Nếu không có khoảng cách rõ, công nghệ sẽ tự tạo mục tiêu cho nó. Khi đó, ta bắt đầu tối ưu số lượt dùng, số tài nguyên tạo, số phút trong app, số prompt, số báo cáo, số câu hỏi, số dashboard. Những con số ấy có thể hữu ích, nhưng chúng không tự trả lời câu hỏi học tập.

Một thiết kế tốt bắt đầu bằng câu: người học đang kẹt ở đâu? Họ không nhớ kiến thức nền, không phân biệt dạng bài, không nhận feedback kịp, không biết tự đánh giá, không có cơ hội luyện tập, không tiếp cận được nội dung, không thấy ý nghĩa, không có người hỗ trợ, hay bị đánh giá bằng sản phẩm cuối dễ được AI tạo? Mỗi vấn đề cần một giải pháp khác nhau. Nếu học sinh không nhớ, giải pháp có thể là retrieval và spacing. Nếu không hiểu vì sao sai, cần feedback và misconception analysis. Nếu không biết bắt đầu viết, cần scaffold và ví dụ. Nếu không tự chủ, cần SRL support. Nếu giáo viên không thấy lỗi lớp, cần analytics theo cụm lỗi. Nếu dữ liệu phân mảnh, cần hạ tầng và interoperability, không phải chatbot.

Nhiều sản phẩm EdTech bắt đầu ngược: có AI, có gamification, có avatar, có dashboard, có adaptive path, rồi tìm chỗ đặt vào học tập. Cách này dễ dẫn đến feature-first design. Một hệ thống có thể có AI tutor nhưng bài tập vẫn nông. Có thể có adaptive learning nhưng chỉ cá nhân hóa drill. Có thể có dashboard nhưng không có can thiệp. Có thể có VR nhưng thiếu debrief. Có thể có AI feedback nhưng không có cơ hội sửa. Có thể có recommendation nhưng không rõ mục tiêu học.

Task-first design yêu cầu mô tả đơn vị học tập cụ thể. Không nói chung “nâng cao tư duy phản biện”. Hãy nói: người học cần đọc hai nguồn có quan điểm khác nhau, xác định luận điểm, so sánh bằng chứng, viết một phản biện có trích dẫn, nhận feedback, sửa lại, và bảo vệ lựa chọn trước nhóm. Khi nhiệm vụ rõ, vai trò công nghệ mới rõ. AI có thể giúp tạo câu hỏi phản biện, nhưng không viết thay. Dashboard có thể giúp giáo viên thấy nhóm nào chưa dùng bằng chứng, nhưng không chấm tự động toàn bộ lập luận. Peer review có thể dùng rubric số, nhưng vẫn cần đối thoại.

Một công cụ tốt nên trả lời được bốn câu hỏi:

1. Nhiệm vụ học tập hoặc vận hành cụ thể là gì? 2. Người học hoặc giáo viên đang gặp rào cản nào? 3. Công nghệ thay đổi cơ chế nào trong nhiệm vụ đó? 4. Làm sao biết rào cản đã giảm mà mục tiêu học không bị thay đổi sai?

Ví dụ, nếu mục tiêu là học viết luận, rào cản có thể là người học không nhận ra luận điểm yếu. AI có thể đóng vai người phản biện, hỏi về bằng chứng và giả định. Nhưng nếu AI viết lại đoạn văn hoàn chỉnh quá sớm, nó thay đổi mục tiêu từ học lập luận sang chỉnh sản phẩm. Nếu mục tiêu là luyện phát âm ngoại ngữ, AI speech feedback có thể giúp luyện nhiều hơn, nhưng nếu mô hình không hiểu giọng vùng miền hoặc chỉ chấm giống native accent, mục tiêu bị lệch từ giao tiếp rõ sang bắt chước chuẩn hẹp. Nếu mục tiêu là giảm workload giáo viên, AI tạo worksheet không đủ; phải xem worksheet có được dùng không, có thay thế việc cũ không, và giáo viên có tiết kiệm thời gian tổng thể không.

Task-first design cũng giúp tránh techno-solutionism. Không phải mọi vấn đề học tập cần công nghệ. Nếu người học không hiểu tiêu chí, giải pháp đầu tiên có thể là rubric rõ và ví dụ bài mẫu. Nếu học sinh không đọc, có thể cần thời gian đọc trong lớp và câu hỏi truy hồi, không phải app mới. Nếu giáo viên không phản hồi kịp vì sĩ số quá đông, AI có thể hỗ trợ, nhưng tổ chức cũng cần xem workload, lịch, và cách thiết kế bài. Nếu phụ huynh không nhận thông báo, có thể vấn đề là kênh truyền thông, ngôn ngữ hoặc niềm tin, không phải chatbot.

Một câu hỏi hữu ích là: “Nếu không dùng công nghệ mới, giải pháp sư phạm tốt nhất là gì?”. Nếu không trả lời được, ta chưa hiểu vấn đề. Công nghệ nên được so với một baseline tốt, không phải so với khoảng trống. Chương 2 đã nhấn mạnh baseline quyết định cách đọc hiệu quả. Một AI feedback tool dễ thắng nếu baseline là không feedback; khó hơn nếu baseline là peer review có rubric và giáo viên debrief tốt. Một AI tutor dễ trông mạnh nếu baseline là học sinh tự học không hỗ trợ; câu hỏi khó hơn là nó có thêm giá trị gì so với nhóm nhỏ, worksheet tốt, hoặc formative assessment do giáo viên dùng đúng.

Task-first design còn giúp procurement. Thay vì RFP yêu cầu “có GenAI, adaptive path, dashboard, gamification, parent report”, tổ chức có thể yêu cầu “giải pháp giúp giáo viên lớp 6 phát hiện ba misconception phổ biến trong phân số trong vòng một tuần, gợi nhóm hỗ trợ, và giảm thời gian chấm formative quiz mà vẫn có cơ hội sửa bài cho học sinh”. Yêu cầu sau ít lấp lánh hơn, nhưng làm vendor phải chứng minh fit.

Nguyên tắc này không chống tính năng mới. Tính năng mới có thể mở ra nhiệm vụ mới. GenAI cho phép AI as tutee, role-play, phản biện nhiều vai, tạo ví dụ cá nhân hóa. VR cho phép tình huống hiếm hoặc nguy hiểm. Learning analytics cho phép nhìn mẫu lỗi ở quy mô lớp. Nhưng ngay cả khi công nghệ mở ra khả năng mới, ta vẫn phải quay lại nhiệm vụ: khả năng này phục vụ cơ chế học nào, cho ai, trong điều kiện nào?

Một thiết kế EdTech thực chứng nên có “task statement” trước “feature list”. Nếu không viết được task statement, chưa nên viết roadmap.

2. Giữ Ma Sát Nhận Thức Đúng Chỗ

Nguyên tắc thứ hai: giảm ma sát thao tác, không xóa nỗ lực học cần thiết. Đây là một trong những điểm khó nhất khi đưa AI và automation vào giáo dục, vì phần mềm tốt thường được hiểu là làm mọi thứ nhanh hơn, ít bước hơn, dễ hơn. Trong nhiều bối cảnh, điều đó đúng. Đăng nhập nên dễ hơn. Gửi bài nên ít lỗi hơn. Tìm tài liệu nên nhanh hơn. Phụ đề nên tự động hơn. Giáo viên không nên nhập điểm ba lần. Người học khuyết tật không nên phải vật lộn với PDF không đọc được. Ma sát thao tác là lãng phí.

Nhưng học tập cần một số ma sát nhận thức. Truy hồi khó hơn đọc lại, nhưng giúp nhớ bền hơn. Tự giải thích mất thời gian hơn xem lời giải, nhưng giúp hiểu cấu trúc. Dự đoán trước khi xem mô phỏng tạo căng thẳng nhận thức, nhưng giúp người học nhận ra mô hình của mình. Viết nháp vụng về khó chịu hơn để AI viết bản trơn, nhưng bản nháp là nơi tư duy hiện ra. So sánh hai nguồn mệt hơn đọc tóm tắt, nhưng đó là nơi critical thinking được luyện. Nhận feedback và sửa lại không thoải mái, nhưng feedback không dùng thì không tạo học.

Chương 13 đã nhấn mạnh retrieval, spacing, interleaving và mastery. Chương 14 đã nói về tải nhận thức: cần giảm extraneous load, quản trị intrinsic load và nuôi germane load. Chương 15 gọi tên intentional friction: làm chậm người học ở đúng điểm để bảo vệ suy nghĩ. Nguyên tắc ở đây là phân biệt ba loại ma sát.

Loại thứ nhất là ma sát thao tác. Đây là thứ nên giảm: đăng nhập khó, giao diện rối, file không mở được, caption thiếu, đường truyền yếu, yêu cầu copy-paste nhiều nơi, tài khoản lỗi, quy trình nộp bài dài, dashboard không tìm được thông tin. Ma sát này lấy năng lượng khỏi học tập.

Loại thứ hai là ma sát nhận thức có ích. Đây là thứ nên giữ hoặc thiết kế tốt hơn: nhớ lại, giải thích, lập luận, chọn chiến lược, kiểm chứng nguồn, so sánh phương án, tự đánh giá, sửa bài, phản biện, thử lại. Ma sát này là nơi năng lực phát triển.

Loại thứ ba là ma sát cảm xúc-xã hội cần chăm sóc. Sai, bị phản biện, nói trước nhóm, nhận điểm thấp, thừa nhận chưa hiểu đều có thể khó. Không nên xóa hết khó khăn này, nhưng phải tạo môi trường an toàn để người học chịu được khó khăn. AI có thể giúp rehearsal và giảm xấu hổ ban đầu, nhưng không nên làm người học tránh mọi tương tác người thật.

AI dễ xóa nhầm loại ma sát thứ hai. Khi người học hỏi “tóm tắt bài này”, AI có thể tóm tắt ngay, nhưng nếu mục tiêu là đọc hiểu, nó đã xóa phần đọc. Khi hỏi “giải bài này”, AI có thể đưa lời giải, nhưng nếu mục tiêu là problem solving, nó xóa chiến lược. Khi yêu cầu “viết giúp đoạn mở bài”, AI có thể làm trơn câu chữ, nhưng nếu mục tiêu là lập luận, nó có thể che mất việc người học chưa có luận điểm. Khi giáo viên yêu cầu “tạo câu hỏi kiểm tra”, AI có thể sinh nhiều câu, nhưng nếu giáo viên không phân tích cognitive demand, ngân hàng câu hỏi đầy nhưng nông.

Thiết kế tốt dùng friction theo mức rủi ro của nhiệm vụ. Với câu hỏi tra cứu thấp rủi ro, trả lời nhanh là hợp lý. Với bài tập hình thành năng lực, nên có bước: “em đã thử gì?”, “hãy dự đoán trước”, “hãy tự đánh giá”, “hãy chọn tiêu chí feedback”, “hãy giải thích vì sao giữ/sửa đề xuất AI”. Với nhiệm vụ đánh giá hoặc ra quyết định, cần friction mạnh hơn: nguồn, bằng chứng, phản biện, khai báo AI, human review.

Ví dụ, một AI tutor toán có thể không đưa lời giải ngay. Nó có thể bắt đầu bằng câu hỏi chẩn đoán: “Em nghĩ bước đầu là gì?”. Nếu người học sai, AI gợi ý nhẹ: “Hãy xem mẫu số có giống nhau không”. Nếu vẫn kẹt, AI đưa ví dụ tương tự, không cùng bài. Nếu người học yêu cầu đáp án, hệ thống hỏi confidence và yêu cầu giải thích lại sau khi xem. Sau bài, người học làm một bài transfer không có hint. Đây là ma sát đúng chỗ.

Một AI writing assistant có thể yêu cầu người học nộp luận điểm và outline trước khi nhận feedback. Nó có thể phản hồi bằng câu hỏi thay vì viết lại. Nó có thể giới hạn số sửa câu tự động và yêu cầu người học chọn ba thay đổi quan trọng nhất. Nó có thể hiển thị “phần AI gợi ý” và yêu cầu phản tư. Như vậy, AI không xóa quá trình viết; nó làm quá trình viết rõ hơn.

Một learning analytics dashboard có thể giảm ma sát tìm dữ liệu cho giáo viên, nhưng giữ ma sát phán đoán. Dashboard không nên tự động nói “chuyển em này sang nhóm yếu”. Nó nên hiển thị bằng chứng, mức chắc chắn, ngoại lệ và câu hỏi gợi ý: “nhóm này sai cùng một misconception”, “dữ liệu online thấp nhưng bài giấy chưa có”, “cần kiểm tra với quan sát lớp”. Giáo viên vẫn phải quyết định.

Một nguyên tắc phụ là “AI nên làm chậm đúng lúc và nhanh đúng chỗ”. Nhanh ở phần truy cập, chuyển đổi định dạng, tìm tài nguyên, tạo bản nháp thấp rủi ro, phân nhóm lỗi, dịch hỗ trợ, caption, alt text. Chậm ở phần hình thành hiểu biết: dự đoán, tự giải thích, kiểm chứng, phản biện, quyết định, phản tư. Nếu một sản phẩm luôn tối ưu nhanh hơn, nó chưa hiểu học tập.

Ma sát cũng cần giảm dần. Scaffold tốt không giữ người học phụ thuộc. Ban đầu có thể nhiều gợi ý, nhiều cấu trúc, nhiều câu hỏi. Khi người học mạnh hơn, hệ thống rút dần hỗ trợ, yêu cầu tự chọn chiến lược, tự kiểm tra, tự đặt mục tiêu. Mastery không phải làm bài đến khi hệ thống nói đủ; mastery là người học dần cần ít scaffold hơn trong nhiệm vụ tương tự và dùng được kiến thức trong bối cảnh mới.

Điểm cân bằng này cần bằng chứng. Nếu thêm friction quá nhiều, người học chán, overload hoặc bỏ cuộc. Nếu friction quá ít, học nông. Vì vậy, thiết kế cần đo không chỉ completion và satisfaction, mà cả effort quality, self-explanation, feedback uptake, transfer và dependency. Một chatbot được yêu thích vì làm bài dễ hơn chưa chắc tốt. Một bài học khó chịu vừa phải nhưng làm người học hiểu sâu có thể có giá trị hơn. Nhưng khó chịu không phải mục tiêu tự thân; nó phải phục vụ cơ chế học.

3. Phản Hồi Phải Dẫn Đến Hành Động

Nguyên tắc thứ ba: dashboard, điểm số và nhận xét vô dụng nếu người học hoặc giáo viên không biết làm gì tiếp. Phản hồi là một trong những lời hứa lớn nhất của EdTech. Công nghệ có thể cho feedback tức thời, nhiều vòng, cá nhân hóa, theo rubric, theo lỗi, qua text, audio, video, code, simulation hoặc dashboard. AI làm phản hồi rẻ và phong phú hơn. Nhưng phản hồi nhiều hơn không tự động tốt hơn. Phản hồi chỉ có giá trị khi nó dẫn đến hành động học.

Hattie và Timperley đặt feedback vào ba câu hỏi: mục tiêu là gì, hiện tại đang ở đâu, bước tiếp theo là gì (Hattie & Timperley, 2007). Trong EdTech, nhiều hệ thống trả lời câu thứ hai quá mức: bạn đúng 7/10, yếu kỹ năng X, engagement thấp, bài viết có 12 lỗi, risk score cao. Nhưng chúng trả lời câu thứ ba kém: làm gì tiếp, trong bao lâu, với tài nguyên nào, ai hỗ trợ, khi nào kiểm tra lại. Một dashboard nói “lớp yếu phân số” nhưng không gợi hoạt động dạy lại, không cho ví dụ bài sai, không phân nhóm misconception, không có thời gian trong lịch, chỉ tạo lo lắng. Một AI feedback nói “cần lập luận rõ hơn” nhưng không chỉ đoạn nào, vì sao, và người học sửa ra sao, chỉ tạo tiếng ồn.

Phản hồi có thể thất bại theo sáu cách.

Thứ nhất, quá mơ hồ. “Good job”, “cần cố gắng hơn”, “lập luận chưa sâu” không đủ. Người học cần biết cụ thể vấn đề nằm ở đâu và tiêu chí nào bị lệch.

Thứ hai, quá nhiều. Một bài nhận hàng chục góp ý làm người học tê liệt. AI dễ tạo nhiều feedback vì chi phí thấp. Nhưng phản hồi tốt thường ưu tiên một vài điểm có leverage cao.

Thứ ba, quá muộn. Feedback sau khi chủ đề đã qua, điểm đã đóng, hoặc người học không có cơ hội sửa sẽ ít tác dụng. Công nghệ có thể giúp nhanh hơn, nhưng chỉ nếu workflow cho phép sửa.

Thứ tư, làm thay. Nếu AI sửa câu hoàn chỉnh, giải bài hoàn chỉnh, hoặc viết code hoàn chỉnh, người học có sản phẩm tốt hơn nhưng không chắc năng lực tốt hơn.

Thứ năm, sai trọng tâm. AI sửa ngữ pháp trong khi vấn đề là luận điểm; dashboard báo thời gian online trong khi vấn đề là hiểu sai khái niệm; feedback code sửa syntax trong khi mục tiêu là thiết kế thuật toán.

Thứ sáu, không có uptake. Người học đọc feedback rồi bỏ qua; giáo viên xem dashboard rồi không có thời gian can thiệp; tổ chức có báo cáo nhưng không đổi quy trình. Feedback không được dùng thì không phải feedback, chỉ là thông tin.

Thiết kế phản hồi hành động cần bốn thành phần: tiêu chí, chẩn đoán, hành động và vòng lặp.

Tiêu chí: người học phải hiểu chất lượng là gì. Rubric, ví dụ mẫu, contrast cases và self-assessment giúp feedback có chỗ bám. Nếu người học không hiểu tiêu chí, feedback biến thành lời khuyên rời.

Chẩn đoán: feedback phải chỉ đúng vấn đề có thể hành động. Không phải mọi lỗi đều quan trọng như nhau. Một hệ thống tốt phân biệt lỗi bề mặt, misconception, thiếu chiến lược, thiếu kiến thức nền, thiếu nỗ lực, hoặc lỗi do giao diện.

Hành động: feedback phải nói bước tiếp theo. Sửa đoạn nào, luyện dạng nào, xem ví dụ nào, hỏi ai, thử chiến lược nào, làm bài transfer nào, đặt mục tiêu nào.

Vòng lặp: người học phải có cơ hội dùng feedback và nhận phản hồi tiếp. Nếu không có vòng sửa, feedback không tạo học.

AI có thể hỗ trợ cả bốn thành phần nếu được thiết kế đúng. Nó có thể tạo rubric dễ hiểu, đưa ví dụ đối chiếu, phân loại lỗi theo cụm, gợi bài luyện, đặt câu hỏi Socratic, theo dõi bản sửa, và yêu cầu reflection. Nhưng AI cũng có thể phá cả bốn nếu feedback trôi chảy nhưng thiếu tiêu chí, nếu chẩn đoán sai, nếu hành động là “đây là bản sửa”, hoặc nếu không có người thật xem trường hợp quan trọng.

Với giáo viên, dashboard cũng phải là feedback dẫn đến hành động. Một dashboard tốt không hỏi giáo viên tự diễn giải 20 biểu đồ. Nó trả lời: nhóm nào cần chú ý, bằng chứng là gì, hành động gợi ý là gì, thời gian cần bao nhiêu, có tài nguyên nào, trường hợp nào cần human check, và sau can thiệp đo gì. Chương 8 đã nói một cảnh báo rủi ro chỉ có giá trị nếu có can thiệp kèm theo. Nếu không, dashboard chỉ chuyển trách nhiệm lên giáo viên.

Với tổ chức, báo cáo analytics phải dẫn đến quyết định. Nếu dữ liệu cho thấy học sinh vùng mạng yếu ít hoàn thành bài online, hành động có thể là offline mode hoặc thiết bị mượn, không phải email nhắc. Nếu dữ liệu cho thấy giáo viên không dùng AI tool, hành động có thể là giảm tool sprawl hoặc training theo môn, không phải nhắc họ dùng. Nếu dữ liệu cho thấy bản premium tạo lợi thế, hành động là chính sách truy cập, không phải báo cáo market success.

Một thiết kế phản hồi tốt nên có “feedback contract”: ai nhận feedback, nhận khi nào, phải làm gì, có thời gian làm không, ai hỗ trợ, và làm sao biết feedback được dùng. Với người học, contract có thể là: nhận feedback về hai tiêu chí, sửa trong 20 phút, nộp bản phản tư ngắn. Với giáo viên: xem error clusters vào thứ Tư, chọn một mini-lesson, dạy lại thứ Năm, kiểm tra lại thứ Sáu. Với tổ chức: xem adoption và workload sau 6 tuần, quyết định sửa hoặc dừng pilot.

Một nguyên tắc phụ: feedback cần bảo vệ metacognition. Trước feedback, yêu cầu người học tự đánh giá. Trong feedback, không đưa quá nhiều lời giải. Sau feedback, yêu cầu người học chọn hành động và giải thích lựa chọn. Bằng cách đó, feedback không chỉ sửa sản phẩm; nó dạy người học học từ sản phẩm.

Brummer và cộng sự cho thấy feedback số có hiệu quả trung bình tích cực, nhưng biến thiên lớn (Brummer et al., 2024). Bài học không phải “feedback số tốt” hay “feedback số không tốt”. Bài học là phải thiết kế điều kiện feedback. Trong EdTech thực chứng, feedback không phải tính năng. Nó là vòng hành động.

4. Cá Nhân Hóa Có Giới Hạn Đạo Đức

Nguyên tắc thứ tư: không cá nhân hóa đến mức cô lập người học, khóa cơ hội hoặc thao túng động lực. Cá nhân hóa là lời hứa lâu đời của EdTech. Mỗi người học có tốc độ riêng, lỗ hổng riêng, mục tiêu riêng, sở thích riêng. AI làm lời hứa này mạnh hơn: hệ thống có thể phân tích dữ liệu, tạo bài phù hợp, phản hồi riêng, gợi lộ trình, điều chỉnh độ khó, dịch ngôn ngữ, tạo ví dụ gần đời sống. Được dùng đúng, cá nhân hóa có thể giảm rào cản và mở quyền tham gia.

Nhưng cá nhân hóa cũng là vùng rủi ro đạo đức. Nó có thể cá nhân hóa nội dung nhưng chuẩn hóa mục tiêu. Nó có thể cho người học bài “phù hợp” nhưng giữ họ ở mức thấp. Nó có thể tối ưu engagement bằng nhắc nhở, streak và phần thưởng. Nó có thể cô lập người học trong đường học riêng, làm giảm peer learning. Nó có thể dùng dữ liệu quá sâu để dự đoán hành vi. Nó có thể tạo self-fulfilling prophecy: hệ thống nghĩ người học yếu, cho bài dễ hơn, người học ít cơ hội học sâu hơn, rồi dữ liệu xác nhận em yếu.

Cá nhân hóa tốt cần phân biệt ít nhất năm loại.

Thứ nhất là cá nhân hóa truy cập. Đây là vùng có giá trị đạo đức cao: caption, text-to-speech, speech-to-text, translation, alternative formats, font dễ đọc, low-bandwidth, assistive interface. Nó giúp người học bước vào hoạt động. Chương 9 và 18 đã nhấn mạnh UDL: nhiều cách tiếp cận, biểu đạt và tham gia.

Thứ hai là cá nhân hóa mức độ hỗ trợ. Người học mới cần nhiều scaffold hơn, người học mạnh cần thử thách hơn. AI có thể gợi hint theo tầng, ví dụ tương tự, bài luyện bổ sung. Nhưng scaffold phải rút dần và kiểm tra transfer.

Thứ ba là cá nhân hóa nội dung và ví dụ. Ví dụ gần sở thích hoặc bối cảnh có thể tăng ý nghĩa. Nhưng nếu cá nhân hóa quá mức theo sở thích hiện tại, người học ít gặp thế giới ngoài vùng quen. Giáo dục cũng phải mở rộng chân trời.

Thứ tư là cá nhân hóa tốc độ và lộ trình. Người học cần thời gian khác nhau. Nhưng lộ trình không nên trở thành đường ray kín. Người học cần hiểu vì sao hệ thống gợi bước tiếp theo, có quyền chọn, và có cơ hội vào nhiệm vụ khó.

Thứ năm là cá nhân hóa động lực. Đây là vùng rủi ro cao. Hệ thống có thể biết lúc nào người học dễ bỏ và gửi nhắc. Có thể điều chỉnh phần thưởng. Có thể dùng so sánh xã hội. Nếu mục tiêu là học bền, cá nhân hóa động lực phải hỗ trợ autonomy, competence và relatedness, không thao túng hành vi để tăng time-on-platform.

Cá nhân hóa có giới hạn đạo đức cần năm guardrails.

Guardrail thứ nhất: minh bạch. Người học và giáo viên cần biết hệ thống cá nhân hóa dựa trên dữ liệu nào và mục tiêu nào. Nếu hệ thống âm thầm điều chỉnh độ khó, nguồn, phản hồi hoặc cơ hội, người học mất quyền hiểu quá trình học của mình.

Guardrail thứ hai: quyền kiểm soát. Người học không nhất thiết quyết định mọi thứ, nhưng cần có lựa chọn có ý nghĩa: yêu cầu giải thích, chọn mục tiêu, đổi mức hỗ trợ, tắt một số cá nhân hóa, hoặc hỏi giáo viên. Giáo viên cần quyền override.

Guardrail thứ ba: không khóa cơ hội. Hệ thống không nên dùng dữ liệu quá khứ để giới hạn tương lai. Một người học có điểm thấp cần hỗ trợ, nhưng vẫn cần cơ hội vào nhiệm vụ giàu tư duy. Một learner profile không nên trở thành bản án.

Guardrail thứ tư: không cô lập xã hội. Cá nhân hóa nên xen với hoạt động nhóm, peer learning, thảo luận, debrief và cộng đồng. Người học không chỉ cần lộ trình riêng; họ cần học cách tham gia vào thực hành chung.

Guardrail thứ năm: tối thiểu hóa dữ liệu. Không cá nhân hóa bằng dữ liệu nhạy cảm nếu không cần. Không dùng wellbeing, cảm xúc, sinh trắc hoặc dữ liệu gia đình để tối ưu học tập nếu không có cơ sở đạo đức mạnh và governance rõ.

Một câu hỏi thiết kế tốt là: “Cá nhân hóa này làm người học ngày càng tự chủ hơn hay ngày càng phụ thuộc hơn?”. Nếu hệ thống luôn chọn bài, chọn mục tiêu, nhắc giờ học, sửa lỗi, đánh giá, động viên và quyết định bước tiếp theo, người học có thể hoàn thành nhiều hơn nhưng tự chủ ít hơn. Cá nhân hóa tốt nên chuyển dần quyền sang người học: ban đầu gợi ý, sau đó yêu cầu người học chọn, cuối cùng giúp người học tự lập kế hoạch.

Một câu hỏi khác: “Cá nhân hóa này dựa trên asset hay deficit?”. Hệ thống thường phát hiện lỗi và lỗ hổng. Điều này hữu ích, nhưng nếu chỉ nhìn deficit, người học trở thành danh sách thiếu hụt. Asset-based personalization hỏi thêm: người học có kinh nghiệm, ngôn ngữ, chiến lược, sở thích, quan hệ và thế mạnh nào có thể dùng để học tiếp? Chương 16 và 18 đã nhấn mạnh asset-based assessment và inclusive pedagogy. Cá nhân hóa đạo đức không chỉ sửa lỗi; nó xây trên nguồn lực.

Một ví dụ cá nhân hóa tốt: hệ thống đọc hiểu phát hiện học sinh gặp khó với từ học thuật, cung cấp glossary song ngữ, yêu cầu dự đoán ý trước khi đọc, cho lựa chọn nghe audio, gợi thảo luận nhóm, và sau đó giảm dần glossary khi người học tiến bộ. Một ví dụ rủi ro: hệ thống thấy học sinh đọc chậm, tự động chỉ đưa văn bản dễ hơn, không cho tiếp cận văn bản giàu ý tưởng, và báo với phụ huynh rằng em “low ability”.

Cá nhân hóa không phải mục tiêu cuối. Mục tiêu là học tập công bằng, sâu và tự chủ hơn. Nếu cá nhân hóa không phục vụ ba thứ đó, nó chỉ là tối ưu hóa hành vi cá nhân.

5. Teacher-In-The-Loop Theo Nghĩa Thật

Nguyên tắc thứ năm: giáo viên có quyền phán đoán, chỉnh sửa, phủ quyết và học từ hệ thống. “Teacher-in-the-loop” dễ trở thành khẩu hiệu. Nhiều sản phẩm nói giáo viên vẫn kiểm soát, nhưng thực tế giáo viên chỉ xem kết quả cuối, bấm duyệt, hoặc chịu trách nhiệm khi AI sai. Teacher-in-the-loop thật phải nằm ở nhiều điểm của vòng thiết kế và vận hành: mục tiêu, dữ liệu, tiêu chí, hoạt động, phản hồi, đánh giá, can thiệp và cải tiến hệ thống.

Chương 19 đã định nghĩa teacher agency qua quyền thấy, quyền quyết định, quyền điều chỉnh và quyền phản biện. Với EdTech thực chứng, bốn quyền này phải được thiết kế vào sản phẩm và tổ chức.

Quyền thấy: giáo viên cần hiểu dữ liệu, logic gợi ý, mức chắc chắn, giới hạn và bằng chứng. Một dashboard chỉ đưa nhãn đỏ-vàng-xanh không đủ. Một AI scoring tool chỉ đưa điểm không đủ. Một tutor report chỉ nói “mastery 78%” không đủ. Giáo viên cần thấy lỗi mẫu, bài làm đại diện, tiêu chí, ngoại lệ và lịch sử hỗ trợ.

Quyền quyết định: giáo viên cần chọn khi nào dùng AI, dùng ở mức nào, với nhiệm vụ nào. Họ cần có quyền nói “bài này không dùng AI”, “ở đây AI chỉ phản biện”, “ở đây AI tạo bản nháp nhưng học sinh phải giải thích”, “cảnh báo này cần kiểm tra thêm”, “em này cần gặp người thật”.

Quyền điều chỉnh: giáo viên cần sửa prompt, rubric, nhóm học sinh, feedback template, lộ trình, tài liệu và can thiệp. Nếu hệ thống không cho chỉnh, giáo viên bị biến thành người dùng bị khóa.

Quyền phản biện: giáo viên cần kênh báo lỗi, bias, workload, policy bất hợp lý và rủi ro dữ liệu. Phản hồi phải đi vào product improvement hoặc governance. Nếu không, co-design chỉ là lời nói.

Teacher-in-the-loop cũng cần tránh hai cực đoan. Cực thứ nhất là teacher-as-bottleneck: mọi thứ phải chờ giáo viên duyệt thủ công, làm AI không giảm tải. Cực thứ hai là teacher-as-rubber-stamp: AI làm gần hết, giáo viên duyệt hình thức. Thiết kế tốt phân tầng. Tác vụ low-risk có thể tự động hóa nhiều hơn. Tác vụ high-stakes cần human review sâu. Hệ thống nên ưu tiên trường hợp biên, bất thường, rủi ro cao để giáo viên tập trung phán đoán nơi cần nhất.

Ví dụ, AI feedback formative cho bài luyện có thể gửi gợi ý tức thời nếu mức rủi ro thấp, nhưng giáo viên xem summary lỗi theo cụm. Với bài luận tính điểm, AI chỉ hỗ trợ phân tích rubric; giáo viên chấm và có quyền bỏ gợi ý. Với risk prediction, hệ thống không tự động đổi lộ trình; nó báo tín hiệu và gợi câu hỏi check-in. Với wellbeing, AI không tư vấn sâu; nó hướng tới người lớn có trách nhiệm theo quy trình.

Teacher-in-the-loop thật cũng là professional learning loop. Hệ thống không chỉ đưa dữ liệu cho giáo viên; nó giúp giáo viên học từ dữ liệu. Một error clustering tool tốt không chỉ nói học sinh sai gì, mà giúp tổ chuyên môn hỏi: bài dạy trước đã tạo misconception nào, ví dụ nào gây nhầm, câu hỏi nào cần đổi, can thiệp nào hiệu quả. Một AI lesson planning tool tốt không chỉ tạo giáo án, mà giúp giáo viên so sánh phương án, thấy trade-off, và phát triển PCK. Một dashboard tốt không chỉ theo dõi học sinh, mà làm cuộc họp chuyên môn tốt hơn.

UNESCO teacher AI competency framework đặt AI pedagogy và AI for professional learning vào năng lực giáo viên (Miao & Cukurova, 2024). Điều này quan trọng: giáo viên không chỉ dùng AI để làm nhanh hơn; họ dùng AI để nhìn sâu hơn và phát triển nghề. Nếu công nghệ chỉ làm giáo viên sản xuất nhiều nội dung hơn, nó có thể tăng output nhưng không tăng chuyên môn.

Teacher-in-the-loop cũng cần điều kiện tổ chức. Không thể yêu cầu giáo viên phán đoán nếu không có thời gian, training, dữ liệu dễ hiểu, support và quyền. Một giáo viên quá tải sẽ dễ tin AI hoặc bỏ qua AI. Một giáo viên không được đào tạo về data literacy sẽ khó đọc dashboard. Một giáo viên không có quyền sửa policy sẽ bất lực trước lỗi hệ thống. Vì vậy, teacher-in-the-loop là thiết kế tổ chức, không chỉ thiết kế giao diện.

Một câu hỏi kiểm tra mạnh: “Nếu AI sai, giáo viên có đủ thông tin, thời gian và quyền để phát hiện và sửa không?”. Nếu không, hệ thống không nên dùng cho tác vụ có rủi ro cao. Một câu hỏi khác: “Sau ba tháng dùng công cụ, giáo viên có hiểu học sinh và môn học tốt hơn không, hay chỉ học cách vận hành nền tảng?”. Nếu chỉ là vận hành, teacher-in-the-loop chưa đạt.

Teacher-in-the-loop không có nghĩa giáo viên là người duy nhất. Người học cũng phải in-the-loop trong việc dùng AI, tự đánh giá, khai báo, phản biện. Tổ chức phải in-the-loop trong governance. Phụ huynh có vai trò với trẻ em. Nhưng giáo viên là điểm nối giữa mục tiêu học, bối cảnh lớp và dữ liệu. Bỏ qua họ, EdTech mất khả năng hiểu giáo dục như quan hệ người thật.

6. Đo Điều Kiện Hiệu Quả

Nguyên tắc thứ sáu: luôn hỏi hiệu quả với ai, trong môn nào, trong bao lâu, với chi phí nào, dưới rủi ro nào. Đây là nguyên tắc chống lại câu nói quá ngắn: “công cụ này hiệu quả”. Trong giáo dục, không có hiệu quả trừu tượng. Có hiệu quả trong một bối cảnh, với một nhóm người học, một giáo viên, một nhiệm vụ, một thời lượng, một mức hỗ trợ, một baseline và một thước đo.

Chương 2 đã phân biệt adoption, engagement, satisfaction, completion, điểm số, retention và transfer. Chương 20 dùng câu hỏi “works for whom, under what conditions”. Chương 22 thêm chi phí và incentive. Chương 21 thêm privacy, bias và contestability. Khi gom lại, đánh giá EdTech thực chứng cần nhiều tầng.

Tầng thứ nhất là learning outcomes. Người học có hiểu hơn không, nhớ lâu hơn không, transfer tốt hơn không, tự điều chỉnh tốt hơn không, làm được nhiệm vụ xác thực hơn không? Outcome gần với bài luyện có thể hữu ích, nhưng chưa đủ. Cần delayed test, transfer task, sản phẩm mở, oral defense, portfolio hoặc quan sát thực hành khi mục tiêu phức hợp.

Tầng thứ hai là process evidence. Người học có truy hồi, giải thích, sửa bài, dùng feedback, đặt câu hỏi, hợp tác, phản tư không? AI tạo sản phẩm cuối đẹp có thể che quá trình rỗng. Process evidence giúp thấy cơ chế học, nhưng phải chọn dấu vết có ý nghĩa và tránh giám sát quá mức.

Tầng thứ ba là implementation outcomes. Công cụ có được dùng không, dùng đúng cơ chế không, có fit với workflow không, có khả thi không, giáo viên có chấp nhận không, support có đủ không, cost ra sao, có bền không? Proctor và cộng sự nêu các outcomes như acceptability, adoption, appropriateness, feasibility, fidelity, cost, penetration và sustainability (Proctor et al., 2011). Với EdTech, các outcome này quyết định liệu tác động có thể sống ngoài pilot không.

Tầng thứ tư là equity outcomes. Nhóm nào hưởng lợi, nhóm nào không, nhóm nào chịu rủi ro? Hiệu quả trung bình có thể che bất bình đẳng. Một công cụ tăng điểm chung nhưng làm nhóm yếu thế tụt lại tương đối cần được xem xét lại. Cần phân tích theo ngôn ngữ, disability, giới, thu nhập, thiết bị, vùng miền, kiến thức nền và bối cảnh văn hóa.

Tầng thứ năm là workload và organisational outcomes. Giáo viên có giảm tải thật không, hay thêm việc? Tổ chức có giảm tool sprawl không, hay tăng? Dữ liệu có dẫn đến can thiệp không? IT có gánh nổi không? Hỗ trợ phụ huynh có cải thiện không? Một công cụ làm điểm tăng nhẹ nhưng làm giáo viên kiệt sức có thể không bền.

Tầng thứ sáu là risk outcomes. Privacy, security, bias, overreliance, deskilling, dependency, surveillance, lock-in, academic integrity, wellbeing và environmental cost thay đổi ra sao? Một sản phẩm tạo hiệu quả ngắn hạn nhưng tăng rủi ro dài hạn cần được đọc đầy đủ.

Tầng thứ bảy là cost/value. Tổng chi phí vòng đời là gì? So với phương án khác, value có xứng không? Có exit plan không? Có chi phí ẩn không? Chương 22 đã nói value for money không phải giá thấp, mà là quan hệ giữa tác động, chi phí và rủi ro.

Một evaluation plan tốt nên viết trước triển khai:

1. Chúng ta đang giải quyết vấn đề nào? 2. Cơ chế học tập hoặc vận hành giả định là gì? 3. Baseline là gì? 4. Outcome nào đo ngay, outcome nào đo sau? 5. Nhóm người học nào cần phân tích riêng? 6. Implementation conditions nào cần theo dõi? 7. Workload và cost đo ra sao? 8. Rủi ro nào cần monitor? 9. Tiêu chí sửa, mở rộng hoặc dừng là gì? 10. Ai được xem dữ liệu và ai có quyền phản hồi?

Đo điều kiện hiệu quả cũng nghĩa là chấp nhận kết quả hỗn hợp. Một công cụ có thể tốt cho học sinh có kiến thức nền trung bình nhưng không tốt cho học sinh rất yếu nếu thiếu giáo viên. Một AI writing tool có thể giúp clarity nhưng không giúp argument. Một gamified app có thể tăng practice trong bốn tuần nhưng giảm novelty sau tám tuần. Một dashboard có thể tốt ở trường có cố vấn, vô dụng ở trường không có người can thiệp. Những kết quả này không làm nghiên cứu thất bại; chúng làm tri thức triển khai chính xác hơn.

Một nguy cơ là đo quá nhiều. Nếu mỗi can thiệp tạo thêm khảo sát, log, dashboard, rubric, người dùng sẽ mệt. Đo điều kiện hiệu quả không có nghĩa biến mọi thứ thành dữ liệu. Nó nghĩa là chọn số ít thước đo có ý nghĩa, kết hợp định lượng và định tính, và dùng dữ liệu để quyết định. Đôi khi một cuộc phỏng vấn giáo viên, một phân tích bài làm và một chỉ số delayed retention tốt hơn 30 chỉ số platform.

Một nguy cơ khác là đo thứ dễ thay vì thứ quan trọng. Time-on-task dễ đo, nhưng không đủ. Số prompt dễ đo, nhưng không nói chất lượng tư duy. Completion dễ đo, nhưng có thể tăng khi nhiệm vụ dễ hơn. Satisfaction dễ đo, nhưng người học có thể thích công cụ làm hộ. Đo đúng đôi khi khó hơn, nhưng nếu đo sai, hệ thống sẽ tối ưu sai.

Đo điều kiện hiệu quả cũng cần khi mua sản phẩm. Vendor nên cung cấp bằng chứng theo bối cảnh, nhưng tổ chức vẫn cần local evaluation. Không phải vì không tin vendor, mà vì bối cảnh khác. Một sản phẩm có evidence tốt ở trường đô thị tiếng Anh cần thử lại ở trường Việt Nam, lớp đông, thiết bị mobile-first, giáo viên có thời gian khác. Local evaluation không nhất thiết là RCT lớn. Nó có thể là pilot có baseline, mixed-method, và tiêu chí rõ.

Trong EdTech thực chứng, câu hỏi “có hiệu quả không?” nên được thay bằng: “hiệu quả nào, cho ai, so với gì, trong bao lâu, dưới điều kiện nào, với chi phí và rủi ro nào?”. Câu hỏi dài hơn, nhưng giáo dục xứng đáng với câu hỏi dài.

7. Không Tô Hồng, Không Bi Quan Dễ Dãi

Nguyên tắc thứ bảy: EdTech tốt là thiết kế có bằng chứng, có giới hạn và có trách nhiệm. Điều này đòi hỏi một thái độ khó giữ: không tô hồng, nhưng cũng không bi quan dễ dãi. Tô hồng công nghệ làm ta bỏ qua rủi ro, chi phí, bối cảnh và quyền lực. Bi quan dễ dãi làm ta bỏ qua cơ hội thật cho accessibility, feedback, tutoring, dữ liệu can thiệp, giảm tải, cộng đồng và học tập linh hoạt. Cả hai đều là cách tránh làm việc khó.

Tô hồng thường có vài câu quen thuộc: AI sẽ cá nhân hóa cho mọi người; giáo viên sẽ được giải phóng; dữ liệu sẽ giúp can thiệp sớm; công nghệ sẽ dân chủ hóa giáo dục; học sinh sẽ tự học tốt hơn; chi phí sẽ giảm; scale sẽ giải quyết bất bình đẳng. Những câu này có thể chứa một phần sự thật. Nhưng nếu không hỏi điều kiện, chúng trở thành marketing. Cá nhân hóa cho ai, bằng dữ liệu nào, có khóa cơ hội không? Giáo viên được giải phóng khỏi việc nào, có việc mới không? Can thiệp sớm bằng nguồn lực nào? Dân chủ hóa nếu thiết bị, ngôn ngữ và tài khoản trả phí không đều thì sao? Tự học tốt hơn nếu người học chưa có SRL thì sao? Chi phí giảm ở dòng nào, tăng ở dòng nào? Scale có làm mất local adaptation không?

Bi quan dễ dãi cũng có câu quen thuộc: công nghệ luôn thất bại; AI làm học sinh lười; dữ liệu chỉ là giám sát; EdTech chỉ là thị trường; giáo viên sẽ bị thay thế; học online không bao giờ bằng học trực tiếp. Những câu này cũng có phần cảnh báo đúng. Nhưng nếu biến chúng thành kết luận sẵn, ta bỏ qua thiết kế. AI có thể làm học sinh phụ thuộc, nhưng cũng có thể làm họ tự giải thích nếu thiết kế đúng. Dữ liệu có thể giám sát, nhưng cũng có thể giúp phát hiện ai bị bỏ lại. EdTech có thể bị thị trường hóa, nhưng procurement và governance có thể định hình thị trường. Học online có giới hạn, nhưng cũng mở quyền truy cập cho người không thể đến lớp.

Thái độ thực chứng là ở giữa nhưng không nhạt. Nó có bốn thói quen.

Thói quen thứ nhất: hỏi cơ chế. Công nghệ giúp học qua cơ chế nào? Nếu không nói được cơ chế, claim còn mỏng. Retrieval, feedback, scaffold, collaboration, simulation, accessibility, self-regulation, teacher insight, administrative reliability - mỗi cơ chế cần thiết kế khác.

Thói quen thứ hai: hỏi điều kiện. Cơ chế ấy hoạt động khi nào, với ai, cần giáo viên làm gì, cần hạ tầng gì, cần dữ liệu gì, kéo dài bao lâu? Điều kiện làm claim nhỏ hơn, nhưng đáng tin hơn.

Thói quen thứ ba: hỏi tác dụng phụ. Kỹ năng nào bị offload, ai bị giám sát, dữ liệu nào bị thu, nhóm nào bị thiệt, giáo viên có thêm việc không, mô hình kinh doanh kéo thiết kế về đâu, công cụ có làm nghèo quan hệ không?

Thói quen thứ tư: thiết kế vòng học. Không cần chờ bằng chứng hoàn hảo để thử, nhưng phải thử có kỷ luật: giả thuyết, pilot nhỏ, baseline, dữ liệu vừa đủ, phản hồi người dùng, tiêu chí sửa/dừng, và mở rộng có điều kiện.

UNESCO GEM 2023 cảnh báo rằng công nghệ trong giáo dục thường được triển khai mà thiếu bằng chứng đầy đủ, chi phí bị đánh giá thấp, và lợi ích phụ thuộc mạnh vào bối cảnh (UNESCO, 2023). EEF 2019 cũng nhấn mạnh công nghệ nên được dùng để cải thiện dạy học chứ không thay thế các nguyên tắc sư phạm tốt (EEF, 2019). NIST, OECD và UNESCO về AI cùng đặt trọng tâm vào human-centred, transparency, accountability và risk management. Các nguồn này không chống công nghệ. Chúng chống sự dễ dãi.

Không tô hồng cũng nghĩa là nói rõ giới hạn của sản phẩm. Một vendor đáng tin không chỉ nói sản phẩm làm được gì; họ nói chưa làm được gì, chưa kiểm thử với nhóm nào, cần điều kiện nào, rủi ro nào, và khi nào không nên dùng. Một nhà trường đáng tin không chỉ công bố triển khai AI; họ nói mục tiêu, dữ liệu, quyền phản biện, tiêu chí đánh giá và kết quả học được sau pilot. Một researcher đáng tin không chỉ báo effect size; họ báo design, attrition, duration, heterogeneity, limitation và context. Một giáo viên đáng tin với học sinh không chỉ nói “AI bị cấm” hoặc “AI được dùng”; họ giải thích mục tiêu học và ranh giới.

Không bi quan dễ dãi cũng nghĩa là nhận ra cơ hội thật. AI có thể tạo caption nhanh cho video, giúp người khiếm thị tiếp cận hình ảnh, dịch tài liệu cho gia đình đa ngôn ngữ, gợi phản hồi ban đầu cho người học không có gia sư, giúp giáo viên nhóm lỗi bài làm, mô phỏng tình huống hiếm, hỗ trợ người học nhút nhát luyện trước khi nói, và giảm một số việc hành chính. Những cơ hội này đáng phát triển. Nhưng chúng đáng phát triển theo cách bảo vệ quyền, không theo cách đổi quyền lấy tiện.

Một biểu hiện của trưởng thành là biết dừng. Nếu pilot không đạt, dừng. Nếu dữ liệu rủi ro, dừng. Nếu workload tăng, sửa hoặc dừng. Nếu công cụ không phù hợp nhóm yếu thế, không mở rộng. Nếu vendor không minh bạch, không mua. Dừng không phải thất bại nếu nó dựa trên tiêu chí đã định. Trong một thị trường thích công bố đổi mới, quyết định dừng có trách nhiệm là một năng lực hiếm.

Nguyên tắc cuối cùng này là nguyên tắc về tính cách tổ chức. Một tổ chức học tập tốt không sợ công nghệ mới, nhưng cũng không bị nó thôi miên. Nó tò mò, thử nghiệm, đo lường, lắng nghe, phản biện, sửa và chịu trách nhiệm. Đó là tinh thần thực chứng.

Thực Trạng Triển Khai

Trong thực tế, nhiều tổ chức đã nắm một phần các nguyên tắc này nhưng chưa giữ được toàn bộ. Một trường có thể bắt đầu từ nhiệm vụ học tập nhưng chưa tính chi phí ẩn. Một đại học có chính sách AI nhưng chưa có contestability rõ. Một trung tâm có dashboard tốt cho phụ huynh nhưng chưa đo transfer. Một doanh nghiệp đào tạo có AI coach nhưng chưa phân biệt learning support với performance surveillance. Một startup có UX tốt nhưng chưa có evidence. Một cơ quan quản lý có procurement chặt về bảo mật nhưng chưa đưa effectiveness và equity vào tiêu chí.

Mẫu triển khai phổ biến nhất vẫn là feature-led adoption. Công cụ mới xuất hiện, tổ chức thử vì thấy nhiều nơi dùng hoặc vì sợ bị chậm. GenAI làm mẫu này mạnh hơn. Khi công cụ có thể viết, dạy, chấm, tóm tắt, dịch, tạo video, phân tích dữ liệu, nó có vẻ liên quan đến mọi thứ. Nhưng liên quan đến mọi thứ không có nghĩa phù hợp với nhiệm vụ cụ thể nào. Nếu không có task statement, AI sẽ lan như công cụ văn phòng, không như thiết kế học tập.

Mẫu thứ hai là metric substitution. Tổ chức thay học tập bằng metric dễ đo. Số lượt đăng nhập thay cho engagement có ý nghĩa. Completion thay cho mastery. Parent report thay cho hiểu biết. Prompt count thay cho AI literacy. Time saved in demo thay cho workload thật. Procurement cost thay cho TCO. Metric substitution nguy hiểm vì nó tạo cảm giác quản trị tốt trong khi mục tiêu lệch.

Mẫu thứ ba là governance lag. Công cụ được dùng trước, chính sách theo sau. Học sinh dùng AI trước khi biết khai báo. Giáo viên dùng công cụ công khai trước khi có hướng dẫn dữ liệu. Vendor thêm tính năng AI trước khi trường cập nhật hợp đồng. Dashboard được triển khai trước khi có workflow can thiệp. Governance lag không phải lỗi của một nhóm; công nghệ thay đổi nhanh. Nhưng tổ chức có thể giảm rủi ro bằng AI register, nguyên tắc chung và review định kỳ.

Mẫu thứ tư là teacher overload. Nhiều đổi mới nói sẽ giúp giáo viên nhưng giai đoạn đầu tạo thêm việc: học công cụ, sửa nội dung, giải thích chính sách, kiểm tra AI, xem dashboard, xử lý phụ huynh, báo lỗi. Nếu tổ chức không bỏ bớt việc cũ, “đổi mới” là thêm lớp việc. Chương 19 và 22 đã nói workload thật và TCO phải được tính.

Mẫu thứ năm là equity afterthought. Accessibility, language, device, bandwidth, disability, cultural validity và pricing được xử lý sau. Khi đó sản phẩm đã mang giả định của nhóm thuận lợi. Sửa sau tốn hơn thiết kế từ đầu. CAST UDL 3.0 nhắc rằng agency và accessibility phải là nền thiết kế, không phải accommodation muộn (CAST, 2024).

Mẫu thứ sáu là evidence theatre. Tổ chức yêu cầu bằng chứng nhưng chấp nhận case study đẹp. Vendor nói “research-backed” nhưng không chỉ rõ nghiên cứu nào. Pilot báo satisfaction nhưng không có baseline. Dashboard báo learning improvement nhưng outcome gần với bài luyện. Evidence theatre không phải không có dữ liệu; nó có dữ liệu không đủ để ra quyết định.

Tuy vậy, cũng có dấu hiệu tốt. Nhiều tổ chức bắt đầu hỏi TCO, data governance, AI policy, teacher professional development, academic integrity, accessibility và evidence. Các khung như EEF implementation guidance, UNESCO AI competency frameworks, NIST AI RMF, OECD AI Principles, EU AI Act và procurement guidance đang giúp tổ chức có ngôn ngữ tốt hơn. Điều quan trọng là chuyển ngôn ngữ thành routine.

Routine có thể rất cụ thể: mỗi công cụ mới phải có task statement; mỗi pilot có baseline và tiêu chí dừng; mỗi AI high-risk có data protection và bias review; mỗi dashboard có workflow can thiệp; mỗi feedback tool có cơ hội sửa; mỗi renewal có value review; mỗi chính sách AI có ví dụ theo môn; mỗi tổ chuyên môn có thời gian phân tích bài làm; mỗi học sinh được dạy AI literacy và quyền dữ liệu.

Thực trạng không thiếu công cụ. Thực trạng thiếu kỷ luật thiết kế và triển khai. Bộ nguyên tắc này nhằm lấp khoảng đó.

Phân Tích Phản Biện

Một bộ nguyên tắc cũng có rủi ro của nó. Rủi ro đầu tiên là biến nguyên tắc thành ngôn ngữ trang trí. Một sản phẩm có thể nói “task-first”, “human-centred”, “evidence-based”, “teacher-in-the-loop”, “ethical personalization” mà không thay đổi thiết kế. Những từ này dễ được marketing hấp thụ. Vì vậy, mỗi nguyên tắc phải có bằng chứng vận hành: tài liệu thiết kế, workflow, quyền người dùng, dữ liệu pilot, điều khoản hợp đồng, log phản hồi, quyết định dừng.

Rủi ro thứ hai là quá tải tiêu chí. Nếu mọi quyết định EdTech phải đi qua quá nhiều câu hỏi, giáo viên và trường có thể tê liệt. Cần phân tầng rủi ro. Công cụ low-risk không cần quy trình như hệ thống high-risk. Một template worksheet AI dùng nội bộ khác automated scoring. Một chatbot luyện từ vựng khác wellbeing agent. Nguyên tắc phải giúp ra quyết định tốt hơn, không tạo quan liêu.

Rủi ro thứ ba là nguyên tắc bị dùng để bảo vệ hiện trạng. Người ta có thể nói “chưa đủ bằng chứng”, “chưa đủ governance”, “chưa đủ điều kiện” để không thử gì. Nhưng giáo dục cũng có trách nhiệm cải thiện. Nếu người học không được phản hồi, người khuyết tật không tiếp cận được tài liệu, giáo viên quá tải, dữ liệu phân mảnh, thì không đổi mới cũng có chi phí đạo đức. Thực chứng không phải chờ chắc chắn tuyệt đối; nó là thử có trách nhiệm.

Rủi ro thứ tư là bỏ qua quyền lực kinh tế. Một trường nhỏ có thể hiểu hết nguyên tắc nhưng vẫn không đủ ngân sách, không có đội IT, không có năng lực procurement, và phải chọn trong thị trường không minh bạch. Vì vậy, nguyên tắc cấp trường cần đi cùng support organisations, procurement tập trung có trách nhiệm, chuẩn mở, chính sách công và tài trợ công bằng. Không thể yêu cầu từng giáo viên hoặc từng trường tự gánh toàn bộ.

Rủi ro thứ năm là xung đột giữa nguyên tắc. Giảm friction thao tác có thể xung đột với privacy nếu đăng nhập đơn giản quá mức. Cá nhân hóa có thể xung đột với data minimisation. Teacher-in-the-loop có thể xung đột với workload. Evidence yêu cầu đo, nhưng privacy yêu cầu đo ít. Accessibility có thể cần dữ liệu disability, nhưng dữ liệu ấy nhạy cảm. Không có bộ nguyên tắc nào xóa trade-off. Nó chỉ làm trade-off hiện rõ để quyết định có trách nhiệm.

Rủi ro thứ sáu là lấy chuẩn của bối cảnh giàu áp vào bối cảnh ít tài nguyên. Một bộ nguyên tắc viết từ góc nhìn trường có hạ tầng tốt có thể làm trường yếu thấy không thể làm gì. Vì vậy, nguyên tắc phải có phiên bản tối thiểu: task statement, data minimisation, pilot nhỏ, feedback loop, teacher voice, low-bandwidth, no high-stakes automation without review. Không cần công cụ hoàn chỉnh mới bắt đầu làm đúng.

Rủi ro cuối cùng là lãng quên người học. Khi nói về procurement, governance, implementation, TCO, AI risk, teacher agency, ta dễ quay lại người lớn và hệ thống. Nhưng mục tiêu cuối vẫn là người học: họ có hiểu hơn, tự chủ hơn, được tham gia hơn, được bảo vệ hơn, và có cơ hội rộng hơn không? Mỗi nguyên tắc phải quay lại câu hỏi đó.

Phân tích phản biện này không làm bộ nguyên tắc yếu đi. Nó nhắc rằng nguyên tắc chỉ có giá trị khi được dùng như công cụ suy nghĩ, không như khẩu hiệu.

Nguyên Tắc Thiết Kế

Phần này chuyển bảy nguyên tắc thành một bộ câu hỏi thực hành. Có thể dùng khi thiết kế sản phẩm, mua sắm, triển khai pilot, đánh giá công cụ, hoặc viết chính sách AI.

Một: Task-first

Vấn đề học tập hoặc vận hành cụ thể là gì? Ai bị ảnh hưởng? Baseline hiện tại ra sao? Nếu không dùng công nghệ mới, phương án tốt nhất là gì? Công nghệ thay đổi cơ chế nào? Tính năng nào không cần thiết?

Hai: Productive friction

Ma sát nào là thao tác cần giảm? Ma sát nào là nhận thức cần giữ? Hệ thống có yêu cầu người học dự đoán, truy hồi, tự giải thích, kiểm chứng, sửa và phản tư không? AI có làm thay phần cần học không? Scaffold có rút dần không?

Ba: Feedback-to-action

Feedback trả lời mục tiêu, hiện trạng và bước tiếp theo không? Người học có cơ hội dùng feedback không? Giáo viên có workflow can thiệp từ dashboard không? Feedback có quá nhiều, quá muộn, quá mơ hồ hoặc làm thay không? Có đo feedback uptake không?

Bốn: Ethical personalization

Cá nhân hóa dựa trên dữ liệu nào? Người học và giáo viên có hiểu và kiểm soát không? Hệ thống có mở cơ hội hay khóa lộ trình? Có kiểm tra bias theo nhóm không? Cá nhân hóa có làm người học cô lập hoặc phụ thuộc không? Có dùng dữ liệu nhạy cảm quá mức không?

Năm: Real teacher-in-the-loop

Giáo viên có quyền thấy, quyết định, điều chỉnh và phản biện không? AI có hiển thị bằng chứng, giới hạn và mức chắc chắn không? Giáo viên có thời gian và năng lực để review không? Hệ thống có giúp giáo viên học từ dữ liệu không? Có kênh sửa sản phẩm/policy không?

Sáu: Conditional evidence

Hiệu quả được đo cho ai, môn nào, nhiệm vụ nào, thời lượng nào, baseline nào? Có delayed outcome và transfer không? Có implementation outcomes, workload, equity, risk và TCO không? Có tiêu chí sửa, mở rộng hoặc dừng không? Có phân tích nhóm yếu thế không?

Bảy: Responsible stance

Claim có nói rõ giới hạn không? Có tác dụng phụ nào bị bỏ qua không? Có quyền dữ liệu và contestability không? Mô hình kinh tế kéo thiết kế về đâu? Có quyết định dừng nếu rủi ro vượt lợi ích không? Tổ chức có học từ thất bại không?

Một bản đánh giá nhanh có thể dùng thang ba mức:

1. Đỏ: chưa rõ hoặc rủi ro cao. Không triển khai rộng. 2. Vàng: có logic nhưng thiếu bằng chứng/điều kiện. Pilot nhỏ có guardrails. 3. Xanh: có fit, bằng chứng, governance, support và kế hoạch đánh giá. Có thể mở rộng có theo dõi.

Điều quan trọng là không để thang này thành form hình thức. Mỗi mức phải có lý do và người chịu trách nhiệm. Nếu một công cụ vàng được pilot, cần ngày review. Nếu đỏ, cần nói điều kiện nào làm nó chuyển vàng. Nếu xanh, vẫn cần monitoring vì công cụ, người dùng và bối cảnh thay đổi.

Tổng Kết Chương

Thiết kế EdTech thực chứng bắt đầu từ nhiệm vụ học tập, không từ tính năng. Nó giữ ma sát nhận thức đúng chỗ, vì học tập cần nỗ lực có ý nghĩa. Nó xem feedback như vòng hành động, không như lời nhận xét hoặc điểm số. Nó dùng cá nhân hóa để mở quyền tham gia và agency, không để cô lập, khóa cơ hội hoặc thao túng động lực. Nó đặt giáo viên trong vòng phán đoán thật, với quyền thấy, quyết định, điều chỉnh và phản biện. Nó đo hiệu quả theo điều kiện: cho ai, trong môn nào, trong bao lâu, với chi phí và rủi ro nào. Và nó giữ thái độ không tô hồng, không bi quan dễ dãi.

Bảy nguyên tắc này không bảo đảm mọi dự án EdTech sẽ thành công. Giáo dục quá phức tạp để có bảo đảm như vậy. Nhưng chúng làm giảm khả năng thất bại vì những lỗi có thể tránh: bắt đầu từ công nghệ, xóa nhầm nỗ lực học, tạo feedback không hành động, cá nhân hóa vô trách nhiệm, bỏ qua giáo viên, đo sai hiệu quả, và tin quá nhanh vào lời hứa.

Chương 24 sẽ kết thúc cuốn sách bằng những câu hỏi nghiên cứu còn mở. Bộ nguyên tắc trong chương này không đóng lại tranh luận; nó tạo nền để đặt câu hỏi tốt hơn.

Tài liệu tham khảo

Brummer, L., de Boer, H., Mouw, J. M., & Strijbos, J.-W. (2024). A meta-analysis of the effects of context, content, and task factors of digitally delivered instructional feedback on learning performance. Learning Environments Research, 27, 453-476. https://doi.org/10.1007/s10984-024-09501-4

CAST. (2024). Universal Design for Learning Guidelines 3.0. https://udlguidelines.cast.org/

Chi, M. T. H., & Wylie, R. (2014). The ICAP framework: Linking cognitive engagement to active learning outcomes. Educational Psychologist, 49(4), 219-243. https://doi.org/10.1080/00461520.2014.965823

Dunlosky, J., Rawson, K. A., Marsh, E. J., Nathan, M. J., & Willingham, D. T. (2013). Improving students' learning with effective learning techniques: Promising directions from cognitive and educational psychology. Psychological Science in the Public Interest, 14(1), 4-58. https://doi.org/10.1177/1529100612453266

Education Endowment Foundation. (2019). Using Digital Technology to Improve Learning. https://educationendowmentfoundation.org.uk/education-evidence/guidance-reports/digital

Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81-112. https://doi.org/10.3102/003465430298487

Mayer, R. E. (2021). Multimedia Learning (3rd ed.). Cambridge University Press.

Miao, F., & Cukurova, M. (2024). AI competency framework for teachers. UNESCO. https://www.unesco.org/en/articles/ai-competency-framework-teachers

Miao, F., Shiohira, K., & Lao, N. (2024). AI competency framework for students. UNESCO. https://www.unesco.org/en/articles/ai-competency-framework-students

National Institute of Standards and Technology. (2023). Artificial Intelligence Risk Management Framework (AI RMF 1.0). https://doi.org/10.6028/NIST.AI.100-1

OECD. (2024). OECD AI Principles overview. https://oecd.ai/en/ai-principles

Proctor, E., Silmere, H., Raghavan, R., Hovmand, P., Aarons, G., Bunger, A., Griffey, R., & Hensley, M. (2011). Outcomes for implementation research: Conceptual distinctions, measurement challenges, and research agenda. Administration and Policy in Mental Health and Mental Health Services Research, 38, 65-76. https://doi.org/10.1007/s10488-010-0319-7

Ryan, A., Prieto-Rodriguez, E., Miller, A., & Gore, J. (2024). What can implementation science tell us about scaling interventions in school settings? A scoping review. Educational Research Review, 44, 100620. https://doi.org/10.1016/j.edurev.2024.100620

Ryan, R. M., & Deci, E. L. (2017). Self-Determination Theory: Basic Psychological Needs in Motivation, Development, and Wellness. Guilford Press.

Sharples, J., Eaton, J., & Boughelaf, J. (2024). A School's Guide to Implementation. Education Endowment Foundation. https://educationendowmentfoundation.org.uk/education-evidence/guidance-reports/implementation

Shute, V. J. (2008). Focus on formative feedback. Review of Educational Research, 78(1), 153-189. https://doi.org/10.3102/0034654307313795

UNESCO. (2023). Global Education Monitoring Report 2023: Technology in education: A tool on whose terms? https://www.unesco.org/gem-report/en/technology