Chương 14: Tải nhận thức, đa phương tiện và trải nghiệm học

Bối cảnh / Vấn đề

Chương 13 bàn về nhịp học theo thời gian: truy hồi, lặp lại ngắt quãng, trộn dạng bài, tinh thông và phản tư. Chương 14 đi vào một lớp khác: hình dạng của trải nghiệm học trong từng khoảnh khắc. Người học nhìn thấy gì trên màn hình? Nghe gì? Phải chú ý vào đâu? Có bao nhiêu bước phải giữ trong đầu? Hệ thống gợi ý lúc nào? Video có dừng đúng chỗ không? Dashboard có giúp ra quyết định hay chỉ thêm nhiễu? Notification có kéo người học quay lại đúng lúc hay làm vỡ mạch tập trung?

EdTech thường bị đánh giá qua tính năng: có video, quiz, chatbot, animation, VR, dashboard, gamification, AI feedback. Nhưng não người học không học từ “tính năng”. Nó học từ thông tin được chọn lọc, tổ chức, xử lý và nối vào tri thức đã có. Một giao diện nhiều tính năng có thể làm học kém hơn nếu nó làm người học phân tán chú ý, phải đọc-đối chiếu quá nhiều, hoặc xử lý chi tiết trang trí không phục vụ mục tiêu. Ngược lại, một thiết kế giản dị nhưng đúng trọng tâm có thể giúp người học hiểu sâu hơn vì nó bảo vệ tài nguyên nhận thức.

AI làm vấn đề này vừa tốt hơn vừa khó hơn. Tốt hơn vì AI có thể giải thích theo trình độ, tạo ví dụ, tóm tắt, chuyển định dạng, đặt câu hỏi, gợi ý bước tiếp theo và cá nhân hóa nhịp học. Khó hơn vì AI có thể tạo quá nhiều chữ, quá nhiều lựa chọn, quá nhiều phản hồi và quá nhiều tương tác. Một chatbot luôn sẵn sàng có thể khiến người học bị cuốn vào hội thoại phụ. Một dashboard thông minh có thể cho 12 chỉ số nhưng không cho biết nên làm gì. Một video có AI avatar, caption, transcript, highlight và quiz chen giữa có thể hữu ích, nhưng cũng có thể làm màn hình thành một phòng họp ồn.

Chương này dùng Cognitive Load Theory và Multimedia Learning như hai trục chính. Câu hỏi không phải “công nghệ này có hiện đại không?” mà là: nó giảm nhiễu nào, quản lý độ khó nào, kích hoạt xử lý sâu nào, và có phù hợp với trình độ người học không?

Nền tảng lý thuyết

Cognitive Load Theory (CLT) bắt đầu từ giới hạn của bộ nhớ làm việc. Người học chỉ có thể xử lý một lượng thông tin nhỏ trong thời điểm hiện tại, trong khi tri thức dài hạn được tổ chức thành schema có thể giúp xử lý nhanh hơn. Khi thiết kế dạy học không tính đến giới hạn này, người học không thất bại vì lười hay thiếu động lực; họ thất bại vì hệ thống bắt họ giữ quá nhiều thứ trong đầu cùng lúc (Sweller, 1988; Sweller et al., 2011).

Trong cách nói hiện đại của multimedia learning, Mayer phân biệt ba loại xử lý: extraneous processing, essential processing và generative processing. Extraneous processing là xử lý không cần thiết do cách trình bày gây ra: trang trí thừa, chữ và hình tách xa, âm thanh nhiễu, giao diện rối, animation không có mục tiêu. Essential processing là xử lý cần thiết để hiểu nội dung cốt lõi, tức độ khó đến từ chính vật liệu học. Generative processing là xử lý sâu giúp người học tổ chức và tích hợp kiến thức: tự giải thích, nối khái niệm, so sánh, dự đoán, phản biện (Mayer, 2021).

Ba loại xử lý này giúp ta tránh một hiểu lầm: mục tiêu không phải làm học tập luôn “dễ”. Thiết kế tốt không loại bỏ mọi khó khăn. Nó loại bỏ khó khăn vô ích, quản lý khó khăn cần thiết, và tạo khó khăn có ích để người học xử lý sâu. Nếu một video giải thích vật lý có nhạc nền, hiệu ứng bay chữ và nhân vật hoạt hình không phục vụ khái niệm, đó là extraneous load. Nếu bài học về điện từ trường khó vì khái niệm có nhiều quan hệ, đó là essential load. Nếu hệ thống yêu cầu người học dự đoán chiều lực trước khi xem mô phỏng, đó là generative processing.

Multimedia Learning dựa trên giả định dual channels: con người xử lý thông tin qua kênh hình ảnh/thị giác và kênh lời nói/thính giác, mỗi kênh có giới hạn, và học sâu xảy ra khi người học chọn thông tin liên quan, tổ chức thành mô hình và tích hợp với tri thức cũ (Mayer, 2021). Vì vậy, thêm hình, video, audio hoặc VR không tự làm học tốt hơn. Câu hỏi là chúng có giúp người học xây mô hình tinh thần không.

Các review gần đây xác nhận multimedia principles vẫn là nền quan trọng, nhưng việc áp dụng trong môi trường AR/VR và môi trường số mới còn chưa đồng đều. Çeken và Taşkın systematic review về multimedia learning principles trong nhiều môi trường học cho thấy nghiên cứu vẫn tập trung nhiều vào một số nguyên tắc và còn khoảng trống khi mở rộng sang AR/VR (Çeken & Taşkın, 2022). Điều này quan trọng cho EdTech hiện nay: ta không thể bê nguyên một nguyên tắc từ slide truyền thống sang VR, chatbot hoặc dashboard mà không kiểm tra lại ngữ cảnh.

Extraneous, essential và generative processing

Thiết kế học tập bắt đầu bằng việc phân biệt ba câu hỏi: cái gì đang làm người học nhiễu, cái gì thật sự khó, và cái gì buộc người học suy nghĩ sâu?

Extraneous processing thường đến từ những thứ tưởng nhỏ. Một bài học toán đặt đề bài ở đầu trang, công thức ở cuối trang và hình minh họa ở tab khác. Người học phải nhớ dữ kiện, cuộn qua cuộn lại, đối chiếu ký hiệu, rồi mới giải. Một video khoa học có caption tự động sai thuật ngữ, hình minh họa trang trí và câu hỏi pop-up chen ngay khi người học đang cố hiểu quan hệ nhân quả. Một chatbot trả lời dài 900 chữ cho một lỗi nhỏ trong bài làm. Trong các trường hợp này, tải nhận thức tăng không phải vì nội dung sâu hơn, mà vì thiết kế bắt người học xử lý nhiễu.

Essential processing là phần không thể bỏ. Nếu học lập trình đệ quy, người học phải hiểu call stack, base case, trạng thái biến và luồng thực thi. Nếu học giải tích, người học phải giữ quan hệ giữa giới hạn, đạo hàm, đồ thị và tốc độ thay đổi. Nếu học viết lập luận, người học phải phân biệt claim, evidence, warrant và counterargument. Thiết kế tốt không làm những thứ này biến mất; nó chia nhỏ, tuần tự hóa, dùng ví dụ, và cho người học xây schema từng bước.

Generative processing là nơi học sâu xảy ra. Người học không chỉ nhìn lời giải; họ dự đoán bước tiếp theo. Không chỉ xem mô phỏng; họ giải thích vì sao kết quả khác dự đoán. Không chỉ đọc feedback; họ sửa lại lời giải. Không chỉ hỏi AI; họ so sánh câu trả lời của AI với tiêu chí và nguồn. Đây là phần AI có thể hỗ trợ mạnh nếu được thiết kế đúng: đặt câu hỏi, yêu cầu tự giải thích, gợi phản ví dụ, tạo tình huống biến thể.

Vấn đề là nhiều hệ thống AI làm giảm cả extraneous lẫn generative processing cùng lúc. Chúng làm câu trả lời gọn hơn, nhưng cũng làm người học không phải tổ chức thông tin. Chúng giải thích nhanh hơn, nhưng cũng làm người học không phải dự đoán. Chúng tóm tắt tài liệu, nhưng cũng làm người học không phải phân biệt ý chính và ý phụ. Vì vậy, mục tiêu không phải tự động hóa toàn bộ khó khăn, mà là giữ lại khó khăn có ích.

Một quy tắc thực dụng: nếu người học đang tốn sức vào điều không liên quan đến mục tiêu học, giảm nó. Nếu người học đang tốn sức vào điều cốt lõi nhưng quá nhiều cùng lúc, chia nhỏ hoặc scaffold. Nếu người học không phải tốn sức vào điều cốt lõi vì AI làm hộ, thêm ma sát nhận thức: dự đoán, truy hồi, giải thích, kiểm chứng, phản biện.

Đo tải nhận thức không đơn giản. Các thang tự báo cáo như mental effort rating hữu ích nhưng có giới hạn. Nghiên cứu gần đây còn dùng eye-tracking, EEG, ERP và dữ liệu hành vi để tìm dấu hiệu tải nhận thức. Yu và cộng sự meta-analysis năm 2024 về ERP trong multimedia learning cho thấy một số thành phần ERP có tiềm năng đo cognitive load, nhưng đây vẫn là vùng cần diễn giải cẩn trọng và chưa phải công cụ triển khai đại trà (Yu et al., 2024). Với nhà thiết kế EdTech, điều quan trọng hơn là dùng nhiều tín hiệu: lỗi sai, thời gian dừng, số lần tua lại, mức tự tin, phản hồi người học và chất lượng giải thích.

Multimedia principles

Multimedia principles không phải danh sách mẹo trình bày. Chúng là cách dịch kiến thức về bộ nhớ làm việc thành quyết định thiết kế. Một số nguyên tắc đặc biệt quan trọng trong EdTech.

Coherence principle nói rằng nên loại bỏ thông tin không phục vụ mục tiêu học. Nhiều sản phẩm vi phạm nguyên tắc này vì muốn “giàu trải nghiệm”: hình nền động, âm thanh thưởng, nhân vật nói chuyện, đoạn kể chuyện phụ, icon chuyển động. Những thứ này có thể tăng cảm giác vui lúc đầu nhưng không chắc tăng học. Emotional design research cho thấy yếu tố cảm xúc có thể ảnh hưởng động lực và trải nghiệm, nhưng systematic review năm 2024 cũng cho thấy kết quả phụ thuộc vào cách thiết kế, đối tượng và ngữ cảnh; không thể giả định rằng làm giao diện “dễ thương” hơn luôn cải thiện học (Mutlu-Bayraktar, 2024).

Signaling principle nói rằng thiết kế nên chỉ ra thông tin quan trọng: highlight đúng chỗ, mũi tên, màu sắc có nghĩa, tiêu đề rõ, nhịp dừng. Signaling rất hữu ích khi người học chưa biết phải nhìn vào đâu. Trong VR hoặc simulation, signaling càng quan trọng vì môi trường có nhiều chi tiết. Wen, Lu và Mohamad Ali nghiên cứu VR laboratories và cho thấy attentional guidance có thể giảm cognitive load và cải thiện academic performance, nhắc rằng immersive environments cần điều hướng chú ý, không chỉ tăng độ thật (Wen et al., 2024).

Spatial contiguity và temporal contiguity nói rằng chữ và hình liên quan nên đặt gần nhau, lời nói và hình động nên xuất hiện cùng thời điểm. Một lỗi phổ biến là đưa transcript, biểu đồ, chú thích và câu hỏi vào các vùng tách rời. Người học phải tự ghép lại, tạo split-attention effect. Trong AI tutor, lỗi tương tự xảy ra khi lời giải nói “như hình trên” nhưng hình đã bị đẩy khỏi màn hình, hoặc khi feedback nằm trong một panel còn bài làm ở panel khác.

Modality principle gợi ý rằng trong một số trường hợp, giải thích bằng lời nói cùng hình ảnh có thể tốt hơn chữ viết cùng hình ảnh, vì nó phân bổ tải qua hai kênh. Nhưng nguyên tắc này không có nghĩa lúc nào cũng thêm audio. Nếu người học cần quay lại, so sánh thuật ngữ, hoặc học trong môi trường ồn, chữ lại cần thiết. Caption có thể hỗ trợ accessibility và người học ngôn ngữ thứ hai. Thiết kế tốt cho phép người học kiểm soát kênh, thay vì ép một định dạng.

Redundancy principle cảnh báo rằng trình bày cùng một thông tin bằng nhiều dạng đồng thời có thể gây quá tải nếu người học phải xử lý lặp lại. Một slide có chữ dài, giáo viên đọc nguyên văn, thêm caption và hình minh họa không liên quan có thể nặng hơn slide ít chữ với lời giải thích rõ. Nhưng trong accessibility, “redundancy” cần đọc cẩn thận: caption, transcript và mô tả hình có thể là điều kiện tham gia của nhiều người học. Vấn đề không phải có nhiều kênh, mà là người học có quyền chọn kênh phù hợp và không bị ép xử lý tất cả cùng lúc.

Segmenting principle nói rằng nội dung phức tạp nên chia thành đoạn có thể kiểm soát. Video dài 20 phút ít phù hợp với người mới nếu không có điểm dừng, câu hỏi và mục lục. AI có thể tự động chia video thành đoạn, tạo câu hỏi giữa đoạn và gợi ôn lại, nhưng phải tránh cắt vụn làm mất mạch lập luận. Segment tốt dựa trên cấu trúc khái niệm, không chỉ thời lượng.

Personalization và embodiment liên quan đến giọng nói, nhân vật và sự hiện diện xã hội. Nghiên cứu về anthropomorphism trong multimedia learning đang tăng. Liu và Su systematic review/meta-analysis năm 2024 về facial anthropomorphism cho thấy thiết kế nhân hóa khuôn mặt có thể ảnh hưởng đến learning và các outcome liên quan, nhưng hiệu quả không đơn giản và cần xét retention, transfer, motivation, effort và experience riêng (Liu & Su, 2024). Vì vậy, AI avatar không phải mặc định tốt. Nó tốt khi giúp người học chú ý, tin tưởng vừa đủ và hiểu rõ hơn; nó xấu khi làm người học tập trung vào nhân vật thay vì nội dung.

Signaling, segmenting và worked examples

Ba kỹ thuật này nằm ở trung tâm của thiết kế cho người mới: chỉ đường, chia đoạn và cho ví dụ đã giải.

Signaling giúp người học biết nên chú ý vào đâu. Trong một bài hình học, hệ thống có thể tô màu cạnh liên quan, ẩn cạnh không cần, hoặc lần lượt hiện từng quan hệ. Trong phân tích văn bản, nó có thể highlight claim, evidence và reasoning bằng màu khác nhau. Trong dashboard, signaling có thể là một câu hành động: “Điểm cần chú ý hôm nay: em nhầm giữa đạo hàm tích và đạo hàm hợp trong bài trộn.” Nếu dashboard chỉ có biểu đồ đẹp mà không chỉ ra điều quan trọng, nó đang đẩy việc diễn giải về phía người học.

Segmenting giúp người học không phải nuốt cả khối phức tạp cùng lúc. Một bài AI tutor giải phương trình có thể chia thành: hiểu đề, chọn chiến lược, biến đổi, kiểm tra nghiệm, phản tư lỗi. Một mô phỏng sinh học có thể chia thành: quan sát hệ ban đầu, thay một biến, dự đoán, chạy, giải thích, thử biến khác. Segment tốt không làm bài học rời rạc; nó tạo nhịp để người học xử lý và xây schema.

Worked examples đặc biệt quan trọng với người mới. Thay vì bắt người học giải từ đầu, worked example cho thấy một lời giải mẫu, từng bước, với lý do. CLT giải thích rằng người mới thiếu schema nên giải bài ngay có thể làm bộ nhớ làm việc quá tải; học từ ví dụ đã giải giúp giảm search không hiệu quả và tập trung vào cấu trúc vấn đề. Sozio, Agostinho, Tindall-Ford và Paas năm 2024 phân tích process worked examples và product worked examples, nhấn mạnh worked examples có thể giảm cognitive load và nâng learning outcomes hơn so với giải bài truyền thống, đồng thời phân biệt ví dụ chỉ cho chiến lược với ví dụ giải thích cả nguyên lý và quá trình (Sozio et al., 2024).

Trong EdTech có AI, worked example có thể linh hoạt hơn trước. Hệ thống có thể tạo ví dụ gần với lỗi của người học, giải thích vì sao một bước được chọn, cho người học ẩn/hiện lời giải, hoặc yêu cầu tự điền bước còn thiếu. Nhưng AI cũng có thể lạm dụng worked examples: mỗi lần người học kẹt, hệ thống đưa lời giải hoàn chỉnh. Khi đó người học học cách xem lời giải, không học cách giải.

Fading là cầu nối giữa worked example và problem solving. Ban đầu, hệ thống cho nhiều bước. Sau đó, bỏ dần một số bước và yêu cầu người học tự hoàn thành. Renkl, Atkinson và Große cho thấy fading worked solution steps giúp chuyển từ học qua ví dụ sang tự giải, phù hợp với quan điểm CLT về giảm dần hỗ trợ (Renkl et al., 2004). AI có thể thực hiện fading cá nhân hóa: nếu người học tự làm tốt bước biến đổi đại số, hệ thống không cần gợi bước đó nữa; nếu họ vẫn sai bước chọn chiến lược, scaffold còn ở đó.

Một điểm quan trọng: worked examples tốt không chỉ trình bày “làm gì” mà còn “vì sao”. Product-oriented example cho sản phẩm lời giải; process-oriented example cho quá trình ra quyết định. Với AI tutor, nên ưu tiên giải thích nguyên tắc chọn bước, không chỉ liệt kê phép biến đổi. Nếu không, người học có thể bắt chước hình thức mà không hiểu điều kiện áp dụng.

Expertise reversal

Một hỗ trợ tốt cho người mới có thể trở thành gánh nặng cho người giỏi. Đây là expertise reversal effect. Kalyuga tổng quan hiện tượng này trong CLT và cho thấy hiệu quả của instructional guidance phụ thuộc vào prior knowledge; khi người học đã có schema, hướng dẫn chi tiết có thể trở nên dư thừa và tạo tải nhận thức không cần thiết (Kalyuga, 2007).

Trong EdTech, expertise reversal xuất hiện khắp nơi. Người mới cần từng bước, gợi ý, ví dụ, highlight và giải thích thuật ngữ. Người đã giỏi có thể thấy chúng chậm, phiền và cản trở luồng suy nghĩ. Một dashboard cho người mới cần nói rõ “hôm nay nên làm gì”. Một dashboard cho người học nâng cao nên cho phép tự lọc dữ liệu và xem pattern sâu hơn. Một AI tutor cho người mới nên hỏi từng bước. Với người giỏi, nó nên đóng vai phản biện, đưa ca khó, hoặc thách thức giả định.

Điều này làm cá nhân hóa trở nên phức tạp hơn “đổi độ khó”. Hệ thống không chỉ cần biết bài nào khó, mà cần biết loại hỗ trợ nào còn hữu ích. Một người học có thể giỏi thao tác đại số nhưng yếu đọc đề. Họ không cần worked example cho phép biến đổi, nhưng cần signaling cho dữ kiện quan trọng. Một người học viết tốt nhưng yếu lập luận bằng bằng chứng không cần AI sửa câu, mà cần AI chất vấn quan hệ giữa claim và evidence.

Adaptive scaffolding là một hướng xử lý. Trong game-based learning y khoa, Faber và cộng sự thực hiện randomized controlled trial năm 2024 về adaptive scaffolding, đo performance, cognitive load và engagement; nghiên cứu kiểu này cho thấy scaffold cần gắn với trạng thái người học và nhiệm vụ, không thể dùng một mức hỗ trợ cho tất cả (Faber et al., 2024). Tuy nhiên, adaptive scaffolding cũng có rủi ro: nếu hệ thống rút hỗ trợ dựa trên tín hiệu sai, người học bị bỏ rơi; nếu giữ hỗ trợ quá lâu, họ bị phụ thuộc.

Expertise reversal cũng áp dụng cho AI feedback. Người mới có thể cần feedback trực tiếp: “bước này sai vì em đổi dấu khi chuyển vế”. Người giỏi có thể cần feedback dạng câu hỏi: “có trường hợp biên nào phá vỡ lập luận này không?” Nếu hệ thống luôn giải thích chi tiết cho mọi người, người giỏi mất thời gian. Nếu hệ thống chỉ gợi mở cho người mới, người mới có thể không đủ dữ kiện để sửa.

Thiết kế tốt nên cho phép learner control có kiểm soát. Người học có thể chọn “gợi ý nhẹ”, “ví dụ tương tự”, “giải thích đầy đủ”, hoặc “ẩn hỗ trợ”. Nhưng không nên phó mặc tất cả cho người học, vì người mới thường không biết mình cần gì. Hệ thống có thể đề xuất mức hỗ trợ và cho quyền đổi, đồng thời dùng dữ liệu để kiểm tra: nếu người học liên tục mở lời giải đầy đủ nhưng vẫn sai bài tương tự, cần đổi chiến lược.

UX như sư phạm

UX trong EdTech không phải lớp sơn giao diện. Nó là sư phạm được vật chất hóa thành layout, nhịp tương tác, notification, dashboard, lựa chọn mặc định, lỗi hệ thống và cách feedback xuất hiện. Một nút “Show answer” đặt quá nổi bật là một quyết định giáo dục. Một notification nhắc học lúc người học đang nghỉ cũng là quyết định giáo dục. Một dashboard xếp hạng trước khi cho chiến lược học cũng là quyết định giáo dục.

Layout quyết định đường chú ý. Nếu màn hình học có video, transcript, chat AI, quiz, quảng bá khóa học, điểm streak và menu cùng xuất hiện, người học phải tự quản lý chú ý trong môi trường cạnh tranh. Với người mới, đó là gánh nặng. Layout tốt nên có hierarchy rõ: mục tiêu hiện tại, nội dung chính, hành động tiếp theo, hỗ trợ khi cần, và thông tin phụ có thể ẩn. Độ tối giản ở đây không phải phong cách thẩm mỹ; nó là giảm extraneous processing.

Notification quyết định nhịp. Một thông báo có thể giúp spaced repetition, nhắc deadline hoặc kéo người học quay lại sau khi quên. Nhưng notification quá nhiều làm người học học theo phản xạ, không theo kế hoạch. Trong hệ thống AI, notification càng dễ bị lạm dụng vì mô hình có thể dự đoán “thời điểm tương tác cao”. Câu hỏi đạo đức và sư phạm là: thông báo này phục vụ học tập hay phục vụ retention của sản phẩm? Một nhắc nhở tốt nói rõ mục đích: “Đã 6 ngày từ lần cuối em truy hồi khái niệm này; bài ngày mai cần nó.” Một nhắc nhở kém chỉ kích thích lo lắng: “Bạn đang tụt hạng.”

Dashboard quyết định người học nhìn bản thân như thế nào. Paulsen và Lindsay systematic review năm 2024 cho thấy learning analytics dashboards đang dịch chuyển từ analytics-driven sang student-focused và theory-informed hơn, nhưng khuyến nghị vẫn là dashboard phải gắn với learning sciences và affordances hỗ trợ hành động học (Paulsen & Lindsay, 2024). Một dashboard tốt không chỉ báo thời gian học, số bài đúng và vị trí trong lớp. Nó giúp người học hiểu chiến lược: dạng lỗi, mức tự tin, tiến bộ theo thời gian, bước tiếp theo.

Human-centred design càng quan trọng với LA/AI. Alfredo và cộng sự systematic review năm 2024 về human-centred learning analytics and AI in education chỉ ra rằng các hệ thống này có tiềm năng mở rộng nhưng cũng gây lo ngại về privacy, agency, trustworthiness và mức tham gia của stakeholder; end-user involvement trong thiết kế vẫn còn hạn chế (Alfredo et al., 2024). Topali và cộng sự cũng cho thấy nhiều giải pháp LA/AI khó được chấp nhận trong bối cảnh thật vì thiếu pedagogical contextualisation, thiếu tin cậy và chưa đủ chú ý tới nhu cầu stakeholder (Topali et al., 2024).

UX cũng quyết định lỗi được xử lý ra sao. Khi người học sai, hệ thống có làm họ xấu hổ không? Khi AI không chắc, nó có nói không chắc không? Khi bài quá khó, người học có đường quay lại không? Khi người học dùng công nghệ hỗ trợ, giao diện có hỗ trợ keyboard, screen reader, caption và contrast không? Accessibility không phải phần phụ; nó là điều kiện để tải nhận thức không bị đẩy lên vì rào cản giao diện.

Trong lớp học thật, giáo viên thường phải bù cho UX kém: giải thích cách dùng app, nhắc học sinh bấm đúng chỗ, sửa lỗi đăng nhập, dịch dashboard, lọc notification, và trấn an khi hệ thống báo “yếu”. Thiết kế EdTech tốt là thiết kế giảm nhu cầu bù đó. Nó không thay giáo viên, nhưng không bắt giáo viên trở thành nhân viên giải cứu giao diện.

Thực trạng triển khai

Hiện nay nhiều sản phẩm EdTech đã dùng ngôn ngữ của CLT và multimedia learning, nhưng triển khai không đồng đều. Video ngắn, microlearning, interactive simulation, VR lab, AI avatar, dashboard, chatbot và adaptive hints đều có thể hỗ trợ học. Nhưng mỗi công cụ chỉ hữu ích nếu nó giải đúng vấn đề nhận thức.

Microlearning có thể phù hợp với segmenting, nhưng nếu cắt quá vụn, người học mất cấu trúc khái niệm. Video có thể tốt cho demonstration, nhưng nếu không có pause, signaling và câu hỏi truy hồi, nó dễ thành xem thụ động. VR có thể tốt cho không gian, thao tác và tình huống hiếm, nhưng cũng dễ tăng extraneous load vì người học phải điều hướng môi trường, xử lý sensory input và học nội dung cùng lúc. Wen và cộng sự về VR labs cho thấy attentional guidance làm giảm cognitive load, một bằng chứng thực tế rằng immersive learning cần thiết kế chú ý chứ không chỉ thêm độ chìm (Wen et al., 2024).

AI chatbot đang là ví dụ nổi bật nhất của “tải nhận thức hai mặt”. Nó có thể giảm tải bằng cách giải thích vừa trình độ, trả lời câu hỏi ngay, tạo ví dụ và sửa lỗi. Nó cũng có thể tăng tải bằng cách tạo câu trả lời dài, không cấu trúc, hoặc đưa quá nhiều nhánh. Với người mới, câu trả lời AI cần ngắn, có cấu trúc, có bước tiếp theo và yêu cầu người học làm lại. Với người giỏi, AI có thể đưa phản biện, ca ngoại lệ và câu hỏi mở.

Trong học lập trình, một AI assistant có thể giải thích lỗi compiler rất hữu ích. Nhưng nếu nó viết lại toàn bộ code, người học mất cơ hội xây mental model. Thiết kế tốt có thể bắt đầu bằng signaling: dòng lỗi, biến liên quan, giả thuyết lỗi. Sau đó mới gợi câu hỏi: “Em nghĩ giá trị của biến này tại vòng lặp thứ ba là gì?” Nếu người học vẫn kẹt, AI đưa worked example nhỏ. Sau đó fading: bài tiếp theo chỉ gợi nhẹ.

Trong học khoa học, animation có thể giúp thấy quá trình không quan sát được, như phân tử, dòng điện, lực hoặc tế bào. Nhưng animation không tự tạo hiểu. Người học cần biết nhìn vào đâu, dừng ở điểm nào, dự đoán gì, so sánh gì. Nếu animation chạy liên tục, người học có thể nhớ chuyển động bề mặt mà không hiểu quan hệ nhân quả. Segmenting và signaling là điều kiện để animation thành học tập.

Trong dashboard, nhiều nền tảng vẫn ưu tiên số liệu dễ đo: thời gian online, số bài hoàn thành, điểm trung bình, streak. Những chỉ số này có thể hữu ích, nhưng không đủ. Một dashboard sư phạm cần nói về lỗi khái niệm, chiến lược học, mức tự tin, khoảng cách tới mục tiêu, và hành động kế tiếp. Nếu dashboard không giúp quyết định, nó chỉ là gánh nặng hiển thị.

Phân tích phản biện

Ảo tưởng đầu tiên là “giàu media thì học tốt hơn”. Hình, âm thanh, video, animation, avatar và VR chỉ có ích khi chúng làm rõ quan hệ học tập. Nếu chúng chỉ làm trải nghiệm trông hấp dẫn hơn, chúng có thể tăng extraneous processing. Đặc biệt với người mới, sự hấp dẫn bề mặt dễ che lấp thiếu cấu trúc.

Ảo tưởng thứ hai là “cá nhân hóa sẽ tự giảm tải nhận thức”. Cá nhân hóa có thể giảm tải nếu nó chọn đúng mức hỗ trợ, đúng sequence và đúng format. Nhưng cá nhân hóa cũng có thể tăng tải nếu liên tục đổi giao diện, đưa nhiều lựa chọn, hoặc giải thích quyết định thuật toán quá phức tạp. Người học cần sự ổn định đủ để xây thói quen và schema.

Ảo tưởng thứ ba là “người học thích gì thì tốt cho học”. Người học thường thích nội dung trơn tru, gợi ý nhanh, video dễ xem và lời giải đầy đủ. Nhưng học sâu đôi khi cần desirable difficulties: dự đoán, tự giải thích, truy hồi, sửa lỗi. UX tốt không đồng nghĩa loại bỏ mọi ma sát. Nó đặt ma sát đúng chỗ.

Ảo tưởng thứ tư là “AI có thể tự động chọn hình thức tối ưu”. AI có thể dự đoán hành vi, nhưng hành vi không phải học tập. Nếu hệ thống tối ưu lượt tương tác, thời gian ở lại hoặc tỉ lệ hoàn thành, nó có thể chọn nội dung dễ, phản hồi dễ chịu và nhắc nhở nhiều. Đó không nhất thiết là học tốt. Mục tiêu tối ưu phải gắn với retention, transfer, metacognition, equity và wellbeing.

Ảo tưởng thứ năm là “người học càng giỏi càng cần ít thiết kế”. Người giỏi có schema tốt hơn, nhưng họ vẫn cần thách thức đúng, phản hồi tinh và công cụ không cản trở. Expertise reversal không nói bỏ hỗ trợ cho người giỏi; nó nói đổi loại hỗ trợ. Từ hướng dẫn từng bước sang phản biện, từ ví dụ mẫu sang ca ngoại lệ, từ highlight cơ bản sang dữ liệu sâu hơn.

Nguyên tắc thiết kế

Nguyên tắc đầu tiên: loại bỏ nhiễu trước khi thêm tính năng. Mỗi hình, chữ, âm thanh, animation, avatar, thông báo và biểu đồ phải trả lời được câu hỏi: nó phục vụ mục tiêu học nào? Nếu không, ẩn hoặc bỏ.

Nguyên tắc thứ hai: chia nhỏ theo cấu trúc khái niệm, không chỉ theo thời lượng. Segment tốt kết thúc ở một đơn vị hiểu được: một quan hệ, một bước quyết định, một lỗi phổ biến, một điểm dự đoán. Cắt video thành đoạn 60 giây chưa chắc là segmenting tốt.

Nguyên tắc thứ ba: signaling phải chỉ vào quan hệ, không chỉ chỉ vào vật thể. Tô màu một công thức chưa đủ; cần chỉ ra biến nào liên hệ với hiện tượng nào, dữ kiện nào quyết định chiến lược, hoặc bước nào làm thay đổi lập luận.

Nguyên tắc thứ tư: worked examples phải có lý do, rồi fading. Người mới cần ví dụ đã giải, nhưng ví dụ nên giải thích vì sao chọn bước. Sau đó phải rút dần hỗ trợ để người học tự giải.

Nguyên tắc thứ năm: thiết kế theo expertise. Người mới cần hướng dẫn, người trung bình cần luyện phân biệt và fading, người giỏi cần bài transfer, phản biện và ca ngoại lệ. Không nên dùng cùng một giao diện hỗ trợ cho mọi mức.

Nguyên tắc thứ sáu: cho learner control có cấu trúc. Người học nên có thể tua lại, xem transcript, bật caption, mở gợi ý, ẩn lời giải, đổi tốc độ. Nhưng lựa chọn cần ít, rõ và có gợi ý, để control không biến thành tải nhận thức mới.

Nguyên tắc thứ bảy: dashboard phải dẫn tới hành động. Mọi chỉ số nên trả lời: người học nên làm gì tiếp, vì sao, và làm thế nào biết đã cải thiện? Nếu không, chỉ số nên bị giảm ưu tiên.

Nguyên tắc thứ tám: notification phải tôn trọng chú ý. Chỉ nhắc khi có lý do học tập rõ, ưu tiên nhắc theo kế hoạch của người học, và tránh dùng lo âu xã hội như tụt hạng, mất streak hoặc so sánh công khai làm động cơ chính.

Nguyên tắc thứ chín: thiết kế accessibility từ đầu. Caption, transcript, keyboard navigation, contrast, text alternatives, responsive layout và quyền chọn kênh không chỉ giúp một nhóm người học; chúng giảm rào cản nhận thức cho nhiều bối cảnh học.

Tổng kết chương

Tải nhận thức là một trong những thước đo thầm lặng của chất lượng EdTech. Một trải nghiệm học tốt không phải trải nghiệm có nhiều media nhất, nhiều AI nhất hay nhiều tương tác nhất. Nó là trải nghiệm giảm nhiễu không cần thiết, quản lý độ khó cốt lõi và kích hoạt xử lý sâu. Multimedia principles giúp ta quyết định khi nào dùng chữ, hình, âm thanh, video, animation hoặc VR. Worked examples, signaling và segmenting giúp người mới không lạc trong độ phức tạp. Expertise reversal nhắc rằng hỗ trợ phải thay đổi theo trình độ. UX nhắc rằng layout, notification, dashboard và nhịp tương tác đều là quyết định sư phạm.

AI có thể giúp cá nhân hóa các quyết định này, nhưng cũng có thể làm chúng rối hơn. Một AI tutor tốt không chỉ trả lời; nó quản lý tải nhận thức. Một dashboard tốt không chỉ hiển thị; nó giúp hành động. Một VR lab tốt không chỉ tạo cảm giác hiện diện; nó dẫn chú ý. Một avatar tốt không chỉ giống người; nó làm nội dung dễ xử lý hơn mà không chiếm sân khấu.

Chương 15 sẽ chuyển từ tải nhận thức sang động lực và tự điều chỉnh. Nếu chương này hỏi “trải nghiệm có đang bảo vệ khả năng xử lý của người học không?”, chương sau hỏi “trải nghiệm đó có đang nuôi autonomy, competence, relatedness và khả năng tự học lâu dài không, hay đang tạo phụ thuộc vào AI và phần thưởng ngắn hạn?”.

Tài liệu tham khảo

Alfredo, R., Echeverria, V., Jin, Y., Yan, L., Swiecki, Z., Gašević, D., & Martinez-Maldonado, R. (2024). Human-centred learning analytics and AI in education: A systematic literature review. Computers and Education: Artificial Intelligence, 6, 100215. https://doi.org/10.1016/j.caeai.2024.100215

Çeken, B., & Taşkın, N. (2022). Multimedia learning principles in different learning environments: A systematic review. Smart Learning Environments, 9, 19. https://doi.org/10.1186/s40561-022-00200-2

Faber, T. J. E., Dankbaar, M. E. W., van den Broek, W. W., Bruinink, L. J., Hogeveen, M., & van Merriënboer, J. J. G. (2024). Effects of adaptive scaffolding on performance, cognitive load and engagement in game-based learning: A randomized controlled trial. BMC Medical Education, 24, 943. https://doi.org/10.1186/s12909-024-05698-3

Kalyuga, S. (2007). Expertise reversal effect and its implications for learner-tailored instruction. Educational Psychology Review, 19, 509-539. https://doi.org/10.1007/s10648-007-9054-3

Liu, K., & Su, P. (2024). Effectiveness of facial anthropomorphism design for improving multimedia learning outcomes: Systematic review and meta-analysis. Smart Learning Environments, 11, 42. https://doi.org/10.1186/s40561-024-00332-7

Mayer, R. E. (2021). Multimedia Learning (3rd ed.). Cambridge University Press.

Mutlu-Bayraktar, D. (2024). A systematic review of emotional design research in multimedia learning. Education and Information Technologies, 29, 24603-24626. https://doi.org/10.1007/s10639-024-12823-8

Paulsen, L., & Lindsay, E. (2024). Learning analytics dashboards are increasingly becoming about learning and not just analytics: A systematic review. Education and Information Technologies, 29, 14279-14308. https://doi.org/10.1007/s10639-023-12401-4

Renkl, A., Atkinson, R. K., & Große, C. S. (2004). How fading worked solution steps works: A cognitive load perspective. Instructional Science, 32, 59-82. https://doi.org/10.1023/B:TRUC.0000021815.74806.f6

Sozio, G., Agostinho, S., Tindall-Ford, S., & Paas, F. (2024). Enhancing teaching strategies through Cognitive Load Theory: Process vs. product worked examples. Education Sciences, 14(8), 813. https://doi.org/10.3390/educsci14080813

Sweller, J. (1988). Cognitive load during problem solving: Effects on learning. Cognitive Science, 12(2), 257-285. https://doi.org/10.1207/s15516709cog1202_4

Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive Load Theory. Springer. https://doi.org/10.1007/978-1-4419-8126-4

Topali, P., Ortega-Arranz, A., Rodríguez-Triana, M. J., Er, E., Khalil, M., & Akçapınar, G. (2024). Designing human-centered learning analytics and artificial intelligence in education solutions: A systematic literature review. Behaviour & Information Technology. https://doi.org/10.1080/0144929X.2024.2345295

Wen, P., Lu, F., & Mohamad Ali, A. Z. (2024). Using attentional guidance methods in virtual reality laboratories reduces students' cognitive load and improves their academic performance. Virtual Reality, 28, 110. https://doi.org/10.1007/s10055-024-01012-0

Yu, S., Tian, L., Wang, G., & Nie, S. (2024). Which ERP components are effective in measuring cognitive load in multimedia learning? A meta-analysis based on relevant studies. Frontiers in Psychology, 15, 1401005. https://doi.org/10.3389/fpsyg.2024.1401005