Chương 25. AI tutor: gia sư đại chúng hay máy tạo phụ thuộc?

Một học sinh mở AI tutor lúc 11 giờ đêm. Em không dám nhắn cho giáo viên vì sợ làm phiền. Em không hỏi bạn vì bạn cũng đang học. Em không hỏi phụ huynh vì phụ huynh đã quên dạng toán này từ lâu. AI tutor trả lời ngay: kiên nhẫn, không phán xét, giải thích lại ba lần, đổi ví dụ, dùng tiếng Việt giản dị hơn, rồi đưa thêm bài luyện. Với một người học đang mắc kẹt, đó không phải chuyện nhỏ. Đó là một cánh cửa.

Nhưng cảnh ấy có một phiên bản khác. Học sinh mở AI tutor lúc 11 giờ đêm, dán đề bài vào, nhận lời giải, chép lại, qua bài, thấy nhẹ nhõm, rồi tiếp tục. Em không còn bị kẹt, nhưng cũng chưa chắc đã hiểu. AI tutor không mắng, không mệt, không hỏi khó nếu em không yêu cầu, không nhìn thấy ánh mắt trốn tránh, không biết em đang dùng nó như nạng hay như thầy. Đến ngày kiểm tra, khi AI không còn ở đó, em rơi. Cánh cửa lúc trước hóa ra cũng có thể là đường tắt vòng qua việc học.

Đây là mâu thuẫn trung tâm của chương này: AI tutor có thể là một trong những hình thức EdTech đáng giá nhất, vì nó đụng đúng điểm nghẽn cổ điển của giáo dục: thiếu hỗ trợ cá nhân, thiếu phản hồi kịp thời, thiếu thời gian một kèm một. Nhưng AI tutor cũng có thể là một trong những hình thức EdTech nguy hiểm nhất, vì nó rất dễ biến học tập thành nhận đáp án, biến khó khăn thành thứ cần loại bỏ ngay, và biến người học thành người phụ thuộc vào một giọng nói luôn sẵn sàng nghĩ thay.

Tranh luận về AI tutor vì thế không nên bắt đầu bằng câu hỏi “AI có thông minh không?”. Câu hỏi đúng hơn là: “AI tutor này làm người học mạnh hơn hay yếu hơn khi AI rời khỏi bàn học?”. Một công cụ giúp người học làm đúng khi có nó chưa chắc là công cụ giúp người học học. Một gia sư tốt không chỉ giải thích. Gia sư tốt biết lúc nào phải im, lúc nào phải hỏi lại, lúc nào phải cho gợi ý nhỏ, lúc nào phải bắt người học tự nói lý do, lúc nào phải để người học vật lộn thêm một chút, và lúc nào phải chuyển quyền kiểm soát trở lại cho người học.

1. Lời hứa rất cũ của một gia sư cho mỗi người học

Ý tưởng “mỗi người học có một gia sư riêng” không bắt đầu từ AI. Nó là giấc mơ lâu đời của giáo dục. Benjamin Bloom, trong bài “The 2 Sigma Problem” năm 1984, đặt vấn đề rằng dạy kèm một-một có thể tạo kết quả vượt trội so với lớp học truyền thống, nhưng thách thức là làm sao tìm được phương pháp dạy nhóm hiệu quả gần như dạy kèm cá nhân.[^bloom-2sigma] Từ đó đến nay, tutoring luôn có sức hút đặc biệt vì nó giải quyết một thực tế rất người: người học không hiểu theo cùng tốc độ, không mắc lỗi giống nhau, không cần cùng lời giải thích, và không dám hỏi cùng một kiểu.

Bằng chứng về tutoring nói chung khá mạnh. Education Endowment Foundation đánh giá one-to-one tuition có tác động trung bình khoảng năm tháng tiến bộ bổ sung, với điều kiện hỗ trợ được thiết kế tốt, gắn với bài học chính, có phiên ngắn đều đặn, người dạy được chuẩn bị, và tiến độ được theo dõi.[^eef-tuition] Nhưng chính điểm mạnh ấy cũng là điểm đắt: tutoring tốt cần người, thời gian, lịch, đào tạo, quản lý chất lượng và quan hệ ổn định. Gia đình có tiền có thể mua gia sư. Trường giàu có thể tổ chức hỗ trợ nhỏ nhóm. Trường nghèo, lớp đông, vùng thiếu giáo viên, người học đi làm, người học ở xa, người học cần hỏi lúc nửa đêm thì thường không có.

Đây là lý do AI tutor làm nhiều người phấn khích. Nó hứa hẹn đưa một dạng hỗ trợ cá nhân đến quy mô mà human tutoring khó đạt: 24/7, chi phí biên thấp hơn, đa ngôn ngữ hơn, không mệt, không chê bai, không bận họp, không chỉ dành cho người có tiền. Nếu một học sinh vùng xa có thể nhận giải thích cá nhân ngay khi mắc kẹt, nếu một sinh viên thế hệ đầu tiên vào đại học có thể hỏi lại khái niệm căn bản mà không sợ xấu hổ, nếu một người đi làm có thể học sau ca tối với một trợ lý kiên nhẫn, thì AI tutor không phải món đồ chơi. Nó có thể là hạ tầng công bằng.

Nhưng lời hứa này có một cái bẫy: càng giống gia sư, AI tutor càng dễ được tin như gia sư. Trong khi đó, gia sư người có trách nhiệm sư phạm, hiểu bối cảnh, có thể chịu trách nhiệm trước học sinh, phụ huynh, trường, nghề nghiệp và lương tâm. AI tutor là một hệ thống. Nó có thể nói trôi chảy nhưng sai. Nó có thể giải thích hợp lý nhưng thiếu sư phạm. Nó có thể quá chiều người học. Nó có thể cho đáp án vì “hữu ích” theo logic sản phẩm, trong khi giáo dục cần hữu ích theo logic học tập.

2. Các bên trong cuộc tranh luận

Người học nói: “Tôi cần ai đó giúp ngay khi tôi không hiểu.” Đây là nhu cầu chính đáng. Lớp học đông không thể dừng cho từng người. Giáo viên không thể trả lời mọi câu hỏi lúc 11 giờ đêm. Bạn học không phải lúc nào cũng biết. Phụ huynh không phải lúc nào cũng đủ chuyên môn. Một AI tutor có thể tạo vùng thử an toàn: hỏi lại không xấu hổ, luyện sai không bị cười, nhờ giải thích đơn giản hơn không thấy mình kém.

Giáo viên nói: “Tôi muốn học sinh có thêm hỗ trợ, nhưng không muốn AI làm hỏng thói quen học.” Đây cũng là nỗi lo thật. Giáo viên biết có những khoảnh khắc khó chịu nhưng cần thiết: học sinh phải tự nhớ lại, tự thử bước đầu, tự nhận ra mâu thuẫn, tự giải thích vì sao, tự chịu vài phút chưa có đáp án. Nếu AI tutor cắt bỏ toàn bộ khó chịu ấy, nó có thể làm quá trình học trông mượt hơn nhưng nông hơn.

Phụ huynh nói: “Nếu con tôi có gia sư AI rẻ hơn, tôi muốn thử.” Không thể trách họ. Thị trường gia sư rất bất bình đẳng. Nhiều gia đình muốn con được hỗ trợ nhưng không đủ tiền. Một AI tutor tốt có thể giảm khoảng cách tiếp cận. Nhưng phụ huynh cũng có thể hỏi: “Ai kiểm soát chất lượng? Con tôi hỏi gì? Dữ liệu đi đâu? AI có làm con phụ thuộc không? Nếu con tin AI hơn giáo viên thì sao?”

Nhà trường nói: “AI tutor có thể mở rộng hỗ trợ mà chúng tôi không đủ nhân lực để cung cấp.” Đây là áp lực vận hành thật. Một trường có hàng nghìn học sinh không thể có gia sư người cho từng em. AI tutor có thể làm lớp bổ trợ, remedial practice, feedback tức thì, pre-class preparation, hoặc hỗ trợ ôn tập. Nhưng nhà trường cũng phải đối mặt với câu hỏi: nếu AI tutor trở thành cách rẻ để thay thế hỗ trợ người thật, trường đang mở rộng cơ hội hay hợp lý hóa việc thiếu đầu tư vào con người?

Vendor nói: “Chúng tôi có thể cá nhân hóa học tập ở quy mô lớn.” Có thể đúng. Nhưng vendor cũng có động lực tăng usage, retention, dữ liệu, subscription, lock-in và câu chuyện tăng trưởng. Một AI tutor càng được dùng nhiều càng có giá trị thương mại. Vì vậy, cần hỏi liệu sản phẩm tối ưu cho learning gain dài hạn hay tối ưu cho cảm giác được giúp ngay lập tức. Hai thứ này có thể trùng nhau, nhưng không phải lúc nào cũng trùng.

Nhà quản lý nói: “AI tutor cần guardrail, đặc biệt với trẻ em.” Đây không phải thái độ cản trở đổi mới. UNESCO trong guidance về GenAI nhấn mạnh cách tiếp cận human-centred, age-appropriate, bảo vệ privacy, human agency và thiết kế sư phạm có kiểm định.[^unesco-genai] UNICEF cũng đặt yêu cầu child-centred AI, an toàn, bảo vệ dữ liệu và quyền trẻ em.[^unicef-ai-children] Một AI tutor cho trẻ em không thể chỉ là chatbot đa năng khoác áo giáo dục.

AI tutor, nếu được nhân hóa trong cuộc tranh luận, có thể nói: “Tôi chỉ trả lời điều người học hỏi.” Nhưng đó chính là vấn đề. Gia sư giáo dục không chỉ trả lời câu hỏi được hỏi. Gia sư tốt phát hiện câu hỏi chưa được hỏi, hiểu khi nào câu hỏi đang né việc học, và biết nhiệm vụ của mình không phải làm người học hài lòng trong từng phút, mà là làm họ có năng lực hơn sau một thời gian.

3. AI tutor có thể giải quyết một thiếu hụt rất thật

Không nên phê phán AI tutor bằng cách giả vờ rằng lớp học hiện tại đã đủ hỗ trợ cá nhân. Rất nhiều người học đang bị bỏ lại không phải vì giáo viên không tốt, mà vì giáo viên bị đặt vào cấu trúc bất khả thi: 30, 40, 60, thậm chí hàng trăm người học; chương trình dày; thời gian ngắn; áp lực kiểm tra; khác biệt nền tảng quá lớn. Trong cấu trúc đó, nhiều câu hỏi cá nhân không bao giờ được hỏi, nhiều lỗi nhỏ tích tụ thành lỗ hổng lớn, nhiều người học yếu học cách im lặng cho qua.

AI tutor có thể giúp ở những việc mà lớp học đại trà làm kém: phản hồi tức thì, luyện tập thích ứng, giải thích lại bằng nhiều cách, cung cấp ví dụ gần với bối cảnh người học, phát hiện lỗ hổng kỹ năng cơ bản, cho phép học lại mà không xấu hổ, hỗ trợ ngôn ngữ, và giúp người học tự kiểm tra trước khi vào lớp. Trong một số môn có cấu trúc rõ như toán cơ bản, vật lý nhập môn, ngữ pháp, lập trình căn bản, luyện đọc, luyện từ vựng, hay chuẩn bị kiến thức nền, AI tutor có thể đặc biệt hữu ích nếu nội dung được thiết kế tốt.

Nghiên cứu về intelligent tutoring systems trước thời GenAI cũng không phải con số không. Các meta-analysis về ITS cho thấy hệ thống dạy kèm thông minh có thể tạo tác động tích cực so với nhiều hình thức học khác, dù hiệu quả phụ thuộc vào bối cảnh, loại bài đo, thiết kế nội dung và chất lượng triển khai.[^ma-its][^kulik-fletcher] Điều này nhắc ta rằng “AI tutor” không phải phép màu mới hoàn toàn, mà là phiên bản mới của một dòng phát triển lâu dài: dùng mô hình người học, phản hồi cá nhân và chuỗi bài tập thích ứng để hỗ trợ học.

GenAI thêm một năng lực mới: đối thoại tự nhiên. Trước đây, nhiều ITS mạnh ở bài tập có cấu trúc nhưng cứng ở giao tiếp. GenAI có thể giải thích mềm hơn, đổi giọng, hỏi lại, tạo ví dụ, mô phỏng cuộc trò chuyện, hỗ trợ nhiều môn mở hơn. Một RCT năm 2025 trên sinh viên vật lý đại học tại Harvard cho thấy một AI tutor được thiết kế cẩn thận theo nguyên tắc sư phạm, có scaffold, prompt chuyên biệt và nội dung chuẩn bị kỹ, giúp sinh viên học nhiều hơn trong ít thời gian hơn so với buổi active learning trên cùng nội dung; tác giả cũng nhấn mạnh thành công phụ thuộc vào thiết kế có chủ đích, không phải cứ chatbot là tutor.[^kestin-ai-tutor]

Đó là điểm cần giữ: AI tutor có thể hiệu quả thật, nhưng bằng chứng tích cực thường đến từ hệ thống được thiết kế như môi trường học, không phải từ một ô chat tự do “hỏi gì cũng đáp”. Một AI tutor tốt là sản phẩm sư phạm được xây trên mục tiêu học, tiến trình, gợi ý, kiểm tra hiểu, feedback và giới hạn. Một chatbot giỏi nói không tự động là gia sư giỏi.

4. Nhưng trả lời nhanh không đồng nghĩa với dạy tốt

AI tutor dễ tạo cảm giác học vì nó làm ma sát biến mất. Người học hỏi, nó trả lời. Người học không hiểu, nó giải thích lại. Người học cần bài mẫu, nó tạo. Người học cần tóm tắt, nó tóm tắt. Người học cần dàn ý, nó cho. Người học cần lời giải, nó viết. Tất cả diễn ra nhanh đến mức ta có thể nhầm tốc độ hoàn thành với tốc độ học.

Giáo dục có một nghịch lý: một số ma sát là lãng phí, nhưng một số ma sát là học tập. Không hiểu vì lời giảng mơ hồ là ma sát xấu. Chờ giáo viên phản hồi ba tuần là ma sát xấu. Không có ai giải thích nền tảng là ma sát xấu. Nhưng phải tự nhớ lại trước khi xem đáp án là ma sát tốt. Phải thử lập luận và thấy nó vỡ là ma sát tốt. Phải giải thích bằng lời của mình là ma sát tốt. Phải chịu vài phút chưa biết để não tìm đường là ma sát tốt.

AI tutor xấu không phân biệt được hai loại ma sát này. Nó loại bỏ cả hai. Nó làm người học thoải mái hơn nhưng không nhất thiết mạnh hơn. Trong thiết kế sản phẩm, “frictionless” thường là lời khen. Trong học tập, frictionless có thể là tai họa nếu nó loại bỏ retrieval practice, productive struggle, metacognitive monitoring và ownership. Một AI tutor luôn cho câu trả lời đầy đủ ngay lập tức có thể giống người bạn quá tốt bụng trong phòng thi thử: bạn thấy mình làm được, nhưng thật ra người khác đang làm thay phần quan trọng nhất.

Nghiên cứu PNAS năm 2025 của Bastani và cộng sự rất đáng đưa vào trung tâm tranh luận này. Trong một field experiment với gần một nghìn học sinh trung học học toán, nhóm có GPT-4 hỗ trợ làm bài luyện có kết quả thực hành tốt hơn, nhưng khi quyền truy cập AI bị lấy đi, nhóm dùng giao diện GPT Base lại làm bài kém hơn nhóm không được dùng AI; tác giả kết luận GenAI không có guardrail có thể làm hại việc học vì học sinh dùng nó như “crutch”, trong khi phiên bản GPT Tutor có guardrail, đặc biệt gợi ý do giáo viên thiết kế thay vì đưa đáp án, giảm đáng kể tác hại này.[^bastani-pnas]

Điểm quan trọng không phải “AI có hại”. Điểm quan trọng là “AI không có thiết kế sư phạm có thể làm hại, dù làm điểm luyện tập tăng”. Đây là một mũi dao sắc vào cách nhiều sản phẩm khoe hiệu quả: nếu chỉ đo số bài làm đúng khi AI đang bật, ta có thể tưởng sản phẩm rất tốt. Benchmark đúng phải đo khi AI rút lui: người học còn làm được không, có giải thích được không, có chuyển kiến thức sang bài mới không, có phát hiện lỗi của AI không, có biết khi nào không nên hỏi AI không.

5. Người học mới cần AI nhất, nhưng cũng dễ bị AI dẫn sai nhất

Người học mới là nhóm AI tutor hứa giúp nhiều nhất. Họ có nhiều lỗ hổng, ít tự tin, dễ xấu hổ, cần giải thích nền, cần phản hồi tức thì. Nhưng chính vì mới, họ cũng khó đánh giá AI. Một sinh viên năm nhất khó biết lời giải có thiếu điều kiện. Một học sinh lớp 8 khó phát hiện lập luận toán nghe trôi nhưng sai. Một người mới học lập trình khó biết code chạy được nhưng không tốt. Một người học ngoại ngữ khó biết câu trả lời nghe tự nhiên hay chỉ nghe tự nhiên với AI.

Đây là nghịch lý năng lực: càng cần hỗ trợ, người học càng thiếu khả năng kiểm định hỗ trợ. Người học giỏi có thể dùng AI như sparring partner: hỏi, nghi ngờ, kiểm tra, yêu cầu phản ví dụ, so sánh phương pháp. Người học yếu dễ dùng AI như nguồn chân lý. Người học có metacognition tốt biết khi nào mình hiểu giả. Người học mới có thể thấy “AI giải được” và tưởng “mình hiểu”. Người học có nền tảng biết yêu cầu AI dừng ở gợi ý. Người học mới thường muốn đáp án vì họ đang căng thẳng.

Vì vậy, AI tutor cho novice learners phải thận trọng hơn, không phải thoải mái hơn. Nó phải hạn chế trả lời trọn gói ở những điểm cần luyện. Nó phải yêu cầu người học dự đoán bước tiếp theo. Nó phải hỏi “vì sao em chọn cách này?”. Nó phải phát hiện khi người học chỉ gõ “cho đáp án”. Nó phải có chế độ scaffold theo tuổi và mức năng lực. Nó phải biết khi nào nói “hãy thử bước đầu trước, tôi sẽ xem”. Nó phải giúp người học xây năng lực đánh giá lời giải, không chỉ nhận lời giải.

UNESCO AI competency framework for students đặt trọng tâm vào human-centred mindset, ethics of AI, AI techniques/applications và AI system design, với mục tiêu người học có critical judgement và khả năng dùng AI an toàn, có trách nhiệm.[^unesco-students] Điều này rất quan trọng: nếu trường đưa AI tutor vào lớp nhưng không dạy người học cách nghi ngờ, kiểm tra, giới hạn và dùng AI như công cụ học, trường đang trao một động cơ mạnh cho người chưa học lái.

6. Sự phụ thuộc không chỉ là lười

Khi nói người học phụ thuộc AI, ta rất dễ đạo đức hóa: “học sinh lười”, “sinh viên gian”, “thế hệ này không chịu nghĩ”. Cách nói đó vừa thiếu công bằng vừa thiếu chính xác. Phụ thuộc không chỉ đến từ lười. Nó đến từ thiết kế, áp lực và cảm xúc. Nếu hệ thống chấm điểm ưu tiên đúng nhanh, người học sẽ tìm công cụ đúng nhanh. Nếu bài tập quá nhiều, AI trở thành cách sống sót. Nếu lớp học không tạo an toàn để hỏi, AI trở thành người duy nhất không phán xét. Nếu người học bị ám ảnh điểm số, họ sẽ chọn đáp án hơn hiểu. Nếu sản phẩm thưởng completion, nó khuyến khích hoàn thành. Nếu AI luôn trả lời đầy đủ, nó huấn luyện thói quen nhận hơn là nghĩ.

Một systematic review năm 2024 về over-reliance vào AI dialogue systems cho thấy vấn đề không chỉ là đạo đức chung chung, mà liên quan đến critical thinking, decision-making, analytical reasoning, automation bias, hallucination, transparency và xu hướng chấp nhận đầu ra AI mà không kiểm chứng.[^zhai-overreliance] Dù literature còn đang phát triển, hướng cảnh báo rất rõ: khi AI trở thành nguồn trả lời mặc định, người học có thể mất dần thói quen dừng lại để đánh giá.

Phụ thuộc có nhiều dạng. Phụ thuộc nhận thức là khi người học không còn tự khởi động suy nghĩ nếu chưa hỏi AI. Phụ thuộc cảm xúc là khi người học chỉ thấy yên tâm nếu AI xác nhận. Phụ thuộc quy trình là khi mọi bước học, từ đọc, tóm tắt, lập dàn ý, giải bài, sửa lỗi, phản biện, đều đi qua AI. Phụ thuộc thể chế là khi trường thiếu hỗ trợ người thật và đẩy người học sang AI như tuyến đầu. Phụ thuộc kinh tế là khi vendor trở thành hạ tầng học tập không thể thay thế.

Không phải mọi phụ thuộc đều xấu. Học tập luôn dựa vào công cụ: sách, thầy, bạn, máy tính, thư viện, phần mềm. Vấn đề là công cụ có làm năng lực nội tại lớn lên hay teo lại. Máy tính bỏ túi không xấu trong mọi trường hợp, nhưng nếu dùng trước khi hiểu số học, nó làm yếu cảm giác số. Từ điển không xấu, nhưng nếu dùng để né việc đoán nghĩa từ ngữ cảnh, nó làm chậm đọc. AI tutor cũng vậy. Nó tốt khi dần rút scaffold. Nó xấu khi scaffold trở thành nhà tù êm ái.

7. Gia sư tốt không chỉ biết nói, mà biết trì hoãn đáp án

Một AI tutor tốt phải có khả năng chống lại bản năng “helpful” quá mức. Trong nhiều sản phẩm AI tổng quát, helpful nghĩa là trả lời nhanh, đầy đủ, dễ chịu. Trong giáo dục, helpful đôi khi nghĩa là không trả lời ngay. Helpful là đưa một gợi ý nhỏ thay vì lời giải. Helpful là hỏi người học đã thử gì. Helpful là yêu cầu dự đoán. Helpful là phát hiện câu trả lời đúng nhưng may mắn. Helpful là bắt người học giải thích lại. Helpful là nói: “Tôi có thể giải, nhưng trước hết em hãy chọn bước tiếp theo.”

Đây là sự khác biệt giữa answer engine và tutor. Answer engine tối ưu đầu ra. Tutor tối ưu quá trình hình thành năng lực. Answer engine làm người dùng hài lòng. Tutor đôi khi làm người học hơi khó chịu vì phải nghĩ. Answer engine kết thúc khi có đáp án. Tutor kết thúc khi người học có thể tự đi thêm một đoạn. Answer engine hỏi “bạn muốn biết gì?”. Tutor hỏi “bạn đang hiểu gì, chưa hiểu gì, và cần làm gì tiếp?”.

Thiết kế này có thể rất cụ thể. Với bài toán, AI tutor nên yêu cầu người học nêu dữ kiện, chọn công thức, giải thích vì sao công thức phù hợp, thử bước đầu, rồi mới gợi ý. Với lập trình, AI tutor nên hỏi lỗi xảy ra ở đâu, người học đã đọc stack trace chưa, giả thuyết debug là gì, rồi mới đề xuất sửa. Với viết luận, AI tutor nên phản hồi thesis, cấu trúc và bằng chứng, nhưng không viết hộ đoạn cốt lõi nếu mục tiêu là học viết. Với ngoại ngữ, AI tutor có thể sửa lỗi nhưng nên hỏi người học tự sửa trước ở một số điểm. Với đọc hiểu, AI tutor nên yêu cầu trích bằng chứng từ văn bản, không chỉ tóm tắt.

Bastani et al. cho thấy guardrail không phải chuyện trang trí: phiên bản GPT Tutor có cấu trúc gợi ý và hạn chế đưa đáp án đã giảm tác hại so với giao diện giống ChatGPT.[^bastani-pnas] Kestin et al. cũng cho thấy AI tutor hiệu quả trong bối cảnh họ thiết kế chặt bằng prompt, scaffold tuần tự, nội dung do chuyên gia chuẩn bị, và tránh để model tự do xử lý mọi thứ.[^kestin-ai-tutor] Hai bằng chứng này, một tích cực và một cảnh báo, gặp nhau ở cùng kết luận: thiết kế sư phạm quyết định AI tutor là gia sư hay máy làm hộ.

8. AI tutor phải biết chuyển quyền về người học

Một tutor tốt có đường cong hỗ trợ. Ban đầu hỗ trợ nhiều, sau đó giảm dần. Ban đầu làm mẫu, sau đó gợi ý. Ban đầu nhắc từng bước, sau đó yêu cầu người học tự lập kế hoạch. Ban đầu kiểm tra lỗi, sau đó hỏi người học tự kiểm tra. Nếu AI tutor hỗ trợ cùng một mức mãi, người học không lớn lên. Nếu nó càng dùng càng làm người học phải nghĩ ít hơn, sản phẩm đang đi ngược giáo dục.

Điều này có thể được thiết kế bằng cơ chế “fading”. Ở lần đầu gặp dạng bài, AI có thể giải thích nhiều. Ở lần thứ hai, chỉ cho hint. Ở lần thứ ba, yêu cầu người học tự giải rồi phản hồi. Ở lần thứ tư, chỉ hỏi câu kiểm tra. Ở lần thứ năm, đưa bài chuyển giao. Sau một số vòng, AI không nên cứ chiều theo câu “giải giúp em”, mà cần nói: “Với dạng này em đã luyện ba lần. Bây giờ em làm trước, tôi chỉ phản hồi.” Nếu mục tiêu là học, hệ thống phải biết từ chối một số yêu cầu làm hộ.

Chuyển quyền cũng nghĩa là dạy người học dùng AI như công cụ tự kiểm. Người học cần biết hỏi AI tạo phản ví dụ, kiểm tra lập luận, yêu cầu rubric, so sánh hai lời giải, tìm lỗi trong lời giải của mình, tạo bài tương tự, đóng vai giám khảo, hoặc hỏi “điểm yếu trong cách hiểu của tôi là gì?”. Đây là cách dùng AI nâng năng lực. Ngược lại, câu hỏi “làm bài này cho tôi” là cách dùng AI thay thế năng lực.

Một AI tutor trưởng thành nên có một mục tiêu ẩn nhưng quan trọng: làm người học cần nó ít hơn ở cùng dạng nhiệm vụ. Nếu sau ba tháng người học vẫn hỏi AI cùng một kiểu, cùng một mức, cùng một dạng, sản phẩm cần xem lại. Retention của sản phẩm có thể tăng, nhưng agency của người học không tăng. Và trong giáo dục, retention của người dùng không thể là thước đo tối cao nếu nó được mua bằng phụ thuộc.

9. AI tutor không được thay thế quan hệ giáo viên

Luận điểm “AI tutor không thay giáo viên” dễ thành khẩu hiệu an toàn. Cần nói cụ thể hơn: AI tutor không thay thế giáo viên vì giáo viên không chỉ truyền lời giải. Giáo viên tạo kỳ vọng, đọc bối cảnh, xây văn hóa lớp, tổ chức tranh luận, nhận ra khi người học né tránh, gắn nội dung với đời sống, đưa ra chuẩn mực, giữ trách nhiệm, và đôi khi nói một câu làm người học nhớ nhiều năm. AI tutor có thể mô phỏng đối thoại, nhưng nó không đứng trong cộng đồng học tập theo cùng cách.

Điều đó không làm AI tutor yếu. Nó định vị đúng vai. AI tutor có thể xử lý một số việc nền: luyện tập, giải thích lại, chuẩn bị trước lớp, remedial support, tạo bài tương tự, phản hồi tức thì, giúp người học tự đánh giá. Khi đó, thời gian giáo viên có thể được giải phóng cho những việc mà con người làm tốt hơn: thảo luận, dự án, phản biện, kết nối, quan sát, đánh giá sâu, xây quan hệ, hỗ trợ cảm xúc, và xử lý mâu thuẫn.

Mô hình tốt không phải “AI tutor thay thầy”, mà là “AI tutor nâng chất lượng thời gian với thầy”. Kestin et al. cũng đề xuất AI có thể dùng để đưa sinh viên lên mức chuẩn bị tốt hơn trước lớp, để thời gian lớp dành cho kỹ năng bậc cao như problem solving nâng cao, project-based learning và hoạt động nhóm.[^kestin-ai-tutor] Đây là hướng hợp lý: AI làm phần luyện cá nhân có cấu trúc, còn lớp học người-người làm phần mà học tập cần xã hội, đạo đức và phán đoán.

Nhưng mô hình này chỉ tốt nếu nhà trường không dùng AI tutor như lý do cắt hỗ trợ người thật. Nếu AI tutor được triển khai vào nơi thiếu giáo viên, thiếu cố vấn, thiếu phản hồi, thiếu cộng đồng, rồi được quảng cáo là “cá nhân hóa”, ta phải hỏi: công nghệ đang mở rộng cơ hội hay đang che một sự rút lui của tổ chức? Một trường có thể dùng AI để chăm sóc tốt hơn. Một trường cũng có thể dùng AI để làm thiếu chăm sóc trông hiện đại hơn.

10. AI tutor phải có ranh giới vai trò

Một AI tutor càng đa năng càng cần ranh giới. Nó có thể giúp học toán, nhưng có nên tư vấn sức khỏe tinh thần? Nó có thể giúp viết luận, nhưng có nên viết thay? Nó có thể giải thích lịch sử, nhưng có nên kết luận quan điểm chính trị cho người học? Nó có thể gợi ý lộ trình học, nhưng có nên khuyên bỏ ngành? Nó có thể nghe người học tâm sự, nhưng có nên trở thành bạn thân mặc định? Nó có thể phát hiện distress, nhưng có nên tự động báo cho ai? Nó có thể biết rất nhiều, nhưng có nên được phép dùng mọi điều nó biết?

Ranh giới vai trò không làm AI tutor kém hữu ích. Nó làm AI tutor đáng tin hơn. Một hệ thống giáo dục nên nói rõ: AI tutor này dùng cho mục tiêu học nào, không dùng cho mục tiêu nào; khi nào nó phải khuyên hỏi giáo viên; khi nào nó phải chuyển người học sang hỗ trợ người thật; khi nào nó không được trả lời; khi nào nó không được lưu; khi nào nó không được dùng dữ liệu để huấn luyện; khi nào phụ huynh/giáo viên được xem tín hiệu; khi nào họ không được xem nội dung riêng tư.

Với trẻ em, ranh giới càng quan trọng. UNESCO guidance về GenAI trong giáo dục đề xuất cách tiếp cận age-appropriate và nhấn mạnh cần bảo vệ privacy, human agency, equity và validation sư phạm trước khi đưa công cụ vào giáo dục.[^unesco-genai] UNICEF 2025 cũng nhấn mạnh AI cho trẻ em phải đặt safety, data privacy, fairness, transparency, accountability và rights ở trung tâm.[^unicef-ai-children] AI tutor cho trẻ 10 tuổi không thể chỉ là ChatGPT đổi avatar. Nó phải là môi trường học được giới hạn theo tuổi, có nội dung phù hợp, có escalation, có kiểm soát dữ liệu và có người lớn chịu trách nhiệm.

Ranh giới cũng cần với người lớn. Một sinh viên đại học có thể dùng AI tutor linh hoạt hơn, nhưng nếu AI tham gia vào assessment, advising, mental health, career decision hoặc academic integrity, rủi ro tăng. Một AI tutor trong luyện tập khác AI tutor trong kỳ thi. Một AI tutor riêng tư khác AI tutor ghi log cho giáo viên. Một AI tutor phản hồi formative khác AI tutor tạo điểm. Cùng một công nghệ, quyền lực khác nhau theo bối cảnh.

11. Benchmark đúng: AI tutor làm người học tự học tốt hơn không?

Benchmark tệ hỏi: người học dùng AI tutor bao nhiêu phút, gửi bao nhiêu tin nhắn, hoàn thành bao nhiêu bài, rating hài lòng bao nhiêu, số câu trả lời đúng khi có AI là bao nhiêu. Những chỉ số này không vô nghĩa, nhưng chúng quá dễ bị thổi phồng. Một sản phẩm có thể tăng usage bằng cách tạo phụ thuộc. Có thể tăng completion bằng cách cho lời giải. Có thể tăng satisfaction bằng cách luôn đồng ý. Có thể tăng “engagement” bằng cách trò chuyện dễ chịu. Có thể tăng điểm luyện tập bằng cách làm hộ phần khó.

Benchmark tốt hỏi: khi không có AI, người học có làm tốt hơn không? Người học có giải thích được không? Có phát hiện lỗi của AI không? Có chuyển kiến thức sang dạng mới không? Có giảm yêu cầu đáp án trực tiếp theo thời gian không? Có tăng câu hỏi metacognitive không? Có biết chọn chiến lược học không? Có tự kiểm tra tốt hơn không? Có bớt xấu hổ khi hỏi giáo viên không? Có dùng thời gian lớp chất lượng hơn không? Có giảm khoảng cách giữa nhóm yếu và nhóm mạnh không? Có tác động khác nhau theo tuổi, giới, ngôn ngữ, kinh tế, khuyết tật, prior knowledge không?

Benchmark còn phải phân biệt learning performance và learning acquisition. Performance là làm tốt trong lúc có hỗ trợ. Acquisition là năng lực còn lại khi hỗ trợ rút đi. Bastani et al. làm rõ sự khác biệt này: truy cập GPT-4 có thể tăng kết quả trong lúc luyện, nhưng khi không còn AI, nhóm dùng GPT Base làm kém hơn nhóm không dùng AI; guardrail giúp giảm tác hại.[^bastani-pnas] Vì vậy, mọi đánh giá AI tutor nghiêm túc phải có bài kiểm tra transfer và delayed assessment, không chỉ immediate correctness.

Benchmark cũng phải đo tác động lên giáo viên. AI tutor có giúp giáo viên hiểu lỗ hổng của lớp mà không xâm phạm riêng tư không? Có giảm việc phản hồi lặp lại để giáo viên tập trung vào phản hồi sâu không? Có tạo thêm workload xử lý alert không? Có khiến phụ huynh hỏi giáo viên nhiều hơn vì dashboard gây lo lắng không? Có làm giáo viên phải sửa lỗi AI không? Có khiến trường đánh giá giáo viên qua usage của AI tutor không?

Và benchmark phải đo quyền. Người học có biết dữ liệu chat dùng làm gì không? Có xóa được không? Có chế độ riêng tư không? AI có được dùng cho kỷ luật không? Có human review khi có tín hiệu rủi ro không? Có cơ chế khiếu nại nếu AI hướng sai không? Có audit nội dung và bias không? AI tutor cho giáo dục không thể chỉ benchmark bằng learning gain. Nó còn phải benchmark bằng agency, equity, privacy và trust.

12. Thiết kế sản phẩm: AI tutor như người giữ nhịp học, không phải máy cho đáp án

Nếu thiết kế một AI tutor theo tinh thần chương này, tôi sẽ bắt đầu từ curriculum chứ không phải model. Câu hỏi đầu tiên là người học cần đạt năng lực nào, lỗi thường gặp là gì, dạng hỗ trợ nào phù hợp với từng giai đoạn, lúc nào cần gợi ý, lúc nào cần làm mẫu, lúc nào cần kiểm tra transfer, lúc nào cần chuyển sang giáo viên. Model mạnh chỉ là một thành phần. Gia sư tốt cần bản đồ sư phạm.

Luồng học nên được cấu trúc theo chu kỳ: người học thử trước; AI hỏi người học đang nghĩ gì; AI phản hồi vào bước sai cụ thể; AI đưa hint tăng dần thay vì đáp án ngay; người học tự sửa; AI yêu cầu giải thích lại; AI đưa bài tương tự; AI sau đó đưa bài chuyển giao; cuối cùng AI tạo một báo cáo ngắn cho người học về điểm cần luyện tiếp. Ở một số trường hợp, AI có thể giải trọn bài để làm mẫu, nhưng việc đó phải được đánh dấu là mode học mẫu, không phải mode làm bài thay.

AI tutor cũng cần chế độ “không làm hộ”. Khi người học yêu cầu viết cả bài luận, AI có thể giúp phân tích đề, hỏi thesis, gợi ý cấu trúc, phản biện luận điểm, đề xuất nguồn cần tìm, nhưng không viết toàn bộ bài nếu mục tiêu là đánh giá năng lực viết. Khi người học yêu cầu giải toàn bộ bài toán homework, AI có thể yêu cầu người học đưa bước đã thử, rồi gợi ý. Khi người học dán code và yêu cầu sửa, AI có thể hỏi lỗi, log, giả thuyết, rồi chỉ ra vùng cần xem. Nói cách khác, AI tutor phải có đạo đức từ chối.

Sản phẩm cũng nên có “learning contract” rõ với người học: tôi ở đây để giúp bạn học, không phải để làm thay; tôi sẽ cho đáp án trong một số trường hợp học mẫu, nhưng thường sẽ hỏi lại và yêu cầu bạn thử; tôi có thể sai, bạn cần kiểm tra; dữ liệu của bạn được xử lý như sau; khi vấn đề vượt vai trò của tôi, tôi sẽ gợi ý hỏi người thật. Một hợp đồng như vậy không chỉ là UX. Nó đặt chuẩn quan hệ giữa người học và máy.

Với giáo viên, AI tutor nên trả về insight ở mức phù hợp: misconception phổ biến, dạng bài nhiều người mắc, câu hỏi thường gặp, phần nội dung cần dạy lại, không phải toàn bộ nội dung riêng tư của từng cuộc chat. Với người học, AI tutor nên hiển thị tiến bộ theo năng lực và chiến lược, không chỉ số phút dùng. Với phụ huynh, nếu là trẻ nhỏ, hệ thống nên cung cấp thông tin hỗ trợ vừa đủ, không biến phụ huynh thành người đọc từng dấu vết học tập.

13. Khi AI tutor tốt nhất là người mở đường đến người thật

Một nghịch lý đẹp: AI tutor tốt đôi khi không giữ người học ở lại với AI, mà đưa người học đến người thật. Nếu AI phát hiện người học mắc cùng lỗi nhiều lần, nó nên gợi ý hỏi giáo viên. Nếu người học bối rối vì mục tiêu học, nó nên gợi ý trao đổi với cố vấn. Nếu người học có dấu hiệu distress, nó phải có quy trình hỗ trợ phù hợp, không tự đóng vai nhà trị liệu. Nếu người học cần tranh luận đạo đức, sáng tạo, dự án, hoặc feedback sâu về bản sắc viết, AI có thể chuẩn bị nhưng không nên độc chiếm.

Trong thiết kế này, AI tutor là tuyến hỗ trợ đầu, không phải toàn bộ hệ sinh thái. Nó giúp người học đến lớp với câu hỏi tốt hơn. Nó giúp giáo viên biết nên tập trung vào đâu. Nó giúp phụ huynh hỗ trợ mà không hoảng. Nó giúp trường phát hiện lỗ hổng thiết kế. Nó giúp người học yếu có thêm cơ hội bước vào cuộc trò chuyện với người thật. Nếu AI tutor làm người học ngày càng ít hỏi người thật, ít làm việc với bạn, ít tham gia lớp, ít chịu va chạm lập luận, thì dù sản phẩm “engagement cao”, giáo dục đang nghèo đi.

Ở đây, ta cần nhớ lại chương wellbeing và quan hệ người-người. Người học không chỉ cần câu trả lời. Họ cần được nhìn thấy bởi người khác, cần thuộc về một cộng đồng, cần học cách diễn đạt trước người thật, cần nhận phản hồi có trách nhiệm, cần tranh luận và lắng nghe. AI tutor có thể giảm cô đơn ở khoảnh khắc học một mình, nhưng nếu nó thay thế quá nhiều quan hệ học tập, nó có thể làm cô đơn trở nên mượt mà hơn chứ không giải quyết cô đơn.

Một trường trưởng thành sẽ dùng AI tutor để tăng mật độ hỗ trợ mà không giảm mật độ quan hệ. Một sản phẩm trưởng thành sẽ đo xem người học có kết nối tốt hơn với giáo viên, bạn học và cộng đồng học không. Một chính sách trưởng thành sẽ không hỏi “có thể thay bao nhiêu giáo viên bằng AI?”, mà hỏi “AI có thể giúp giáo viên và người học gặp nhau ở phần có giá trị hơn không?”.

14. Lập trường của chương này

Chương này không chống AI tutor. Ngược lại, nếu phải chọn một ứng dụng AI có tiềm năng giáo dục lớn, AI tutor nằm rất cao trong danh sách. Một gia sư cá nhân, kiên nhẫn, rẻ hơn, đa ngôn ngữ, có thể truy cập ngoài giờ, hỗ trợ luyện tập và feedback tức thì, có thể là món quà lớn cho những người học trước đây không có ai để hỏi. Với những trường thiếu nhân lực và những người học bị bỏ lại, AI tutor tốt có thể mở cửa thật.

Nhưng chương này chống việc gọi mọi chatbot là tutor. Chống việc đo hiệu quả bằng số bài làm đúng khi AI đang bật. Chống việc biến người học mới thành người dùng thử của hệ thống chưa có guardrail. Chống việc làm hộ rồi gọi là hỗ trợ. Chống việc tạo phụ thuộc rồi gọi là personalization. Chống việc nhà trường dùng AI để che thiếu đầu tư vào giáo viên và cố vấn. Chống việc vendor tối ưu retention mà không đo transfer. Chống việc trẻ em trò chuyện với một hệ thống vô hạn mà không có ranh giới tuổi, quyền, dữ liệu và trách nhiệm.

Một AI tutor tốt phải có năm phẩm chất. Thứ nhất, nó phải chính xác đủ trong phạm vi được giao và biết thừa nhận giới hạn. Thứ hai, nó phải có scaffold sư phạm, không chỉ phản hồi trôi chảy. Thứ ba, nó phải bảo vệ productive struggle: hỏi, gợi ý, trì hoãn đáp án, yêu cầu giải thích. Thứ tư, nó phải chuyển quyền về người học qua thời gian, để người học tự làm được nhiều hơn khi AI rút đi. Thứ năm, nó phải được đặt trong hệ sinh thái người thật: giáo viên, bạn học, phụ huynh, cố vấn, cộng đồng, chính sách và audit.

Câu hỏi cuối cùng không phải: “AI tutor có thể trả lời tốt không?”. Câu hỏi cuối cùng là: “Sau khi học với AI tutor, người học có tự đứng vững hơn không?”. Nếu có, đó là gia sư đại chúng. Nếu không, đó là máy tạo phụ thuộc với giao diện thân thiện.

Và trong giáo dục, một công cụ làm người học cảm thấy được giúp nhưng âm thầm làm họ yếu đi là loại công cụ nguy hiểm nhất. Vì nó không thất bại bằng tiếng ồn. Nó thất bại bằng sự dễ chịu.

Ghi chú nguồn cho chương

[^bloom-2sigma]: Benjamin S. Bloom, “The 2 Sigma Problem: The Search for Methods of Group Instruction as Effective as One-to-One Tutoring” (Educational Researcher, 1984). Bài kinh điển đặt vấn đề vì sao one-to-one tutoring tạo kết quả rất mạnh và làm sao tìm phương pháp dạy nhóm đạt hiệu quả tương đương. Nguồn DOI: https://doi.org/10.3102/0013189X013006004

[^eef-tuition]: Education Endowment Foundation, One to one tuition, Teaching and Learning Toolkit. EEF đánh giá one-to-one tuition có tác động trung bình khoảng +5 tháng tiến bộ, nhưng nhấn mạnh hiệu quả phụ thuộc vào chất lượng triển khai, liên kết với bài học chính, phiên ngắn đều đặn, người dạy được hỗ trợ và theo dõi tiến bộ. Nguồn: https://educationendowmentfoundation.org.uk/education-evidence/teaching-learning-toolkit/one-to-one-tuition

[^ma-its]: Wenting Ma, Olusola O. Adesope, John C. Nesbit & Qing Liu, “Intelligent Tutoring Systems and Learning Outcomes: A Meta-Analysis” (Journal of Educational Psychology, 2014). Meta-analysis về ITS cho thấy các hệ thống dạy kèm thông minh có tác động tích cực lên kết quả học tập so với nhiều môi trường không phải ITS, đồng thời hiệu quả thay đổi theo loại so sánh, outcome và thiết kế. Nguồn DOI: https://doi.org/10.1037/a0037123

[^kulik-fletcher]: James A. Kulik & J. D. Fletcher, “Effectiveness of Intelligent Tutoring Systems: A Meta-Analytic Review” (Review of Educational Research, 2016). Review 50 controlled evaluations cho thấy ITS có thể nâng điểm kiểm tra so với mức conventional instruction, nhưng kết quả phụ thuộc mạnh vào loại bài đo và sự căn chỉnh giữa mục tiêu dạy với mục tiêu đánh giá. Nguồn DOI: https://doi.org/10.3102/0034654315581420

[^kestin-ai-tutor]: Greg Kestin, Kelly Miller, Anna Klales, Timothy Milbourne và cộng sự, “AI tutoring outperforms in-class active learning: an RCT introducing a novel research-based design in an authentic educational setting” (Scientific Reports, 2025). Nghiên cứu RCT với 194 sinh viên vật lý đại học cho thấy AI tutor được thiết kế cẩn thận theo best practices, scaffold tuần tự và nội dung chuyên gia có thể tạo learning gains cao hơn trong ít thời gian hơn so với active learning trên cùng nội dung; tác giả cũng nhấn mạnh không nên thay thế in-class instruction mà nên dùng để chuẩn bị và hỗ trợ lớp học. Nguồn: https://www.nature.com/articles/s41598-025-97652-6

[^bastani-pnas]: Hamsa Bastani, Osbert Bastani, Alp Sungu, Haosen Ge, Özge Kabakcı & Rei Mariman, “Generative AI without guardrails can harm learning: Evidence from high school mathematics” (Proceedings of the National Academy of Sciences, 2025). Field experiment với gần một nghìn học sinh trung học học toán cho thấy GPT-4 giúp tăng performance trong lúc luyện, nhưng phiên bản không guardrail làm học sinh kém hơn khi AI bị rút đi; phiên bản GPT Tutor có safeguard như teacher-designed hints giảm tác hại này. Nguồn DOI: https://doi.org/10.1073/pnas.2422633122 và bản SSRN trước đó: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4895486

[^zhai-overreliance]: Chunpeng Zhai, Santoso Wibowo & Lily D. Li, “The effects of over-reliance on AI dialogue systems on students’ cognitive abilities: a systematic review” (Smart Learning Environments, 2024). Systematic review này phân tích over-reliance vào AI dialogue systems trong giáo dục/nghiên cứu và liên hệ với critical thinking, decision-making, analytical reasoning, hallucination, bias, plagiarism, privacy và transparency. Nguồn: https://doi.org/10.1186/s40561-024-00316-7

[^unesco-genai]: UNESCO, Guidance for generative AI in education and research (2023, cập nhật trang 2026). UNESCO đề xuất cách tiếp cận human-centred, bảo vệ data privacy, thiết lập age limit cho independent conversations với GenAI platforms, và yêu cầu ethical validation cùng pedagogical design phù hợp với tuổi và bối cảnh. Nguồn: https://www.unesco.org/en/articles/guidance-generative-ai-education-and-research

[^unesco-students]: UNESCO, AI competency framework for students (2024). Framework nêu 12 competencies theo bốn chiều: human-centred mindset, ethics of AI, AI techniques and applications, AI system design; nhấn mạnh critical judgement, responsible use, foundational AI knowledge và năng lực tham gia AI an toàn, có ý nghĩa. Nguồn: https://www.unesco.org/en/articles/ai-competency-framework-students

[^unicef-ai-children]: UNICEF Innocenti, Guidance on AI and children: Version 3.0 (2025). UNICEF đặt yêu cầu cho child-centred AI như regulatory oversight, safety for children, protect children’s data and privacy, fairness/non-discrimination, transparency/explainability/accountability, và tôn trọng human rights/child rights trong AI. Nguồn: https://www.unicef.org/innocenti/reports/policy-guidance-ai-children