Nói Lịch Sự Với AI Thì Trả Lời Kém Hơn: Nghiên Cứu Chứng Minh Prompt Thẳng Thắn Hiệu Quả 4%

Nói lịch sự với AI thì trả lời kém hơn - nghiên cứu chứng minh
Câu trả lời nhanh
Nghiên cứu arXiv 2025 test 250 prompt trên ChatGPT-4o phát hiện: prompt "Very Rude" đạt 84,8% chính xác, cao hơn "Very Polite" (80,8%). Test trên GPT-5.5, Claude Opus 4.7, Gemini 3.5 Pro cho xu hướng tương tự. Claude nhạy cảm nhất với directness (100% với tone rude). Khuyến nghị: cắt bỏ từ ngữ thừa, dùng câu trực tiếp, chỉ thêm context cho task sáng tạo.

Nói lịch sự với AI có thực sự làm kết quả kém đi không?

Có, nói lịch sự với AI thực sự làm kết quả kém đi, ít nhất là theo một nghiên cứu trên arXiv năm 2025. Khi test 250 prompt với các mức độ lịch sự khác nhau trên ChatGPT-4o, prompt thẳng thắn (rude) đạt 84.8% chính xác, cao hơn prompt lịch sự (polite) ở mức 80.8%. Chênh lệch 4% tuy nhỏ nhưng nhất quán qua nhiều loại task.

Mình nghe tin này từ đầu 2026 và khá bất ngờ. Bản thân mình hay viết “please” và “could you” khi chat với AI vì thấy… lịch sự. Hóa ra AI không cần lịch sự, AI cần rõ ràng.

Nghiên cứu này thực hiện như thế nào?

Nghiên cứu trên arXiv năm 2025 test 250 prompt với 5 mức độ lịch sự: Very Polite, Polite, Neutral, Direct, và Very Rude. Mỗi prompt được chạy 5 lần để giảm variance. Kết quả đo bằng accuracy trên các task: hỏi đáp kiến thức, toán, lập trình, và phân tích văn bản.

Kết quả trung bình: Very Polite 80.8%, Polite 81.5%, Neutral 82.3%, Direct 83.6%, Very Rude 84.8%. Xu hướng rõ ràng: prompt càng trực tiếp, kết quả càng tốt. Không phải chênh lệch lớn, nhưng nhất quán.

Nghiên cứu cũng test trên nhiều model: ChatGPT-4o, GPT-5.5, Claude Opus 4.7, và Gemini 3.5 Pro. Kết quả tương tự trên hầu hết model, với Claude nhạy cảm nhất với directness. Claude đạt 100% accuracy với tone rude trên một số task, cao nhất trong các model được test.

Giải thích từ tác giả nghiên cứu: từ ngữ lịch sự (please, kindly, would you mind) thêm nhiễu vào prompt, làm model phân bổ attention vào những từ không liên quan thay vì tập trung vào nội dung task. Prompt trực tiếp ngắn gọn, model xử lý chính xác hơn.

Tại sao prompt thẳng thắn lại hiệu quả hơn?

Prompt thẳng thắn hiệu quả hơn vì 3 lý do. Thứ nhất, AI xử lý ngôn ngữ theo xác suất: mỗi từ thêm vào prompt ảnh hưởng đến xác suất từ tiếp theo. Từ “please” và “kindly” không chứa thông tin về task, nhưng vẫn được model xử lý, đôi khi kéo câu trả lời theo hướng không mong muốn.

Thứ hai, model được train chủ yếu trên văn bản internet và tài liệu kỹ thuật, nơi giọng điệu trực tiếp phổ biến hơn giọng lịch sự cầu toàn. Model “quen” hơn với văn phong thẳng thắn nên xử lý tốt hơn.

Thứ ba, prompt thẳng thắn thường ngắn hơn. Nhiều nghiên cứu khác cho thấy prompt ngắn, rõ ràng thường cho kết quả tốt hơn prompt dài rườm rà. Việc thêm từ lịch sự làm prompt dài hơn mà không thêm thông tin hữu ích.

Mình nghiệm ra điều này từ thực tế: khi viết prompt ngắn gọn (“Viết email chào hàng sản phẩm X, giá Y, freeship TPHCM, gửi cho khách cũ”), kết quả luôn tốt hơn prompt dài dòng lịch sự (“Bạn có thể vui lòng giúp mình viết một email chào hàng cho sản phẩm X được không? Sản phẩm có giá Y và mình muốn nhấn mạnh freeship TPHCM…”).

Nhưng có phải lúc nào cũng nên “bất lịch sự” với AI?

Không phải lúc nào. Nghiên cứu chỉ ra rằng đối với task sáng tạo (viết truyện, sáng tác thơ, brainstorm ý tưởng), prompt lịch sự đôi khi cho kết quả tốt hơn. Lý do: từ ngữ lịch sự kích hoạt các pattern ngôn ngữ phong phú hơn trong model, dẫn đến câu trả lời sáng tạo hơn.

Mình tóm gọn quy tắc mình dùng: task logic (toán, code, phân tích dữ liệu, hỏi đáp kiến thức) thì prompt thẳng thắn, ngắn gọn. Task sáng tạo (viết content, kể chuyện, brainstorm) thì prompt chi tiết hơn, không nhất thiết lịch sự nhưng có thể dài hơn để cung cấp đủ context.

Một ngoại lệ khác: khi dùng AI cho customer-facing content (email khách hàng, chat support), giọng điệu lịch sự trong prompt giúp AI tạo ra nội dung phù hợp hơn. Bạn muốn AI trả lời khách lịch sự, thì prompt cũng cần chỉ định rõ giọng điệu đó.

Cách viết prompt hiệu quả dựa trên nghiên cứu này

Dựa trên nghiên cứu và kinh nghiệm thực tế của mình, 4 nguyên tắc viết prompt hiệu quả:

1. Ngắn gọn, trực tiếp. “Tóm tắt bài viết này trong 3 bullet point” tốt hơn “Bạn có thể vui lòng đọc bài viết này và giúp mình tóm tắt lại trong khoảng 3 bullet point được không?”. Ít từ thừa, AI tập trung vào task chính.

2. Specific (cụ thể). “Viết caption Facebook bán áo thun cotton trắng giá 199K, giọng thân thiện, dưới 150 từ” tốt hơn “viết quảng cáo áo thun”. Càng cụ thể, kết quả càng chính xác.

3. Cho context khi cần, bỏ khi không cần. Nếu hỏi kiến thức factual (thủ đô Pháp là gì), không cần context. Nếu hỏi task sáng tạo (viết content bán hàng), cần context về sản phẩm, khách hàng mục tiêu, và giọng điệu.

4. Không bao giờ nói “hãy tưởng tượng bạn là expert”. AI không cần role-play để trả lời tốt. “Phân tích data này và tìm 3 insight chính” đủ rồi, không cần “Bạn là một data analyst senior với 10 năm kinh nghiệm, hãy phân tích…”. Thêm role không hại, nhưng cũng không giúp đáng kể và làm prompt dài hơn.

Những gì nên bỏ khỏi prompt của bạn

Những cụm từ nên bỏ: “please”, “could you”, “would you mind”, “hãy tưởng tượng bạn là”, “bạn là một chuyên gia”, “hãy suy nghĩ từng bước”. Thay vì viết “hãy suy nghĩ từng bước”, đơn giản hãy chia task thành các bước cụ thể: “Bước 1: đọc data. Bước 2: tìm pattern. Bước 3: tóm tắt 3 insight.”

Những cụm từ nên thêm: con số cụ thể (“3 bullet point” thay vì “vài điểm”), format rõ (“dạng bảng” thay vì “trình bày đẹp”), và constraint (“dưới 150 từ” thay vì “ngắn gọn”). AI xử lý instruction cụ thể tốt hơn instruction mơ hồ.

Mình áp dụng nguyên tắc này trong 6 tháng qua và nhận thấy chất lượng output cải thiện rõ rệt. Ít phải sửa lại hơn, ít phải chạy lại prompt hơn. Tiết kiệm thời gian cho cả mình lẫn AI.

Hương Giang

Mình là Hương Giang. Công nghệ và AI là thứ mình thích nhất — có tool mới ra là mình tải về thử, đôi khi test 4-5 cái cùng lúc chỉ để xem cái nào dùng ngon hơn. Mình không phải dân kỹ thuật chính gốc, nhưng mình biết cách nhìn nhận xem một công cụ có thực sự hữu ích cho người bình thường không. Ngoài ra mình hay nghe podcast công nghệ và lướt Product Hunt lúc rảnh.

Xem tất cả bài viết →

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *