Chuỗi bài viết về các phương pháp đánh giá UX từ chuyên gia
Trong quy trình UX, có một nhóm phương pháp cho phép đánh giá trải nghiệm người dùng mà không cần recruit hay làm việc trực tiếp với người dùng thực tế. Thay vào đó, các chuyên gia – designer, UX researcher, hoặc người có kiến thức về usability – tự mình kiểm tra sản phẩm và đưa ra phán đoán dựa trên kiến thức chuyên môn. Nhóm phương pháp này được gọi chung là expert review hay UX Evaluation Methods.
Ba phương pháp expert review phổ biến nhất trong thực hành UX là Heuristic Evaluation, Cognitive Walkthrough, và PURE (Pragmatic Usability Rating by Experts) (chính là bài này). Cả ba đều không thay thế usability testing với người dùng thật, nhưng bổ sung vào quy trình một bước đánh giá nhanh, có chi phí thấp, và có thể thực hiện từ giai đoạn wireframe – trước khi đầu tư vào nghiên cứu người dùng quy mô lớn hơn.
Bài viết này tập trung vào Heuristic Evaluation – phương pháp có phạm vi rộng nhất trong ba phương pháp, phù hợp để đánh giá tổng thể một giao diện hoặc flow và phát hiện nhanh các vi phạm nguyên lý usability đã được thiết lập.
PURE là gì?
PURE – viết tắt của Pragmatic Usability Rating by Experts – là phương pháp đánh giá usability do nhóm nghiên cứu UX tại Google phát triển. Phương pháp này cho phép các chuyên gia đánh giá khả năng sử dụng của một sản phẩm theo từng bước của từng task, sử dụng thang điểm số hóa thống nhất thay vì nhận xét định tính.
Điểm phân biệt PURE với các phương pháp đánh giá chuyên gia khác là tính định lượng: kết quả cuối cùng là một con số cụ thể cho mỗi task, có thể so sánh theo thời gian hoặc giữa các sản phẩm khác nhau. Điều này làm cho PURE trở nên đặc biệt hữu ích trong các tình huống cần theo dõi cải tiến usability qua nhiều phiên bản, hoặc cần so sánh usability giữa sản phẩm của mình và sản phẩm cạnh tranh.
Giống như Heuristic Evaluation và Cognitive Walkthrough, PURE không cần người dùng thực tế tham gia – đây là phương pháp expert review, thực hiện bởi designer hoặc UX researcher.
Vị trí của PURE trong bộ công cụ UX
Ba phương pháp đánh giá chuyên gia phổ biến nhất – Heuristic Evaluation, Cognitive Walkthrough, và PURE – đều không cần người dùng thực tế, nhưng mỗi phương pháp đặt câu hỏi khác nhau và cho ra output khác nhau:
| Heuristic Evaluation | Cognitive Walkthrough | PURE | |
|---|---|---|---|
| Câu hỏi trọng tâm | Giao diện có vi phạm nguyên lý usability không? | Người dùng mới có tự tìm ra cách dùng không? | Task này khó đến mức nào ở từng bước cụ thể? |
| Output | Danh sách vấn đề có severity rating | Failure stories theo từng bước | Điểm số định lượng theo từng bước và toàn task |
| Phạm vi | Toàn bộ giao diện hoặc flow | Task cụ thể, từng bước hành động | Task cụ thể, từng bước hành động |
| Thế mạnh | Phủ rộng, phát hiện nhiều loại vấn đề | Đào sâu vào learnability | Định lượng, dễ so sánh và theo dõi |
Trong thực tế, PURE thường được dùng khi team cần bằng chứng số để ưu tiên cải thiện, trình bày với stakeholder, hoặc so sánh usability giữa phiên bản trước và phiên bản mới sau khi đã có design iteration.
Cơ chế đánh giá của PURE
PURE đánh giá từng bước hành động trong một task theo 3 chiều:

Chiều 1: Findability (Khả năng tìm thấy)
Người dùng có thể tìm thấy element cần tương tác ở bước này không? Element đó có đủ nổi bật, đúng vị trí, và dễ nhận ra trong bối cảnh của toàn bộ giao diện không?
Findability đánh giá vấn đề trước khi tương tác – người dùng có thể đến đúng chỗ cần đến không.
Chiều 2: Affordance / Recognition (Khả năng hiểu)
Sau khi tìm thấy element, người dùng có hiểu rằng tương tác với nó sẽ làm điều họ muốn không? Label, icon, hay visual cue có đủ rõ ràng để người dùng tự tin thực hiện hành động không?
Affordance đánh giá vấn đề tại thời điểm tương tác – người dùng có đưa ra quyết định đúng không.
Chiều 3: Feedback (Phản hồi sau hành động)
Sau khi thực hiện hành động đúng, người dùng có nhận ra họ vừa tiến đến gần mục tiêu không? Hệ thống có phản hồi đủ rõ ràng để người dùng biết trạng thái hiện tại là gì không?
Feedback đánh giá vấn đề sau khi tương tác – người dùng có hiểu kết quả hành động của mình không.
Thang điểm 1–3
Với mỗi bước trong task, evaluator chấm điểm từng chiều theo thang 3 mức:
| Điểm | Mức độ | Ý nghĩa |
|---|---|---|
| 1 | Không có vấn đề | Phần lớn người dùng sẽ thành công ở bước này mà không gặp khó khăn |
| 2 | Có vấn đề nhỏ | Một số người dùng sẽ do dự, nhầm lẫn, hoặc mất thêm thời gian |
| 3 | Có vấn đề lớn | Phần lớn người dùng sẽ thất bại hoặc cần hỗ trợ để vượt qua bước này |
Điểm của mỗi bước = điểm cao nhất trong 3 chiều. Nếu Findability = 1, Affordance = 3, Feedback = 1, thì điểm của bước đó là 3 – vì một điểm 3 trong bất kỳ chiều nào cũng có thể khiến người dùng thất bại.
Điểm của toàn task = tổng điểm của tất cả các bước. Task có nhiều bước sẽ có điểm cao hơn task ít bước – vì mỗi bước đều tích lũy thêm rủi ro thất bại.
Cách tính này phản ánh thực tế: một task khó là task mà người dùng có thể thất bại ở bất kỳ bước nào, không phải chỉ ở các bước “quan trọng”.

Framework thực hiện PURE
Bước 1: Xác định task và chuỗi bước
Chọn 2–4 task quan trọng nhất đối với người dùng. Với mỗi task, liệt kê trước toàn bộ chuỗi bước cần thực hiện theo đúng flow mà designer kỳ vọng.
Ví dụ với task “Đặt lịch hẹn lần đầu trên app”:
- Bước 1: Mở app và nhận diện entry point để tạo lịch hẹn
- Bước 2: Chọn loại dịch vụ
- Bước 3: Chọn ngày và giờ
- Bước 4: Điền thông tin cá nhân
- Bước 5: Xác nhận và nhận confirmation
Mức độ chi tiết của từng bước cần đủ để evaluator đánh giá riêng biệt – không quá gộp (một bước chứa nhiều hành động khác nhau) và không quá tách nhỏ.
Bước 2: Đánh giá độc lập
Mỗi evaluator thực hiện đánh giá riêng lẻ – không trao đổi với nhau. Với mỗi bước trong task, evaluator chấm điểm 3 chiều (Findability, Affordance, Feedback) và ghi chú lý do cho các điểm 2 hoặc 3.
Ghi chú lý do là phần quan trọng không kém điểm số: điểm số cho biết mức độ nghiêm trọng, nhưng ghi chú mới giải thích tại sao và cần sửa gì.
Nên dùng spreadsheet để ghi nhận – mỗi hàng là một bước, các cột là Findability / Affordance / Feedback / Điểm bước / Ghi chú.
Bước 3: Tổng hợp và tính điểm
Sau khi tất cả evaluator hoàn thành, tổng hợp điểm:
- Điểm từng bước = giá trị cao nhất trong 3 chiều (tính trên điểm trung bình của các evaluator)
- Điểm task = tổng điểm tất cả các bước của task đó
- Điểm baseline = điểm task trong trường hợp mọi bước đều hoàn hảo (tất cả điểm 1) = số bước × 1
Điểm task tối thiểu có thể đạt được = số bước (nếu mọi bước đều điểm 1). Task 5 bước có điểm tối thiểu là 5, điểm tối đa có thể là 15 (nếu mọi bước đều điểm 3).
Bước 4: Phân tích và ưu tiên
Từ điểm số, xác định:
- Bước nào có điểm cao nhất – đây là điểm nghẽn cần xử lý trước
- Chiều nào thường xuyên bị điểm cao – nếu Findability liên tục điểm 3 trên nhiều bước, đó là vấn đề mang tính hệ thống về information architecture hoặc visual hierarchy
- Task nào có điểm tổng cao nhất – task đó là ưu tiên cải thiện cao nhất
Nếu có nhiều phiên bản design hoặc nhiều mốc thời gian, điểm PURE giúp so sánh trực tiếp: phiên bản mới có điểm thấp hơn phiên bản cũ không?

Ưu điểm và giới hạn của PURE
Ưu điểm
Định lượng và có thể theo dõi theo thời gian. Khác với Heuristic Evaluation cho ra danh sách vấn đề định tính, PURE cho ra con số. Team có thể đặt mục tiêu cụ thể (“giảm điểm task onboarding xuống dưới 8”) và đo được tiến độ cải thiện.
Dễ trình bày với stakeholder không có nền tảng UX. Nói “task đăng ký hiện tại có điểm 14/15 tối đa, phiên bản mới là 7/15” thuyết phục hơn nhiều so với một danh sách vấn đề mang tính định tính.
Chỉ ra chính xác bước nào cần ưu tiên. Thay vì cảm nhận tổng quát “flow này có vấn đề”, PURE xác định được “bước 3 – chọn phương thức thanh toán – có điểm Affordance là 3, đây là điểm nghẽn chính”.
Phù hợp cho đánh giá cạnh tranh. Chạy PURE trên cùng một task ở sản phẩm của mình và sản phẩm đối thủ cho kết quả có thể so sánh trực tiếp.
Giới hạn
Không phát hiện vấn đề usability nằm ngoài phạm vi task được chọn. PURE chỉ đánh giá những task đã được xác định trước – vấn đề ở các flow khác sẽ không được phát hiện. Đây là lý do tại sao Heuristic Evaluation – với phạm vi rộng hơn – nên được dùng song song.
Kết quả phụ thuộc vào chất lượng của chuỗi bước được xác định. Nếu chuỗi bước quá gộp hoặc không phản ánh đúng hành vi người dùng thực tế, điểm số sẽ không có ý nghĩa. Xác định đúng chuỗi bước là phần đòi hỏi kinh nghiệm nhất trong toàn bộ quy trình.
Không thay thế được usability testing với người dùng thực. PURE dự đoán người dùng sẽ gặp khó khăn ở đâu, nhưng đó vẫn là đánh giá của chuyên gia. Người dùng thực tế có thể vượt qua được một bước điểm 3 theo cách không ai dự đoán – hoặc bị mắc kẹt ở một bước điểm 1 vì lý do nằm ngoài giao diện. PURE cần được xác nhận bằng usability testing định kỳ.
PURE so với Cognitive Walkthrough – khi nào dùng cái nào?
Cả PURE và Cognitive Walkthrough đều đánh giá theo từng bước của một task, nhưng phục vụ mục đích khác nhau:
Cognitive Walkthrough phù hợp hơn khi mục tiêu là hiểu tại sao người dùng mới có thể thất bại. Phương pháp này yêu cầu evaluator mô tả failure story – tình huống cụ thể người dùng sẽ nhầm lẫn hoặc bỏ cuộc – và tập trung vào learnability. Output là insight định tính, phù hợp để xác định cần sửa gì và theo hướng nào.
PURE phù hợp hơn khi mục tiêu là đo lường và so sánh. Phương pháp này cho ra con số có thể tracking, phù hợp khi cần trình bày tiến độ cải thiện cho stakeholder hoặc so sánh với phiên bản cũ / sản phẩm cạnh tranh. Output là điểm số định lượng, phù hợp để ưu tiên backlog và đặt mục tiêu cụ thể.
Trong thực tế, team có thể dùng Cognitive Walkthrough ở giai đoạn thiết kế sớm để tìm và sửa vấn đề learnability – sau đó dùng PURE ở giai đoạn gần hoàn thiện để đo lường chất lượng tổng thể và so sánh với baseline.
Kết luận
PURE là phương pháp đánh giá usability phù hợp nhất khi team cần kết quả có thể định lượng: theo dõi cải thiện qua nhiều phiên bản, so sánh với đối thủ, hoặc thuyết phục stakeholder bằng bằng chứng số thay vì nhận xét định tính.
Sức mạnh của PURE nằm ở tính nhất quán: với cùng một task và cùng một chuỗi bước, kết quả giữa các evaluator có thể được chuẩn hóa và so sánh. Điểm số từ PURE không thay thế insight từ Heuristic Evaluation hay Cognitive Walkthrough – nhưng bổ sung vào bộ công cụ đánh giá của team một chiều đo lường mà hai phương pháp kia không cung cấp.
Tại TELOS Academy, PURE là một trong các phương pháp được giới thiệu trong khóa UX nhập môn – cùng với Heuristic Evaluation và Cognitive Walkthrough – để người học có đủ cơ sở lựa chọn đúng công cụ cho từng tình huống thực tế. Đây là một phần của chương trình để đào tạo ra một Product UI/UX Designer với hành trang kiến thức đầy đủ không chỉ là vẽ cho đẹp hoặc sáng tạo mà là hiểu được tổng thể một quá trình xây dựng sản phẩm từ đầu.
Nếu bạn quan tâm, có thể đăng ký học tại đây
