Din web analytics aflăm ce se întâmpă în site, din testele de UX Research aflăm de ce se întâmplă, iar prin A/B Testing testăm live ca să aflăm versiunea care aduce rezultatele optime. Dacă despre analytics și A/B Testing am scris mai mult până acum, în acest articol voi trata o metodă de UX Research, în speță usability testing.

User Research reprezintă studiul organizat al obiectivelor, nevoilor și capacităților utilizatorilor în legătură cu un design sau un produs, în scopul îmbunătățirii experienței. Usability testing este metoda principală prin care se determină dacă utilizatorii și-au îndeplinit obiectivele. Indicatorii livrați de majoritatea testelor de acest gen sunt rate de completare, durată task, satisfacție în legătură cu task-ul și cu testul, și erori în aplicație. De asemenea, aceste teste livrează liste cu erori de usaibility, clasificate după frecvență și severitate.

tasks

Tipuri de teste

În funcție de tipul obiectivelor, există 2 tipuri majore de teste:

  • teste formative: găsesc și rezolvă probleme de usability; denumirea provine de la faptul că oferă feedback imediat
  • teste cumulative: descriu gradul de usability al unei aplicații în metrici; se referă la evaluarea problemelor descoperite

Majoritatea testelor de usability sunt calitative (deci formative), dar problemele pot fi cuantificate după frecvență, severitate, cine le-a întâmpinat, timp de rezolvare de către utilizatori și rată de completare cu succes.

Testele cumulative sunt la rândul lor de două tipuri:

  • benchmark: rezultatele sunt evaluate în funcție de obiective stabilite anterior
  • comparative: rezultatele sunt comparate cu cele pentru alta aplicație sau altă versiune

În funcție de modul în care sunt colectate datele, testele de usability se împart în:

  • teste de laborator moderate, numite și tradiționale
  • teste la distanță moderate
  • sesiuni nemoderate

Relevanță statistică

În cele mai multe situații, testele nu pot fi efectuate pe toți utilizatorii aplicației. De regulă, din cauza costurilor sau refuzurilor, va participa o mică parte dintre aceștia.

Cel mai important lucru în studiul utilizatorilor este reprezentativitatea, adică dacă cei pe care s-au făcut testele reprezintă toți utilizatorii. Regula este valabilă atât pentru testele cantitative, cât și pentru cele cantitative. Nu poți trage concluzii pe baza unui grup care este diferit de majoritatea celor care folosesc site-ul. Sunt cazuri în care, deși 7 din 10 persoane au avut aceeași problemă, rezultatul nu este relevant. Ideal ar fi să fie testați reprezentanți din toate segmentele de vizitatori. Indicatorii, calculele și regulile de statistică le voi prezenta într-un articol separat, mai ales că majoritatea sunt utili și pentru alte tipuri de teste (ex. A/B Testing).

masuri

Indicatori în usability testing

Avem două categorii pentru indicatorii care măsoară rezultatele testării utilizatorilor:

  • indicatori binari: pot avea 2 posibile rezultate, de exemplu a completat cu succes task-ul sau a eșuat; de regulă, se exprimă în procente
  • indicatori parțiali ai succesului – folosiți mai rar în usability

Standardul binar este preferat pentru uniformizarea metodelor statistice. Am fost întrebat de ce am scris că un web analyst are nevoie de cunoștințe de reasearch. Se poate observa că ne lovim destul de des de noțiuni de statistică și research. Revin la principalii indicatori de usability testing. Pe lângă ratele binare, există alte 3 moduri în care putem cuantifica rezultatele testelor:

Erori și probleme de usability

Acțiunile neintenționate, greșelile și omisiunile pot fi contabilizate într-o listă de erori. Este un bun diagnostic pentru aplicație și motivele pentru care sarcinile nu sunt finalizate. De regulă este cuantificat numărul erorilor, însă pot fi măsurate și binar (utilizatori care au întâmpinat sau nu erori, precum și utilizatori care au întâmpinat sau nu o anumită eroare).

O problemă întâmpinată în timpul realizării unui task, ce poate fi asociată cu interfața, este o problemă de usability. Probabilitatea ca utilizatorii să întâmpine o problemă este un KPI în măsurarea activității de usability.

Problemele de usability trebuie prioritizate în funcție de frecvența cu care apar și de impact. Frecvența este raportul dintre numărul aparițiilor și numărul participanților, iar scorul de impact este dat de gravitatea problemei (ex: cel mai mare scor pentru o problemă care oprește finalizarea task-ului și în ordine descrescătoare pentru cele care cauzează întârzieri majore, frustrări, efecte minore, până la sugestii).

Durata task-ului

Dacă nu intervin probleme majore și task-ul este completat cu succes, nu înseamnă că nu pot fi făcute îmbunătățiri. Durata ridicată de finaliare a task-ului poate indica probleme și potențiale optimizări. Poate fi definită ca timpul petrecut pe o anumită activitate, pe un anumit scenariu sau pe o anumită pagină. De regulă, se raportează ca medie. Tot din motive de reprezentativitate statistică, este preferată media geometrică.

Pot fi folosiți mai mulți metrici deviați din durata task-ului, precum timpul până la finalizare, timpul până la eșec / eroare sau timpul total pe un proiect.

Scoruri

Sunt unul dintre principalele moduri de a măsura rezultatele testelor de usability. Scorurile de satisfacție sunt obținute din chestionare care măsoară percepția legată de realizarea unui task. Pot fi completate după un task, după un test întreg sau în afara unui test de usability.

Pentru o imagine completă a aplicației din punct de vedere usability, este bine să fie colectați metrici diferiți. Dar lucrul cu un număr mare de metrici este greoi. Așa au apărut scorurile combinate. După cum le spune numele, combină într-un scor rezultatele de la diferiți metrici. În acest fel, pot fi evaluate ușor versiuni diferite ale unei aplicații.

Surse foto: 1; 2.

Etichete: , , , , , ,