可用性測試的權(quán)衡之道
對(duì)于可用性測試,業(yè)內(nèi)人士存在一些普遍認(rèn)可的原則。它們神圣地如同自然科學(xué)里的理論,似乎我們只能對(duì)其言聽計(jì)從、俯首稱臣才能踐行出“好的可用性測試”。其實(shí),即便是科學(xué),它的一個(gè)特征也是“可證偽性”——理論的正確性總是存在前提條件的。真理再向前一步就成為謬誤!
可用性測試中的原則同樣如此,需要根據(jù)目的、資源、環(huán)境的不同,靈活把握、權(quán)衡取舍,而非一味恪守某一個(gè)或某幾個(gè)原則,也許這才是可用性從業(yè)人員經(jīng)驗(yàn)重要性的體現(xiàn)。
一.任務(wù)設(shè)置:精細(xì) VS 寬泛
制定的任務(wù)過于精細(xì),一般原則上是反對(duì)的。理由很清楚,如果你的任務(wù)精細(xì)到一步一步“引導(dǎo)”用戶進(jìn)行操作,那太不符合用戶現(xiàn)實(shí)中的使用情境,平時(shí)沒有人在旁邊“引導(dǎo)”用戶的每一步操作;而且過于控制用戶的操作步驟,用戶缺乏真實(shí)使用時(shí)的靈活性。
是不是我們設(shè)置的任務(wù)只能是寬泛的,不能細(xì)化呢?這就必須根據(jù)研究的目的來做抉擇。如果產(chǎn)品處在設(shè)計(jì)的初期,我們需要關(guān)注一些宏大的問題(如:網(wǎng)站的整體架構(gòu)、導(dǎo)航和分類的合理性、頁面的邏輯關(guān)系),此時(shí)就需要通過寬泛而有彈性的任務(wù),來查找宏觀層面的問題。如果產(chǎn)品的設(shè)計(jì)已經(jīng)非常完善,開始進(jìn)行細(xì)節(jié)的修改迭代,此時(shí)就需要通過設(shè)置相對(duì)具體的任務(wù)來查找特定的細(xì)節(jié)問題(如:對(duì)某個(gè)命名的理解、按鈕的使用、鏈接的點(diǎn)擊、表單的填寫)。按照《Don’t make me think》一書的觀點(diǎn):一般用戶使用互聯(lián)網(wǎng)產(chǎn)品時(shí)滿足于能用就行,不會(huì)尋求最好的使用方法;只掃描網(wǎng)頁,不會(huì)仔細(xì)閱讀。所以,如果完全寬泛有彈性地設(shè)置任務(wù),雖然更吻合實(shí)際使用情況,但是很可能用戶直接跳過你想考察的細(xì)節(jié)。
實(shí)際工作中,由于時(shí)間和資源的限制,無法做到每個(gè)產(chǎn)品從設(shè)計(jì)初期到上線前后進(jìn)行多次可用性測試?赡茉谝淮蔚目捎眯詼y試中即需要同時(shí)關(guān)注宏觀方面和細(xì)節(jié)上的問題。此時(shí),還是需要和產(chǎn)品經(jīng)理、交互設(shè)計(jì)師反復(fù)溝通,確認(rèn)測試的主要目的,同時(shí)通過對(duì)任務(wù)設(shè)置精細(xì)程度的權(quán)衡把握,使次要目的也盡量得以滿足。
不過,即便是想考察細(xì)節(jié)的任務(wù),也要盡量避免“直接指導(dǎo)操作”式的語言描述方式,這樣能讓任務(wù)與真實(shí)使用情境不會(huì)相距太遠(yuǎn)。例如:想考察豆瓣讀書頁面【想要】按鈕是否能被看到、是否具備可點(diǎn)擊感。下面列出兩種表述方式,以作對(duì)比:
A.請(qǐng)找到您喜歡的那本書,并在該頁面點(diǎn)擊【想要】。(×)
B.請(qǐng)找到您喜歡的那本書,并在該頁面對(duì)其作個(gè)標(biāo)記。(√)
二.任務(wù)數(shù)量:多VS少
任務(wù)數(shù)量的多少與可用性測試考察范圍有關(guān),與任務(wù)的精細(xì)程度也有關(guān)。如果對(duì)網(wǎng)站全站進(jìn)行考察和只對(duì)其中某個(gè)頁面、某個(gè)操作流程進(jìn)行考察,所需的任務(wù)數(shù)量自然不一樣。在同樣的考察范圍下,如果任務(wù)設(shè)置得越精細(xì),所需任務(wù)數(shù)量也就越多。
Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)任務(wù)數(shù)量與發(fā)現(xiàn)可用性問題比例存在顯著的相關(guān)關(guān)系(r=0.82,p<0.01)。為了盡可能多地發(fā)現(xiàn)可用性問題,我們就盡量多地設(shè)置任務(wù)給用戶嗎?
此時(shí)要考慮任務(wù)數(shù)量過多可能帶來的弊端:學(xué)習(xí)效應(yīng)和疲勞效應(yīng),尤其是靠后的任務(wù)更可能會(huì)受影響。心理學(xué)實(shí)驗(yàn)中處理此問題的方法是順序平衡,抵消影響。但是可用性測試中設(shè)置的場景和任務(wù)存在特定的先后次序,不適合采用順序平衡的方法;谖覀兊慕(jīng)驗(yàn),還是通過對(duì)測試的任務(wù)數(shù)量進(jìn)行控制,確保正式測試環(huán)節(jié)最多不超過1小時(shí),加上前后的歡迎語、訪談、問答等,整個(gè)過程不超過1.5小時(shí)。
此外,任務(wù)數(shù)量的多少還會(huì)間接影響到測試所需參與者數(shù)量的多少。
三.用戶人數(shù):5個(gè)足夠VS 5個(gè)不夠
Nielsen的研究發(fā)現(xiàn),5個(gè)用戶可以發(fā)現(xiàn)80%以上的可用性問題。這個(gè)結(jié)論得到許多人的推崇,因此稱之為“魔法數(shù)字5”。這個(gè)結(jié)論的來源依據(jù)是每個(gè)用戶平均可以發(fā)現(xiàn)30%的可用性問題,且假設(shè)所有問題都有同等被發(fā)現(xiàn)的概率。不過,當(dāng)設(shè)置的任務(wù)數(shù)量過多,且任務(wù)的精細(xì)程度和難度多種多樣時(shí),這個(gè)前提有可能不成立。
Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)測試用戶數(shù)量與發(fā)現(xiàn)的可用性問題比例并不存在顯著的相關(guān)關(guān)系。這個(gè)結(jié)論似乎又支持我們選擇少量用戶進(jìn)行測試即可。
其實(shí),在用戶招募階段,比用戶數(shù)量更需要重視是用戶的代表性的問題。能否招募到有代表性的用戶將直接影響可用性測試的成敗。如測試一個(gè)醫(yī)療軟件產(chǎn)品,招募到醫(yī)護(hù)人員和患者作為測試用戶,那5個(gè)用戶可能就足夠了;但如果只招募到醫(yī)學(xué)實(shí)習(xí)生來測試,就必須超過5個(gè)以上的用戶(即便這樣,也未必能推論到整個(gè)產(chǎn)品的用戶群)。
由此看來,招募用戶的人數(shù)和任務(wù)的數(shù)量、精細(xì)程度、用戶的代表性也是息息相關(guān)的。參考Tom Tullis(2009)和本人經(jīng)驗(yàn):當(dāng)可用性測試范圍限定在一定的范圍(20個(gè)任務(wù)內(nèi)、或30個(gè)網(wǎng)頁之內(nèi)),且招募到很強(qiáng)代表性的用戶,那么5個(gè)足夠了。如果存在著差別較大的亞群體,爭取做到每個(gè)亞群組有5個(gè)左右的代表性的用戶(當(dāng)然,目標(biāo)用戶的特征及分類應(yīng)該是在可用性測試之前的用戶調(diào)研階段就解決的問題);一次測試最多不會(huì)超過12個(gè)用戶。
四.用戶表現(xiàn):行為VS言語
在可用性測試中強(qiáng)調(diào)對(duì)用戶操作行為的關(guān)注,是毋庸置疑的。因?yàn)椋?/span>
1.用戶的行為指標(biāo)更明確、具體、客觀,易觀察和記錄。
2.如果完全把關(guān)注點(diǎn)放在用戶的操作行為上,那么就無需跟用戶進(jìn)行多余的(指導(dǎo)語之外的)語言交流。類似于心理學(xué)研究規(guī)范,對(duì)實(shí)驗(yàn)或測試中的指導(dǎo)語進(jìn)行統(tǒng)一,對(duì)一切無關(guān)變量(包括主試的語言、體態(tài)表情)進(jìn)行控制,以減少對(duì)研究過程的干擾。
3.即便你直接詢問用戶某些問題,也極可能得到錯(cuò)誤的答案。30年前Richard Nisbett和Timothy Wilson的實(shí)驗(yàn)、2年前Peter Johansson在《science》的文章,都證實(shí)了某些情況下人們無法解釋清楚自己行為的真正原因。另外,用戶還可能揣摩主試的喜好,回答他們認(rèn)為主試期望的答案。
因此,有必要強(qiáng)調(diào)在可用性測試過程中關(guān)注的重點(diǎn)永遠(yuǎn)應(yīng)該是用戶的操作行為,而且盡量減少任何無關(guān)變量的干擾。但這個(gè)原則被有些人引申到極端,認(rèn)為只有觀察用戶的操作行為才有意義,其他信息都是無需關(guān)注的,甚至輕率地懷疑用戶的話都是不可信的。
可用性測試的主要目的雖然是發(fā)現(xiàn)問題,但也需要了解問題背后的原因,而僅僅依靠觀察用戶的操作行為是無法獲悉所有問題背后的原因的,此時(shí),我們就希望用戶能采用“出聲思維法”,出聲思維就是集中于如何與產(chǎn)品進(jìn)行交互的意識(shí)流。如果測試中的氛圍比較平等、自然、融洽,用戶又特別愿意表達(dá),那么用戶就會(huì)在進(jìn)行任務(wù)操作同時(shí),表達(dá)他們想做什么、打算如何做、背后的原因是什么。此時(shí),不僅是操作行為、用戶表達(dá)出來的想法和原因、以及語言中透露出的疑惑、失望、不滿、驚訝、猶豫等情緒同樣是需要我們加以關(guān)注的。但是,有些用戶比較內(nèi)向,不善于主動(dòng)表達(dá)自己的想法,此時(shí)就需要主試跟他進(jìn)行簡單的交流,以引導(dǎo)用戶說出背后的原因(注:不是引導(dǎo)用戶說出你期望得到答案)。
所以,在實(shí)際的可用性測試,基本應(yīng)該以關(guān)注用戶的行為為主,少量、適時(shí)地進(jìn)行詢問交流也是需要的。但這個(gè)度如何把握呢?
1.當(dāng)用戶出現(xiàn)猶豫、驚訝、任務(wù)失。ㄟ^程節(jié)點(diǎn)上出現(xiàn)自然而然地稍微中斷/暫停)的時(shí)候才進(jìn)行簡單的詢問。
2.詢問采用一般疑問句的句式,重復(fù)用戶剛才的行為表現(xiàn)(要具體客觀):“你剛才沒有……,是嗎?”——雖然沒有直接問“為什么”,但暗示了希望聽到他進(jìn)一步的解釋。
3.如果用戶沒有自己主動(dòng)說出原因,可以“順便”問一下“為什么?”或通過身體前傾、目光注視等非語言方式來暗示用戶你希望能聽到更多內(nèi)容。若用戶很快、堅(jiān)定地說出原因,則該理由的可信度較高;如果用戶猶豫、或難以說出原因,就不要繼續(xù)追問。
除了上述的語言、情緒、行為都需要得到關(guān)注,還有一種特殊情況是需要聽懂用戶“沒有說的”語言。例如,我們預(yù)計(jì)網(wǎng)站的某二級(jí)導(dǎo)航標(biāo)簽和一級(jí)導(dǎo)航標(biāo)簽存在分類邏輯上的不合理;但用戶在測試中,導(dǎo)航相關(guān)的操作步驟進(jìn)行得很流暢,用戶也什么都沒說。這通常表明用戶認(rèn)為這些是理所當(dāng)然的、不影響操作的——此時(shí)你需要聽懂用戶“沒有說的”語言。如果你簡單粗暴地打斷用戶并詢問:“你覺得這兩個(gè)導(dǎo)航標(biāo)簽如何?”,則變成了一種誘導(dǎo)性地提問。
總結(jié)一下關(guān)于此部分內(nèi)容的實(shí)踐應(yīng)用:
1.用戶的操作行為永遠(yuǎn)是可用性測試的重點(diǎn)。
2.鼓勵(lì)用戶采用“出聲思維法”。
3.適時(shí)、少量地向用戶提問,禁止對(duì)同一個(gè)問題反復(fù)追問“為什么”。
4.采用真正地“傾聽”技術(shù)保持和用戶的交流狀態(tài),而非通過過多的話語。
5.開放、不預(yù)設(shè)立場地觀察、傾聽用戶“沒有說的”語言。
- 基于用戶創(chuàng)新
界面設(shè)計(jì)日新月異,夢創(chuàng)義堅(jiān)持基于用戶需求的界面創(chuàng)新設(shè)計(jì)……
- 服務(wù)設(shè)計(jì)思維
互聯(lián)網(wǎng)的格局發(fā)生的改變,在我們進(jìn)行設(shè)計(jì)服務(wù)時(shí)更是考慮不同用戶、不同……
- 洞察用戶心理
洞察用戶有意識(shí)和無意識(shí)的行為以及心理特征通過構(gòu)造一系列的服務(wù)來促進(jìn)……
- 查看更多 >>
最新新聞Latest News
- 中小型企業(yè)網(wǎng)站建設(shè)完應(yīng)該如何營銷
- 很多中小型企業(yè)往往糾結(jié)于以下10個(gè)問題:一、我們起步比別人晚,我們的……
- 做企業(yè)網(wǎng)站到底做給誰看?
- 設(shè)計(jì)經(jīng)常時(shí)不時(shí)的遇到一些企業(yè)客戶,常常搞不清楚誰會(huì)真正看你的企業(yè)網(wǎng)……
- 傳統(tǒng)企業(yè)進(jìn)軍移動(dòng)互聯(lián)網(wǎng),從移動(dòng)云網(wǎng)站開始
- 移動(dòng)互聯(lián)網(wǎng)是移動(dòng)通信和互聯(lián)網(wǎng)融合的產(chǎn)物,其發(fā)展的重要基礎(chǔ)便是智能手……
- 網(wǎng)站建設(shè)和運(yùn)營五大細(xì)節(jié)決定用戶黏性
- 網(wǎng)站的成功離不開搜索引擎優(yōu)化,更離不開最基礎(chǔ)最根本的用戶群體,如何……
- 2015年值得關(guān)注的電子商務(wù)5大趨勢
- 線上線下銷售的界線正在變得越來越模糊。在2015年,這一趨勢仍將繼續(xù)。……