打分、评星、点赞……这些机制会毁掉一个产品 | 一位资深UX设计师的洞察

发布时间:2018-11-14 00:00      浏览:72
作者:Eugen Eşanu
来源:36Kr

我经常去一个地方拿咖啡,那个地方在Google上只得到了3颗星的评价,但却是这座城市做咖啡最好的地方之一。点评的只有两个人,那两个人都有过一次糟糕体验。而Google却让大家看到的是一个拿到3颗星的咖啡店,却不告诉大家这是星巴克以外做咖啡最好的地方之一。


一些公司之所以不断地制造特定产品,是因为10年前他们在Amazon上面收到了太多的5星,以至于几乎不可能让那款产品退役。


我的Uber得分是4.7,我做过的唯一一件“坏事”是跟司机没讲过话。我总会说“你好”、“谢谢”和“再见”,并且也会给小费。所以显然如果你不讲话还是会得到低分。


对于司机来说,有时候你所需要的只是一位脾气暴躁的乘客,因为不被允许吸烟而给了你一颗星。然后你得努力工作1个月才能恢复你原先的得分。这一切只是因为某人不能做自己想做的事情。

滞后效应


我的一位亲戚将她的别墅放到了Airbnb上,当你是一项服务的新人时,你往往会接受任何人入住,原因只有一个,你需要评分。她的第一位客户是一群年轻人,在租下这个地方之后,他们想要举办一场聚会。她不同意,害怕他们会破坏了屋内的东西。这帮人不满意,就给她留了个2星的评价。从而她再也不能租房给任何人了。她被迫给自己的房子重新更名。


就她的那种情况而言如果她任由那两星评价放在上面的话,几乎没人会租她的房子。这种效应有个名字,叫做滞后效应——即某个系统的状态取决于它的历史。银行放贷的时候就是这样的,学校等也是按照这个套路操作。我们是根据对过去行为或事件进行归纳的某个指标来对一个东西进行判断。而我们现在看到的东西就是对未来的管中窥豹,这是人人都接受的看法。


留下反馈/评价——我们的这种做法把一个应该要付出时间和精力的思想过程简化成了一个毫无意义的基本数字。系列片《黑镜》里面每个人都要对彼此进行打分的情形有可能变成现实。其实这件事已经发生了。


有些时候我们应当意识到留下评论不应该是每个人都可以做的事情。为什么?因为我们都是非理性的感情动物


比方说,显然,一些人会不断给他们的Uber司机4星,即便服务非常好。原因何在?借用他们的话来说,他们只会在这种情况下给5颗星:“我只有在受威胁情况下司机救了我一命时才给5星,否则的话为什么他应该得到这么高的评价?”


我们预期从非理性的个体那里得到一个合理的反馈或者评价。这一点我认为多少就有些不理性。


“我应该让客户写下对我公司的评价吗?”


在Yelp.com上的Q&A板块里,对于“我应该让客户写下对我公司的评价吗?”这个问题,网站是这么说的:


也许不应该。在对体验感到非常高兴的以至于留下了热情洋溢的评价的客户与被“鼓励”写出有利评价作为特殊折扣的交换的客户之间存在一个滑坡谬误。不妨说得坦率一点:大多数企业主只会向感到满意的客户征求评价,而不是那些不高性的客户。随着时间转移,这些自我选择的评价就会在企业列表中产生固有的偏见——这种偏见娴熟的客户在一公里以外就能嗅见。那么,如果你的征求到评价被Yelp的自动评价过滤器过滤掉也就不足为奇了。


客户未必总是对的


我总是说,要想做出伟大的产品或者服务,观察大家的行为要比倾听他们的说法更能揭露现实。观其行而不是听其言。社会科学的问卷调查也存在着同样的问题。他们往往充满热望地去回答问题。比方说:“你是个慷慨大方的人吗?”大家会说“我当然是!”无论你给出的是yes/no的选项或者从1到10的打分他们都会这样回答。高估了自己的重要性或者观点是一种人类倾向。


他说:“你知道俗话说客户永远都是对的吧?不过我却认为反过来才是对的。客户很少有对的时候。”——Charlie Trotter 来源:《纽约时报》


那为什么我们还在使用评价?


既然当前的评价系统错漏百出,为什么我们还要使用?这是一种沟通的方式,在购买、阅读或者消费某样东西时,我们需要拿它来作为一张社会认同。不过不幸的是,这是一种不健全的沟通范式,里面包含了一些人类的缺陷。


另一方面,我们仍然采用5星评价系统是因为人的惰性,用这种评价系统总是很容易用。“大家都这么干,为什么我不这么干呢?”或者换个更好的说法“Facebook、Google和Amazon都这么做。我不认为这么大的公司会有错。”这让我想起一个故事:


一个警察看到一个醉汉在街灯下找什么然后问这个醉汉弄丢了什么。他说自己的钥匙丢了,于是两人一起在街灯下找钥匙。几分钟后警察问他是否肯定是在这里弄丢的,醉汉答道:不是。警察问“那为什么你还要在这里找?”醉汉回答“因为这里才有光线啊。”


当然,这个故事有两种寓意。不过,你可以意识到社会认同的力量是如何影响你决策的,而你从来都没有思考过这一点。


我们为什么要使用如此简单的评价系统的另一个原因,是因为这玩意儿可量化并且提供了某种逻辑。“我们应该考虑自身产品或服务的哪些东西?”比方说,如果你的产品的平均得分是3星(最高5星)的话,这意味着有些地方需要改变,说明产品很一般。


但是这些数字真的有那么可靠吗?就数学而言是的。不过当你试图翻译人类情绪的时——我认为情况并非如此。

我们应该信任这些数字吗?


一个很好的例子是智能手机上Facebook的Messenger。每次你打完电话时,他们都要问你完成一项烦人的调查:“这次电话怎样?”对于这样的问题我总是给出1星的评价,因为,首先这是Facebook,其次是因为这个烦人的问题总是在我打完电话之后弹出来。


可是当某人给通话打了1星的评价却没有留下反馈的话这能给你提供什么样的真正洞察呢?而且即便某人留下反馈,其中90%的反馈都是基本的人类情绪。那种来自特殊上下文情况下的情绪,是在刚打完电话后受很多因素影响的情绪。而我们却要把那玩意儿转化成数字?一个对不同人有不同意义的数字?


我们把人类情绪转化成裸数据,比如数字和星级评价,并且预期能从中获得一些关于改进产品的合乎逻辑的答案。在我看来这就好像人类情绪比那些数字更加理性一样。

“我应该写下那些有违自身感受的评价吗?”“当然。请表达出来”


这是一个更加广泛的问题


不过现在当我坐下来思考的时候,我觉得这跟我们人类的关系更大,而不是评价系统。我们被鼓励随时随地分享我们的看法,每个人都被这样要求。一家商店会发电子邮件给你问你的体验如何,对他们的产品是否感到满意。在机场,你被问到航线的服务如何,等等。


现如今,通过对某个东西发表一下意见,每个人终于都有机会让自己的生活有了一点意义。为此,我们忘记了有时候闭嘴反而更好,即便你在购买一杯7美元的咖啡时某个东西未能满足你的痴心妄想。


那么我们应该对此做点什么吗?


我们能不能改进一下评价系统呢?可以是可以,但是改进到什么程度又会遇到另一个人类问题呢?在此我们应该审视的不是修复评价系统的问题,而是如何处理人类瑕疵的问题。就是那么点缺陷毁了我们的产品、企业或者职业生涯。如果我们能够绕开这个,创建一套能鼓励更好行为的系统,则我们就能以更好的方式影响生活。


另一方面,既然坏处那么多为什么你会想要这么简单的一套评价系统(比如五星评价系统)呢?因为速度和摩擦更少。这是我们在互联网世界里拼命想要的东西。我们试图让前者最大化后者最小化。我们使用这些系统是因为它们易用而不是别的原因。但这是最好的方式了吗?有没有替代物呢?

体验如何?质量怎样?舒适度多少?整体设计怎样?


不要让评价做得那么简单化


给出1到5的评级却没有解释原因是一种糟糕的UX,因为这可能会欺骗未来客户或者用户对该服务价值的认知。应该在给出评价的同时强制要求用户留下经过认真思考的评论,这就是另一个专题了。


一些公司在提供评价系统的同时还提供了很多不同程度的反馈(比方说阿迪达斯)。在这里你可以留下对一双鞋的舒适度、对材质、设计的评价,并且描述产品各个部分。另一方面,有的则不允许你发表任何意见,除非你回答了所有的问题,从而给其他用户提供一幅更全面的画面之后。

阿迪达斯的评价系统就做得不错


我曾经给一家电子商务网店工作过,当时我跟一位客户讨论了他的购物体验问题。他给了一个产品3星的评价,因为送货的家伙对待他很粗鲁。可是送货公司跟这家网店是一点关系都没有的。当然,你不能责备他。但是让大家留下妄想式的反馈更困难一点并且鼓励经过深思熟虑的建设性批评意见就是我们的工作了。


不过到头来,一切归根到底都取决于你究竟想从产品那里得到什么——是更好的评价还是更多的评价呢?

© 2011~2015 3 北京勺海市场调查有限责任公司 | 京ICP备12031756号 | 京公网安备11010802012285号

电话:010-84284411    地址:中国北京朝阳区东三环中路建外SOHO18号楼1506室   技术支持:千晨科技