手机浏览器扫描二维码访问
真正的数据分析师像我在滴滴出行的同事、数据分析界的前辈宋世君老师,他关注的当然不是建立一个庞大的数据统计团队。他对业务的认知深度,以及用数据来辅助产品的业务能力,比大多数产品经理都要专业。作为脸书出身的数据科学总监,他总结过自己的“数据分析十条”:
从这十个法则里,1、6、7、8、9、10都是在表述“数据分析产生的价值应当是洞察”这个道理。分析师应当通过数据发现问题,这其实是最低的门槛,而不是大家想象中的“我懂得分析数据”就能成为分析师。如果能够在发现问题的基础上给出更多的洞见,那才能够成为更高级的分析师,比如前文提到的,知其然,且知其所以然。
数据分析天然会给人客观、中立的感觉,让人在严谨性上有所松懈,忘记了本身做分析的其实是非理性的人,这样就很容易出各种问题,做出许多主观臆测。例如,下图就是网上流传的一个小段子,用不均匀的坐标轴刻意让观看者产生错误认知。
除了刻意行为,常见的数据分析方面的认知偏误也有许多,它们会暗地里影响数据决策的准确性,有些也会影响用户调研结果的准确性。
●样本选择偏误(sampleselectionbiasselfselection)指的是抽样的方法并不严格随机,比如我们取样时只看苹果的用户情况,显然是无法代表大多数用户的;又或者,我们上线了新的功能,只关注使用新功能的用户的反馈,没有关注不使用新功能用户的反馈,这都是取样偏颇。因此在大规模的用户基础上,也经常采取分层抽样的方法,即按照主要属性区分抽样,比如新用户老用户、男女、活跃用户沉默用户,等等。
●选择性偏误(selectionbias)指的是因样本选择的非随机性而导致得到的结论存在偏差,与样本选择偏误类似,但更加隐晦且难以被发现。比如看我做的产品经理公众号“刘言飞语”是否能帮到新人产品经理,于是统计了公众号的粉丝和非公众号的新人产品经理之间的差异,发现前者的确有更好的工作机会和收入情况。这就意味着“刘言飞语”真的帮了大家吗?其实未必,因为关注了公众号的新人产品经理本来就有“更积极地获取有效信息”的特点,这个属性决定了他们会有更好的结果,而不是因为关注了公众号。选择性偏误是内生性(endogeneity)的一种特殊情况,指的是结果会受选择或者数据获取过程影响。
●幸存者偏误(survivorshipbias)指的是只看到了筛选的结果而无视筛选过程中的关键因素。这应该是数据方面最知名的一个认知偏误了。比如,我们看到有的公司创业成功了,自称是某个决定性的策略(考虑了某个产品的形态或者运营活动)左右了公司的生死,于是大家往往信以为真,认为只要这类策略做得足够好,自己也可以成功。实际上,执行了同样策略的公司,可能不只这一家,我们之所以没听说过,是因为它们都很快退出了市场,成为历史。只观察幸存者的行为和听信幸存者的理论,很难找出他们取得成果的关键因素,这也是选择性偏误的另一种表现。有本书叫作《成功与运气》,讲的就是许多人的成功因素中,个人影响是一方面,更多其实还是运气,只是成功者从个人视角看,不可能将自己的成功归为运气,于是就有了许多成功学方法论。
●基本归因错误(fundamentalattributionerror)指的是考察某些行为或后果的原因时高估个人因素,低估场景和环境影响的双重倾向。幸存者偏误也与基本归因错误有关,是我们在观察一件事的结果时,更倾向于相信人对结果的影响,而忽视环境的作用。比如,我们做一个司机使用的接单工具,发现司机的点击情况很奇怪,跟乘客的使用习惯相比,他们经常点错误触,取消返回,这是不是代表司机群体比乘客群体平均年龄大,受教育程度低,因此使用手机的能力差?当然不是,考虑到具体场景,是司机在车内环境下使用手机,手机可能是在支架上,使用难度变大导致的。
●回归谬误(regressionfallacy)指的是没有考虑随机起落的正常波动现象,造成不准确的因果推论。生活中最常见的就是许多药物的药效,大多治标不治本,而我们吃药后病情好转会认为是药效好,其实大都是自愈(比如感冒)。在做用户数据分析时,也经常可能遇到以下情况:我们做了一些事情A,结果用户似乎有了变化,做出了反应B,于是我们推导出A一定会导致B。其实未必,还是要洞察是否存在随机现象,是否存在外界影响等。
●社会期望偏误(socialdesirabilitybias)是在做用户调研时经常遇到的:相较于真实的答案,被调查者更有可能选择符合社会期望的答案。最典型的例子是在一个社会文化过于传统的环境中,同性恋极少会公开自己的性取向。有的公开调查里,喜欢性玩具的大都是男性,是因为女性在并不太开放的文化氛围中一般难以启齿。我们在做日常的调研时,很可能会遇到用户认为某些真实答案会显得自己“自私”“不合群”“过分夸张”等,于是就选择一个更符合社会普遍预期的答案。所以,一定要谨慎选择调研方法,打消被调查者的疑虑,尽可能地发现这些偏误。
●受试者期望效应(subject-expectancyeffect)是指用户会有自己的目的性和预期,所以不选择更真实的答案,社会期望偏误是其中的一种。还有的情况,可能涉及利益关系,比如我们做了一个商品,询问用户在涨价20%的情况下是否还会购买,虽然用户内心清楚涨价20%还是会买,但考虑到不希望涨价,就会表示不会购买,这样得到的结论就是错误的。
还有关于统计误用的更多信息,可以参考https:zh.wikipedia.comwiki%E7%B5%B1%E8%A8%88%E8%AA%A4%E7%94%A8。这只是统计学里和认知心理学里对数据分析认知偏误的沧海一粟,不过已经能够覆盖多数数据分析新人会犯的错误了。统计学,尤其概率的一些初步知识,对我们做迭代流程中的判断来说极为重要,这个学科已经非常成熟,有海量的知识可以自行获取。
“数据分析十条”里的2、3、4,描述的是科学精神,我们接下来要讲的就是实事求是的道理。
坚持对的,放弃错的
几年前的某天,我非常不满地发了一条朋友圈信息:“有的人做实验,效果好就优化,效果差就弃用;有的人做实验,是想尽办法证明自己的实验效果好,然后优化。”这源于当时某个同事的行事作风让我很气愤,在他每年做的一二十个策略里,没有哪个是不成功的,全部有效果,没有效果的,也要找出数据来证明有效果。在他的眼中,数据是他用来证明自己的工具,而不是判断真伪的工具。
在迭代过程中,“坚持对的,放弃错的”是最容易理解,也看似最容易执行的一项工作。可惜,比较容易执行的是前半部分“坚持对的”,而不是后半部分“放弃错的”。只是因为,我们每个人——不仅仅是我那个急功近利的同事——都要面临人性的弱点:我辛苦耕耘之后,还要跟别人承认我的方案不行?更难的是,假如这个方案的来源是老板和不熟悉的人,要说服他们认可你的结论,也要做许多工作。
常见的一种麻烦的情况是,当你否认对方或者自我否认时,大家都会想到一个点:应该不会是我的逻辑推断有问题,可能就是方案没有做好,再优化一下试试?于是就会陷入无穷无尽的优化,几乎所有的坏策略都会进入这种恶性循环,那些没办法给用户带来太大价值的功能和服务,也越堆越多,最后终于不堪重负,在问题暴露之后再着手解决。
因此我们知道,做到“放弃错的”并非是单纯的能力和方法问题,而是心态问题。确保我们在迭代中真的能够“放弃错的”,有以下几件事可以做。
第一,确保在预期时,就设置清晰的退出机制。退出机制对于迭代来说极其重要,更重要的是,在做任何实验前都达成共识:一旦没有达到预期,就暂停这个方向的尝试。
第二,塑造无压力的试错环境。错误带来的压力过大是影响我们心态的更本质原因,假如环境强压下,每个人都不怎么允许犯错,结果就是每个人拼尽全力在避免别人认为自己在犯错,于是就会拼命用数据证明自己,这就陷入了恶性循环。要提供给产品决策者足够大的试错空间,才能够让迭代往健康的方向发展。
第三,由第三方来做中立的判断。若没有强大的自我批判和反思能力,初阶的产品经理和产品设计师,以及其他的产品决策者,就很难做客观中立的判断,这时候就需要相对客观中立的第三方来做中立的判断,这个角色通常是数据分析师。
我和老张的讨论
老张:我一直对MVP这个概念有些疑虑。假如我们把用户体验或者用户价值当成是线性增长的,多做一些用户感知就好一些,那到底做到哪个程度会过了可用性的门槛呢?要我做的话,很可能也是做得足够好才敢拿出去。
刘飞:MVP这个理念本身没错,它是用来说明迭代思维的核心精神的,不要等一切都完美无缺了再让用户用,许多不确定的因素需要市场检验。这个精神能够帮助大多数常常异想天开又理想主义的产品决策者,他们会孤注一掷地把宝押在拼了很久才做出来的产品上,一旦遇到挫折就没有风险承受能力了。
你说用户体验是线性增长的,这个我不太认同。许多体验的确是与功能完整度成正比的,不过增长往往是曲线型的,体验越好,增长的幅度就越小。我们需要寻找的,就是幅度开始迅速下滑的那个点,能够最低性价比地满足用户体验。
你说的疑虑当然是普遍存在的问题,毕竟这个曲线不是真实存在的,它要依靠产品决策者出色的抽象能力来确定,需要很多经验,也需要对用户的清晰认知,不是初学者随随便便就能掌握的。因此我们见到的许多产品的第一个版本,或者过于臃肿,或者过于简单,以致不可用,这都是经验不足的结果。
老张:那么,MVP适用于所有可以迭代的产品吗?
刘飞:有一种情况就不适用MVP,即产品特别依赖体验完整性。例如,硬件产品,像智能手机,就是一个对体验完整性要求很高的产品。哪怕我们看到手机每年都在迭代,但我们知道,第一代iPhone要不是有那么高水平的整体体验的话,智能手机的发展速度不会像今天这么快。就像我们开餐馆,想检验用户对辣的接受程度,压根儿不考虑色香味是不是够好,不考虑服务是不是周到,那用户也压根儿不会来尝试。哪怕我们认为用户的核心价值只是来吃辣。
小作业
(试着阅读下列文字,回答问题)
2015年12月,百度首席执行官李彦宏在某公司的成立仪式上谈起了百度大数据对保险行业、健康行业的影响。李彦宏说,做足疗是否真的对健康有帮助,这个问题可以用大数据来解决。百度每天有110亿次的定位请求,可以算出那些经常去足疗店的人是不是更少去医院。“事实上,大数据得出的结论和我想象的差不多,喜欢去低端足疗店的人是最健康的。如果你常去足疗店可以让你少去医院,那么是不是你的健康保险也更少一点?”
——《第一财经日报》
这个推论存在哪条数据分析上的认知偏误?真相更有可能是怎样的?
佣兵天下(二十年纪念版) 长生歌 冰山总裁的至尊高手 毒宠小狂后 绝色锋芒:牛X王妃 重生之凰临天下 神级保安 驭兽魔后 天才圣手 薄情前夫太凶猛 上古强身术 总裁老公,适渴而止 不装了,我是黑煞战神 女总裁的超级保镖 野花图鉴 谈婚论价 造物主之我培植了怪兽文明 御史大人你马甲掉了 冤家路窄 矿物与岩石图鉴
书海阁小说网免费提供作者布丁有点甜的经典小说醋精Boss从不掉线最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说人人都说,高冷靳少心狠手辣,对女人不假辞色,只有一个女人,捧在掌心里疼宠,恨不能把一切捧到她面前。可是那个女人,却不要靳少,只想要他的种!靳少老婆,我很会赚钱,很厉害的哟。重楼不要钱,只要孩子。靳少老婆,你看我宽肩窄腰大长腿,还有八块腹肌。重楼生不了孩子,没用。靳少汪老婆只要孩子不要我肿么破,在线等,挺急的...
三千古界,万域争锋,荒纹为修行之本。炎之荒纹的炎帝,火焚九幽,气蒸大泽雷之荒纹的雷皇,气破苍穹,雷灭万古兽之荒纹的兽尊,掌御万兽,吞天噬地百魔乱世,大妖横行,万圣陨落。少年姜蒙得不死龙帝传承,崛起于大...
最火爆热血玄幻爽文世人皆求仙魂传承,唯我独得剑神传承!少年易逍遥,掌控吞噬与毁灭之力,修炼天地最强剑道,噬天灭地,一剑逆天!剑斩,毁灭苍穹!掌落,吞噬天地!拳轰,破尽万法!...
剑屠苍穹最新章节列小说剑屠苍穹枫间苍月著剑屠苍穹全文阅读海蓝星大陆,宗门千万,强者林立。为报血仇,萧破军携带天下第一逆天宝物剑塔重生,入塔,修炼,从一个平庸的少年摇身一变,成为一个妖孽般的天才...
古老洪荒大陆,埋葬了多少秘密。曾经仙道的文明已经逝去,而如今是科技的横行时代!有强悍天穹战甲,动辄屠神灭魔有憾世时空要塞,泯灭圣灵妖皇。人族,以科技的文明对抗洪荒大陆诸多强悍种族,无往不利。而他,就是出生在了一个没落的修仙世家之中…这一世,科技横行,神魔咆哮,而我,却要一己之力,重镇天地,证明昔日仙道的不朽荣耀!...
情深缘浅美食无敌苏悦作为一个快要奔三的大龄剩女,不可避免的就是被父母逼婚,在相亲的道路上越走越远,但作为一个优秀的大龄剩女,苏悦并没有感到自卑,她坚信,对的人往往都是最后才遇见的而他,作为一个帅气的海归男,又是一个单身奶爸,两人阴差阳错的撞在了一起,又将碰撞出怎样的火花呢?...