关于数据分析师,你知道数字分析中的十大陷阱吗?

admin 阅读:240 2024-02-10 14:42:15 评论:0

  网景的创始人Jim Barksdale曾经说过一句名言:“如果我们有数据,那么我们来看数据。如果我们有的只是一些观点,那么听我的。”(“If we have data, let’s look at data. If all we have are opinions, let’s go with mine.” )

  以数据驱动,大数据接入,当下每个企业似乎都沉浸在数据分析的海洋中。数字分析师们,甚至统计专业的学生们也都成为了人才市场中的金苹果。我们的营销、生产、客服等部门每天都会产生许多数据大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。这些数据在那儿不去进行分析,最后就会变成垃圾。这种垃圾不需要分类,直接销毁就好了。

  而数据分析师在我们眼中就是哪些变废为宝的魔法师,他们仿佛一个个火眼金睛不单知道发生了什么,正在发生什么,还知道未来会发生什么。

  与之成为鲜明的对比的是85%的高管们称他们的组织正努力转变为Data-driven,而只有37%认为他们成功了。那么,你有没有被数据分析师坑过呢?或者作为一个数字分析师/数据科学家,哪些陷阱是最容易踩入的呢?

  极诣本篇将罗列最容易让数据分析师们马失前蹄的十大陷阱。

  正如威廉·爱德华兹·戴明所言“收集数据的最终目的是为了提供行动或建议的基础”(The ultimate purpose of collecting the data is to provide a basis for action or a recommendation. – William Edwards Deming)。我们许多数据分析师虽然有许多理论知识,精通各种算法和模型,熟练操作各种工具却对为什么要进行分析没有清醒的认识。他们对自己的产出是如何被决策层参考或使用的并不关心。这会导致他们分析的结果完全没有参考价值,给出的建议也无法落地大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。这些结果会变成“我们的客户都是年轻人还要你来分析?”或者“降价就能卖得动,这还要你来教我?”。

  数据分析师必须要对企业甚至行业全貌有深刻的理解。这决定了他们是否能正确选择相关性高的、质量度高的数据源,同时排除杂音干扰。他们需要知道送到自己手上的数据是如何收集的,有没有经过初步加工,自己处理过的数据又会送到谁的手中,而他们在下一步会如何再加工自己处理过的数据。一旦脱节,这以数据为驱动的巨型机器就将戛然而止。

  我们知道在认知偏误中有两个著名的概念:确认偏误(Confirmation Bias)和选择偏误(Selection Bias)。前者说的是我们总是期望我们分析的结果与我们主观的认知相一致,这会让我们在分析时对迎合我们观点的证据积极体现,而对反方证据进行打压甚至不予采用。而后者更是带着有色眼镜进行分析。

  即便数据分析师本身克服了这些偏误,许多时候不得不为了迎合上级或者客户的先入为主的观点进行结果粉饰。

  数据大爆炸让数据分析师面对的数据源从贫乏到天花乱坠。但大多数情况下由于难以保证上游数据收集的可靠性和科学性造成了GIGO(Garbage In, Garbage Out)的效果。如果数据分析师无法甄别哪些是可以采用的数据,哪些又是应该果断摒弃的数据那显然分析的结果很难进行质量控制。因此,拿到数据的时候一问收集方法,二问收集对象,三问收集场景是数据分析师必做的功课。

  数据具有各种维度和指标,有自己的颗粒度。数据分析师必须深刻理解每个指标背后的意义和影响条件。比如落地页跳出率(Bounce Rate),它虽然一定程度体现了受众对页面的态度,但用来评价整体转化能力尚不充分。邮件打开率也是一样。对于不同的分析目的,数据分析师有必要进行抽丝剥茧充分发现本质。到底是哪个地区的受众,哪个设备的受众,分析要到位。

  极诣对数据可视化问题曾经专门进行探讨。随随便便用饼图,线图和柱图傻傻分不清,过多的图表噪音,“魔幻”的坐标轴,这些都是数据分析师常犯的错误。数据可视化和数据抓取与数据处理一样,是数字分析人才必须掌握的技能。要看图说话也要有一张好图才行。

  现在,AI和机器学习的热度某种程度上超过了支撑它们的大数据。和AI沾边仿佛是时髦的标配,尽管大多数时候那些标榜智能的算法只是一些if/else罢了。机器学习也一样。

  对于数据分析师来说这里最容易犯的错误是不能给予更多耐心。虽然我们说机器学习是不断进行的,A/B测试也是具有科学背书的,但是在结果达到可用可信之前就进行部署会带来很大风险。到底是正相关、负相关还是无关,我们必须有足够的数据来支撑。

  “屠龙宝刀,点击就送”,我们对“一刀满级”的渴望是与身俱来的。决策者希望有套软件系统支持数字转型,分析师们同样希望轻点几下鼠标就可以把分析结果跑出来。

  但现实是越优秀的工具越复杂,越需要专业的人才来驾驭。况且,一些免费或者就在手边的工具完全可以胜任复杂的分析需求和数据可视化需求,比如GA,比如Excel或Data Studio。

  对预测分析的追捧很多时候并不是始于数字分析师,而是把数据分析师神魔化的管理者。我们且不说对数据的解读中存在了多少幸存者偏见,面对比围棋棋盘那19×19复杂得多的现实商业环境,我们的分析中必定会忽略大量的影响因素。

  我们无法用分析的手段进行创意制作画出新的《蒙娜丽莎》,也分析不出单身男女的未来对象具备哪些条件,fitting的手段,Outlier的处理方式因人而异,连同样的数据分析出相同的结果几乎都无法做到。从这个意义上讲,在“预后”方面数据分析师可能还不如临床医生。

  最后一个错误当然是“刻舟求剑”啦。笔者常常感叹我们的古人竟然能想出让后世如此受用的寓言和成语。

  数据分析师在选取数据时选择怎样新鲜的数据,过去六个月还是两年,是否考虑到淡旺季,是否考虑到大环境的变化和用户行为短期改变大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。这些是我们需要自问的关键问题。昨天的成功并不能代表明天一定能延续,相同的故事和最佳实践并不一定能满足下一世代的需求。如何以足够动态的方法进行趋势分析,洞察出变化才是有效分析的衡量标准之一。

  数据分析师是那个“为且仅为不给自己理发的人理发的理发师”,他们不是全知的神,他们也不是你迈向Data-driven的一站式解决方案。他们放弃足彩结果分析,放弃股票涨跌走势委身于你,是为了和你一同用数据的手段创造更大的价值。

  所以,请对他们给予更多理解,帮助他们一同克服这些困难,避免这些陷阱。愿你不再说“我被我们分析专家坑了。”

关于数据分析师,你知道数字分析中的十大陷阱吗?

关于数据分析师,你知道数字分析中的十大陷阱吗?

网址:https://zwxdxcm.com/post/Mkl7U5h.html

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容