商人从今天开始
如何成为一名数据科学家
- 2014.04.30

充分利用统计学和IT来分析数据的“数据科学家”这一职位正在引起人们的关注。然而,通过数据分析做出有价值的发现并不是专家的专有特权。任何了解简单框架的人都可以执行高级数据分析。
普通商人可以成为数据科学家吗?
“数据科学家”作为一项前景广阔的工作在商业杂志和书籍中被广泛介绍。数据科学家没有明确的定义,但从广义上讲,它是能够通过分析数据并将其与适当的措施联系起来做出前所未有的发现的人。
曾在《纽约时报》工作的统计学家 Nate Silver 预测了 2012 年美国全部 50 个州的总统大选结果,为数据科学家创造了吸引关注的机会。通过将大量的民意调查结果应用到自己的数学模型中,西尔弗不仅能够准确地预测出50个州中每个州的赢家和输家,还能够准确地预测出总统选举人(在美国总统选举中,选民投票给每个州选出的选举人团,以及总统候选人获胜的选举人团票)获得了多少票。西尔弗的数学模型根据民意调查的进行时间等因素对民意调查结果进行加权,将其相加,并与过去的结果进行比较。
这激发了每个人的希望,即通过对所谓的大数据进行某种分析处理可以取得突破性的发现。然而,即使只是谈论大数据分析也需要广泛的技能。例如,可能的阶段包括形成关于应该分析什么的假设并考虑适当的研究方法,使用统计和信息技术知识处理数据,以及分析结果和实施措施。为了进行大规模数据处理,Hadoop*1正在引起人们的关注,对熟悉这些系统的工程师的需求也在增加。然而,一个人很难掌握所有技能,因此通常通过将适合每个阶段的人员聚集在一起来组建一个团队进行数据分析。此外,推动数据科学家进行大数据分析的咨询公司数量最近迅速增加。
那么,我们应该把数据分析留给专家吗?即使你买了一本统计学教科书,打开它,很多人也会发现自己被复杂的数学公式弄得头晕。如果一个普通商人想要获得数据分析技能,应该从哪里开始呢?
盲目数据分析无法找到有价值的信息
商人需要的是能够转化为增加利润措施的洞察力。重要的是能够通过数据分析确定您可以控制的因素并提出具体措施。
畅销书《统计学是最强大的科学》的作者、统计学家西内圭表示,要想找到提高企业生产力或优化库存成本的方法,并不一定需要先进的统计知识或昂贵的大数据分析平台。
从 20 世纪 90 年代末到 2000 年代初,关键词“数据挖掘”成为商界的热门话题。该方法涉及将大量数据输入到分析软件中,并使用强力检查数据项之间的关系,以发现有价值的信息。这常常会带来令人惊讶的发现,例如“尿布和啤酒经常在超市同时购买”,但数据挖掘热潮最终消失了。据说造成这种情况的原因之一是通过数据挖掘获得的发现并没有带来太多商业利益。将尿布和啤酒部门靠近,对于购买这两种产品的人来说会很方便,这可以增加每种产品的销量。然而,这也需要改变销售楼层的布局和运营的成本,以及用于分析的昂贵硬件和软件的成本。









