浅见数据分析

data 浅见数据分析  By Web2.0 盗盗

我们生活在数据所驱动的世界之中,要掌握这个世界,就要懂得利用如何进行数据分析。用数据来揭示本质,找出问题,提出解决问题的方案,执行之后再通 过数据来反映解决程度。互联网的时代,对于利用数据、分析数据更是不容置疑的重要。因为,我们离数据是如此之近,而数据改善我们体验的故事也是如此之多。

窃以为,数据分析有三种层面的理解:第一层,定期对已有数据的整理、分析及汇报。这是数据分析的最初应用。旨在通过频数等描述统计, 用直观的报表或图形来“微言大义”的反应问题。如本月的女用户是增加用户中的比例,是总体用户的比例,这个比例达到一定情况下,说明了什么问题等等,这样 通过已有数据来直观说明问题。不难理解,这样的数据处理方式与其是说数据分析,不如说是在做数据汇报。其目的性很明显,同时操作难度也不大,虽然简单,但 是可以作为企业定量衡量绩效的重要方式。因为流程的可复制与程序化,大抵上可以采用一些软件来提高效率,当然,自行编写程序也是很好的选择之一。

第二层,基于目的性的分析研究。企业生存的核心是账面上的数字,但往往谈论的是产品和服务应该怎样被客户所接受这样的问题。因此,将 企业所关注与讨论的问题定量化,模型化,而后去主动的搜索信息,基于模型整理、分析之后,揭示这些企业关心的问题。如服务的同质性、可替代性、主观问题如 满意度的客观解释等。这些数据用描述统计所得到的结果往往是有偏、不一致的。需要通过数理统计的处理,应用适用的模型去测度。最终,告诉决策者,我们的产品与服务中诸如可替代性、满意度等问题的答案是什么。这一层面上,相较于第一层的“数据整理与汇报”而言,最大的改变是去测度,而非简单通过频数来描述。

第三层,无明确目的的问题解决性分析。前述的方式,无论是分析汇报数据的描述统计,还是基于对某一关心问题的测度研究,都是基于在决 策层认为信息不足以决策之时,为了补足信息而做出的研究。而无明显目的的问题,则是决策层希望解决问题,但却不能确认究竟是哪些数据在影响问题,如何分析 数据才能找到答案的情况下,用一个整体、且又模糊的目的来指导数据分析。比如,如何才能增加用户、如何将非积极用户转化为积极用户、怎样使得用户认可商业 模式等等。要解决这类问题,首先要做的就是量化问题,将不明确的问题,用可以测度的变量来支撑。例如网站粘性不高问题的解决,可以转化为:定义积极用户、 定义非积极用户的、此二者的差异、二者差异之于其他网络服务是否具有同样的差异等等可以通过第二层的数据分析测度的变量,用这些变量来支撑网站粘性不高问 题,如何解决这样一个很难直接测度的问题。显而易见,找到可以测度的支撑变量,并且用这些变量支撑,是有足够可信度来发现问题的。这其中应用到的与其说是统计分析工具,不如说是统计思想。

对于数据分析,我认为没有任意一种工具与模型是可以通用的,因此每个问题都要通过统计思想与经验去甄别、选择合适的分析工具。更为重要的是,统计工具没有时髦与否,只有适用之分。要利用统计思想去探求事物的本源,而不是形而上的统计工具应用。

最后需要声明一点,上述的三层仅仅是为了说明问题,在实际应用中不宜将数据分析主观割裂开来。
感谢阅读。

Author: 孙 晗 Comments: 7 comments Date: 11 Jul 2009
Categories: No Tags: , , ,

There are 7 comments. Leave a comment!

  • ¬ ray
    #26686 July 11th, 2009 at 9:02 pm

    不错啊,读起来感觉挺有道理。

  • ¬ wo
    #26687 July 11th, 2009 at 10:15 pm

    专业术语太多,什么化,什么性的,书看多了,理论太多了,实践如何?

  • ¬ bikini
    #26690 July 11th, 2009 at 11:17 pm

    good ~

  • ¬ Ray
    #26718 July 13th, 2009 at 1:11 am

    量化无明确目的问题的过程主观意识占主导作用,似乎不太合乎数据分析本质

  • ¬ kang
    #26734 July 13th, 2009 at 5:43 pm

    这个什么孙晗写的什么狗屁文章,之乎者也的!
    建议daodao要对发出的文章从严把关,这种文章发出来装13,太可恶了。

  • ¬ KING.KO
    #26786 July 16th, 2009 at 7:12 pm

    一般,鉴定完毕。

  • ¬ glzh
    #27887 August 18th, 2009 at 10:13 am

    写的不错。
    不过三个层面的分析,说成三类分析比较好,因为其中并没有递增的层次的关系,并列的关系似乎更好些。

    kang说的有点过分。你可以不同意别人的观点,可也不能剥夺别人说话的权力呀。什么是“狗屁文章”,就不能换个文明的说法?更何况孙晗的文章写的是自己的心得,没啥不好的。

Name (Req)

E-mail (Req)

URI

Message