当前位置:首页  >  数据分析专题  > 

数据分析入门需要先掌握哪些理论知识?

作者:finereport

浏览:829

发布时间:2023.8.4

做数据分析,首先要明白的是,数据分析是在做什么。如果你不知道自己为什么要这样做,那么,在刚开始接触的时候一定不要去考虑“学什么”、“懂什么”这类东西。我也不建议你先想着去学习哪些具体的技术或者专业知识(比如会不会编程),因为这些东西是不会用到实战中的。学的时候,最好先把学习方法想清楚:我应该先了解什么?我应该听哪些课?然后把这些东西放在一边。

数据分析需要学哪些

数据分析入门需要哪类理论知识呢?从数据分析的定义出发:首先是要理解数据分析的概念和工作内容,其次是要理解如何使用工具、收集到数据、对数据进行处理(整理及加工)。

接下来我将从统计方法和技术两个角度来讲解:

一、统计方法

这部分内容需要我们了解如何使用 Python计算R/Python函数、R/Python公式(包括它们在实际中的作用)、 Excel和 SAS/SPSS公式(包括它们在实际中的作用)以及 Excel中常用函数(包含如何使用函数来对数据进行处理),这些知识是学好统计学必不可少的。

二、技术知识

这里我主要讲一讲 Python编程知识。

其实关于 Python最核心、最基础的内容就是算法了。算法其实比较复杂,但对我们来说只要会用就行,所以这里先把 Python里面最核心的算法列出来让大家看一看。

1、分词词性标注和词性分类标注

分词和词性分类可以看做是数据分析入门中最基本、也是很重要的部分。

2、变量名和变量值

常用变量名称、类型等等的设置、定义方法及计算公式(一般不建议用简单粗暴的“+”或“-”等表示方式,那样不太严谨,需要大家自己设置数据分析模型去实现)。

3、分词结果的查询方法和相关代码

一般可以使用 SQL或者 Python直接进行编程查询了,如果使用 SQL需要提前做好数据结构和查询语言;如果是 Python的话,可以通过代码或脚本进行编写执行。

4、变量值范围

我们常见数据分析会用到一些列变量值范围,比如:中位数、平均数、标准差等等;变量值范围的定义方法及计算公式;常用工具/软件以及编程语言(SQL和 Python等基本可以满足所有分析场景需要)。

5、数据处理

常用的一些操作、数据结构,还有数据可视化等等;

6、常见工具/软件功能

一般的常用工具/软件,如果有编程经验的同学可能已经了解;

7、基本语法和相关计算公式

常见的统计分析中常用的算法;这里就不多说了,需要用到的地方太多了。

还有很多很多,大家看完之后应该能理解什么是“算法”以及为什么要学算法了吧?不过我相信很多同学还是不能理解这些东西,所以我还是建议在看文章之前,先去百度一下“数据分析入门”相关问题,这样可以了解相关知识点。

当然了,大家也可以直接找我了解一下数据分析的一些基本概念、基础知识等等。当然了,这里不是说数据分析要有多高的技术门槛。大家在选择数据分析相关岗位时如果已经是一个“老鸟”了的话,那基本也不用再学习什么新技术和新知识了(除非你是个天才哈)。

报表工具产品更多介绍:www.finereport.com