通常,分析部分提供了计算结果的输出,对获得的结果进行解释,并根据理论和先前的实证证据对这些结果进行讨论。通常,这一章提供了不需要进行任何计算的定性数据分析。由于存在不同类型的研究设计,让我们逐一看看每种类型。
1.研究类型
您选择的论文主题在很大程度上决定了您将如何收集和分析数据。一些主题意味着需要收集原始数据,而其他主题可以使用二次数据进行探讨。选择合适的数据类型对于实现论文的主要目标和目标至关重要,也是论文写作过程中的重要部分,因为整个项目将建立在此之上。
选择适合您的论文的最合适的数据类型可能并不像看起来那么简单。随着您不断深入研究,您将发现与各种数据类型相关的越来越多的细节和差异。在某一时刻,重要的是决定您是否将采用定性研究设计还是定量研究设计。
1.1. 定性 vs 定量研究
1.1.1. 定量研究
定量数据是可以用于统计分析和数学运算的任何数值数据。这种类型的数据可以用于回答研究问题,例如多久?”,多少?”和多少个?”。使用这种类型数据的研究也会提出什么”类型的问题(例如,经济增长的决定因素是什么?市场营销对销售的影响程度如何?等)。
定量数据的优势在于研究人员可以验证它,并方便地进行评估。这允许重复研究结果。此外,即使定性数据也可以量化并转化为数字。例如,使用Likert量表不仅可以适当评估受访者对某些现象的看法和态度,还可以为每个个体响应分配一个代码,使其适合图形和统计分析。也可以将是/否回答转化为虚拟变量以以数字形式呈现它们。定量数据通常使用诸如Eviews、Matlab、Stata、R和SPSS等毕业论文数据分析软件进行分析。
另一方面,纯粹定量方法的一个重要局限性在于,在经济学和行为科学中探讨的社会现象通常非常复杂,因此使用定量数据无法对这些现象进行深入分析。也就是说,与定性数据相比,定量数据在广度和深度方面可能受到限制,而定性数据则允许更丰富地阐述研究背景。
1.1.2. 定性数据
使用此类型数据的研究通常会提出为什么”和如何”这样的问题(例如,为什么社交媒体营销比传统营销更有效?消费者如何做出购买决策?)。这是主要由相关人士的意见构成的非数值原始数据。
定性数据还包括从报告、网站和其他不涉及研究人员与人类参与者互动的二次来源中收集的任何文本或视觉数据(信息图表)。二次定性数据的使用示例包括您可以在SWOT分析、PEST分析、4Ps分析、波特五力分析以及大多数战略分析中使用的文本、图像和图表等。学术文章、期刊、书籍和会议论文也是您可以在研究中使用的二次定性数据的示例。
定性数据的分析通常会深入研究的现象或问题,因为受访者在提供详细答案方面没有限制。与定量研究不同,收集和分析定性数据更加开放,可以引出关于产品、服务、生活方式属性或任何其他现象的轶事、故事以及详细描述和评估。这在社会研究中特别有用,包括管理和市场营销。
定性数据不能总是像个人表达的意见一样总结,因为个人表达的意见多方面。在某种程度上,这限制了毕业论文数据分析,因为往往不可能在定性方式表示的因素之间建立因果关系。这就是为什么定性分析的结果很难被概括,经常进行探讨非常狭窄背景的案例研究。对于定性数据分析,您可以使用工具,如nVivo和Tableau。
1.2. 主要 vs 二次研究
1.2.1. 主要数据
主要数据是在您的研究之前不存在的数据,您通过调查或采访来收集这些数据,以供毕业论文数据分析章节使用。采访为您提供了从行业参与者那里收集关于他们的公司、客户或竞争对手的详细见解的机会。问卷调查允许以成本效益的方式从大规模人群中获取大量数据。主要数据通常是横断面数据(即从不同受访者在一个时间点收集的数据)。时间序列数据在主要数据中非常少见或几乎不存在。然而,根据研究目标和目标,某些数据收集工具的设计允许研究人员进行纵向研究。
1.2.2. 二次数据
这些数据在研究之前已经存在,因为它们已经在官方来源中为除您的研究之外的其他目的而生成、精炼、总结和发布。与主要数据相比,二次数据通常具有更多的合法性,并且可以帮助研究人员验证主要数据。这是从数据库或网站收集的数据;它不涉及人类参与者。这既可以是横断面数据(例如,不同国家/公司在同一时间点的指标),也可以是时间序列数据(例如,一个公司/国家的多年指标)。横断面数据和时间序列数据的组合是面板数据。因此,研究人员需要做的就是找到最适合实现研究目标的数据。
二次定量数据的示例包括股价;会计信息,如收益、总资产、收入等;宏观经济变量,如国内生产总值、通货膨胀、失业率、利率等;微观经济变量,如市场份额、集中比率等。因此,最有可能使用二次定量数据的毕业论文主题包括外国直接投资(FDI)论文、并购论文、事件研究、经济增长论文、国际贸易论文、公司治理论文。
二次数据的两个主要限制如下。首先,免费提供的二次数据可能不完全适合您研究的目的,因此您可能需要额外收集主要数据或更改研究目标。其次,并非所有高质量的二次数据都可以免费获得。诸如WRDS、汤姆森银行家(Thomson Banker)、Compustat和彭博(Bloomberg)等财务数据的良好来源都规定了需要预付访问费,这对于单个研究人员可能是负担不起的。
1.3. 定量还是定性研究… 或者两者都有?
一旦您制定了研究目标和目标,并审查了您领域中最相关的文献,您应该决定您是否需要定性或定量数据。
如果您愿意测试变量之间的关系或在实践中检验假设和理论,那么您应该更专注于收集定量数据。基于这种数据的方法提供了明确的结果,并且在需要以经济有效的方式获取大量数据时非常有效。另一方面,定性研究将帮助您更好地理解含义、经验、信仰、价值观和其他非数值关系。
虽然完全可以使用定性或定量方法,但将它们结合使用将允许您用一种数据类型支持另一种数据类型,并更深入地研究您的主题。但是,请注意,同时使用定性和定量方法可能比您最初计划的需要更多的时间和精力。
2.分析类型
2.1. 基本统计分析
您选择用于结果和发现章节的统计分析类型取决于您希望分析数据并总结研究结果的程度。如果您不主修定量科目,但撰写社会科学领域的论文,基本统计分析就足够了。这种分析将基于描述性统计,如均值、中位数、标准偏差和方差。然后,您可以通过以图形和图表的形式显示变量的分布来增强统计分析的可视信息。然而,如果您主修会计、经济学或金融等定量科目,可能需要使用更高级的统计分析。
2.2. 高级统计分析
为了进行高级分析,您很可能需要访问统计软件,如Matlab、R或Stata。无论您选择使用哪个程序,确保在研究中进行适当的文档记录。此外,使用高级统计技术可以确保您分析数据的所有可能方面。例如,基本回归分析和高级水平分析之间的差异在于您需要考虑模型的附加测试和更深入的统计问题探讨。此外,您需要专注于研究问题和目标,因为深入研究统计细节可能会让您从主要目标分散注意力。最终,您的论文的目标是找到对您定义的研究问题的答案。
这里要考虑的另一个重要方面是,结果和发现部分不仅涉及数字。除了表格和图表外,确保对统计结果的解释准确且引人入胜也很重要。这种高级统计软件与有说服力的文本讨论的结合方式有助于确保您的论文受到良好的评价。虽然使用这种高级统计软件可能为您提供各种输出,但您需要确保适当呈现分析输出,以便读者理解您的结论。
3.分析方法示例
3.1. 事件研究
如果您正在研究特定事件对金融资产价格的影响,那么考虑事件研究方法是值得的。诸如合并与收购、新产品发布、拓展新市场、盈利公告和公开发行等事件可能会对股票价格和公司估值产生重大影响。事件研究是用于衡量特定事件或一系列事件对市场价值的影响的方法。其背后的概念是试图理解是否可以将突然而异常的股票回报归因于与事件相关的市场信息。
事件研究基于有效市场假说。根据这一理论,在有效的资本市场中,所有新的和相关的信息都会立即反映在相应的资产价格中。尽管这一理论并不普遍适用,但在许多情况下仍然成立。事件研究意味着对特定公告对公司估值的影响进行逐步分析。在正常情况下,在没有分析事件的影响的情况下,假定股票的预期回报将由无风险利率、股票的系统风险和投资者所需的风险溢价决定。这些条件由资本资产定价模型(CAPM)来衡量。
主要可以有三种类型的公告,可以构成事件研究。这些包括公司公告、宏观经济公告以及监管事件。顾名思义,公司公告可能包括破产、资产销售、并购、信用评级下调、盈利公告和股息公告。这些事件通常会对股价产生重大影响,因为它们与公司直接相关。宏观经济公告可以包括中央银行宣布利率变化、通货膨胀预测和经济增长预测的公告。最后,监管公告,如政策变更和新法律公告,也可能影响公司的股价,因此可以使用事件研究方法来衡量。
事件研究中的一个关键问题是选择适当的事件窗口,期间被假定为分析的公告对股价产生最强烈的影响。根据有效市场假说,在与任何事件相关的统计显著的异常回报都不应该被期望。然而,在现实中,可能会有正式公告之前的传言,一些投资者可能会根据这些传言采取行动。此外,由于信息处理和反应速度的差异,投资者可能会在不同时间做出反应。为了考虑所有这些因素,事件窗口通常捕捉公告之前的短期以考虑传言,以及公告后的非对称期。
为了使事件研究更加强大和具有统计意义,需要分析大量相似或相关的案例。然后,累积异常回报,并评估其统计显著性。 t-统计通常用于评估平均异常回报是否与零不同。因此,使用事件研究的研究人员不仅关注特定事件的正面或负面影响,还关注结果的普遍性以及异常回报的统计显著性的测量。
3.2. 回归分析
回归分析是一种数学方法,用于确定研究变量之间的相互关系。特别是,可以回答以下问题。哪些因素是最有影响力的?哪些可以忽略?这些因素如何相互作用?以及主要问题,发现的重要性如何?
在论文研究中最常应用的类型是普通最小二乘(OLS)回归分析,它评估了探讨的变量之间的线性关系的参数。通常,使用三种形式的OLS分析。
纵向分析是在长时间内研究单个对象的多个特征时应用的。在这种情况下,观察代表了相同特征随时间的变化。纵向样本的示例包括特定国家的宏观经济参数、特定人员的偏好和健康特征在其生活中的变化等。相反,横断面研究探讨了许多类似对象的特征,如受访者、公司、国家、学生在某一特定时间点的城市等。纵向和横断面研究之间的主要相似之处在于,数据在一个维度上,即随时间段(天、周、年)或跨对象,相应地,在某一时刻进行了观察。
然而,通常情况下,我们需要研究在两个维度上变化的数据,既涉及对象又涉及时间段。在这种情况下,需要使用面板回归分析。它与前面提到的两种方法的主要区别在于,它考虑了每个对象(人员、公司、国家)的特定性。
回归分析的常见步骤如下:
从数据的描述统计开始。这是为了指示样本中包含的数据观察范围,并识别潜在的异常值。常见做法是摆脱异常值,以避免扭曲分析结果。
估算潜在的多重共线性。这种现象与解释变量之间的强相关性有关。多重共线性是样本的不希望特征,因为回归结果,特别是某些变量的显著性,可能会被扭曲。一旦检测到多重共线性,最简单的消除方法是省略其中一个相关的变量。
运行回归分析。首先,使用F统计量估计模型的整体显著性。然后,使用t-统计来评估特定变量系数的显著性。
不要忘记诊断测试。它们用于检测可能影响回归结果的样本缺陷。
还应该提到一些细微之处。当进行时间序列OLS回归分析时,可以进行全面的诊断测试,包括线性测试(独立变量和因变量之间的关系应该是线性的);同方差性测试(回归残差应具有相同的方差);观察的独立性;变量的正态性;序列相关性(特定时间序列中不应该有模式)。这些纵向回归模型的测试可在大多数软件工具中进行,如Eviews和Stata。
3.3. 向量自回归
向量自回归模型(VAR)是统计分析中经常使用的模型,它探讨了多个被视为内生的变量之间的相互关系。因此,这种模型的一个特点是它包括用作回归器的被雇用变量的滞后值。这允许估计不仅即时效应,还有与关系中的n个滞后相关的动态效应。
事实上,VAR模型由k个OLS回归方程组成,其中k是所用变量的数量。每个方程都有自己的因变量,而解释变量是这个变量的滞后值和其他变量。
选择最佳滞后长度
信息标准(IC)用于确定最佳滞后长度。最常用的标准包括Akaike标准、Hannah-Quinn标准和Schwarz标准。
检验平稳性
用于估计平稳性的一种广泛使用的方法是增广Dickey-Fuller检验和Phillips-Perron检验。如果一个变量是非平稳的,那么应该取第一阶差分,并以同样的方式检验平稳性。
共整合性检验
这些变量可能是非平稳的,但属于同一阶次的集成。在这种情况下,它们可以使用向量误差校正模型(VECM)而不是VAR模型来分析。Johansen共整合性检验用于检查具有相同整合向量的阶次的变量是否共享一个共同的整合向量。如果这些变量是协整的,那么在接下来的分析中将使用VECM,而不是VAR模型。VECM应用于非转换的非平稳序列,而VAR则以转换或平稳的输入运行。
模型估计
使用选择的滞后数运行VAR模型,计算具有标准误差和相关t-统计的系数以评估统计显著性。
诊断测试
接下来,对模型进行串行相关性检验,使用Breusch-Godfrey检验进行异方差性检验,以及进行稳定性检验。
脉冲响应函数(IRFs)
IRFs用于图形表示VAR模型的结果,并预测变量对彼此的影响。
Granger因果关系检验
这些变量可能存在关联,但可能不存在它们之间的因果关系,或者效应可能是双向的。Granger测试指示变量之间的因果关系,并根据VAR系统中一对变量的当前值和过去值的相互作用显示因果关系的方向。
学分高考论文辅导针对性解决论文难题,3500+海外学霸tutor团队,可辅导500+专业,根据学生的论文要求和辅导需求,以传授该论文的写作方法和得分技巧为主要目的,采用视频1V1的上课方式,针对学生的需求进行专属备课和授课,导师帮助分析论文作业题目要求,确定Topic和Title、讲解论文Topic相关课程知识点和理论、梳理写作思路提供详细的Outline、提供完整的Reference List,讲解Reference在文中的使用,让学生真正学会海外学术写作,提升论文GPA!