欢迎来到速发表网,咨询电话:400-838-9661

关于我们 登录/注册 购物车(0)

期刊 科普 SCI期刊 投稿技巧 学术 出书

首页 > 优秀范文 > 数据分析方向

数据分析方向样例十一篇

时间:2023-08-30 09:16:30

数据分析方向

数据分析方向例1

引 言

运动训练科学的基本理论在1960至1970年基本形成,而研究则在1990年后正式开始。运动训练科学属于自然科学尤其是数学、化学、物理学、生物学、生理学等科学的产物。传统的运动训练科学遵循的是小数据研究理念与模式,然而,随着大数据的到来,小数据所展现出来的碎片化、分散化的特点不能完全的反映运动训练的模式,而大数据的分析存储、收集、使用数据的能力则在运动训练科学中逐渐应用。从训练人员身上的传感器、可穿戴设备以及场内的摄像头,再到服务人员手中的互联网以及终端设备,这其中大量的数据已经被收集起来,进而为以后的训练服务应用。不论是受伤运动员的训练还是教练的战术布置,都已经更加完整已经呈现在我们面前。可见在大数据时代的到来,为运动训练科学提供了重要的帮助。也为运动训练科学领域注入了新的生机与活力,推动其在科学化研究和运动训练现代化研究的发展,解决了在运动训练中许多遗留下来的问题,并且提供了新的研究方法思路,为运动训练科学开辟了一条新的研究道路。

一、大数据时代下运动训练科学的研究现状

在大数据的背景下,不论是运动员的恢复、预防或伤病,运动竞赛的过程,运动的训练的评价和效果,还是在竞赛过程中的战术分析与安排、运动员的选材、运动训练的时间等都与大数据有着紧密地联系。因此,在大数据时代下如何从众多的数据中寻找在运动训练中各种数据之间的联系,发现隐藏在运动之中的秘密,从而准确的为运动员或者在训练中提供有效的数据,帮助运动员到达合理的身体状态与竞赛成绩是对运动训练科学是极为必要的。如今大的数据的出现帮助在田径、游泳、篮球、足球、棒球、羽毛球等运动提供了一定的数据支持,为竞技赛场增添了一丝色彩,潜移默化的改变着运动训练科学领域的认知。

高尔夫球运动受到了各国运动员的喜爱,如今运动员也正是依靠数据分析来帮助他们在技术方面、训练方面更加全面,以此提高他们的训练成绩。例如Track Man技术是帮助运动员测量在每次击球后的击球方向、旋转速度、角度和力度等,然后通过数据软件等进行分析,帮助运动员了解自己的数据之后,更加针对性的进行训练。在上个世纪八十年代,美国男子职业篮球联赛就通过数据来展示运动员在场上的得分、进攻、掩护、挡拆、对抗数据,经过近四十年的数据积累,裁判可以根据比赛回放等来进行更好的判断,教练也可以利用数据对战术进行分析安排。截至目前为止,凡是聘请了数据分析师的球队俱乐部平均胜率都打到六成以上,而其他俱乐部仅有40%的胜率。在某些运动中运动员可以通过佩戴传感器来检测运动员的心率、垂直弹跳以及加速度等,从而保障运动员的生命安全,并且制定相应的训练,提高运动员的运动能力。

在德国,每一个足球场地四周布置传感器,甚至在每位球员的训练中也都放置了传感器来对运动员的运动变化细节进行分析。这些数据会在很短的时间内传到终端平台中,有由教练对这些运动员的运动轨迹、攻击范围以及运球的速率等相关信息进行战术分析;在网球的训练中,也有许多场地安置了传感器来捕捉网球的发球速率、旋转、发球角度等来判断球员的打法、击球特点。为战术的安排提供强有力的数据支持。而运动员的发球失误率以及非受迫性失误上升时,教练则会判断球员的体力或者心理状态不足。除了这两项运动外,乒乓球、羽毛球、棒球等都通过这种独特的数据方式来帮助球队以最小的经济利益获取成功,从而提高运动员的比赛成绩。

二、大数据背景下运动训练科学的研究方向

(一)明确运动科学训练研究对象

在大数据背景下要想确定运动训练科学的研究方向,首先要明确习研究对象。而我国近代运动训练科学是一种实体的研究,不依赖于其他事物外部复杂的实体。而在实体的研究中主要利用分解还原的研究方法,在数据的研究模式采用小数据研究。例如,在竞技体育中将各项竞技因素分开,单独训练体力或者技术,并且以弹跳力能力、心率肺活量、肌肉围度等指标来确定运动员的能力。然而,在运动训练科学的研究表明,实体是依附于关系的,关系甚至比实体更加重要。例如,核算与蛋白质相互作用产生生命,原子之间相互作用而产生分子。故而,对于训运动训练科学来说,关系要比实体更加重要。如果我们能在运动训练科学中找到这些信息之间的联系,就能准确的分析在运动训练中的技巧与对策,从而提高运动员运动训练的效率。

(二)明确运动训练研究视角

我国近现代运动科学训练都是单向度,如研究运动技术或者运动员的生理机能等。我国运动训练科学的研究方向首先要由单向度多向度发展,促进运动训练科学的有效进行。

结语

综上所述,大数据时代的到来为我国运动训练科学研究领域带来了新的机遇。我们需要迎接\动训练科学思维研究的变革,融入大数据的变迁,顺应时代的变化,明确运动科学训练研究的对象以及视角,提高运动员比赛能力和运动技巧,从而帮助运动员在比赛中取得良好的成绩。

作者简介:

白曼利(1981.3-),女,民族:汉族,籍贯:陕西咸阳,学历:研究生,专业:体育教育,研究方向:运动训练,职称:副教授。

杨江林(1982.1-),男,民族:汉族,籍贯:云南丽江,学历:大学本科,专业:体育教育,研究方向:运动训练,职称:副教授。

数据分析方向例2

DOI:10.16640/ki.37-1222/t.2017.10.236

0 引言

工业设计是以创新为核心内容,其涵盖范围包括技术、科学、和艺术等多种知识为一体的交叉类学科。其设计的过程是将创造性思维运用于工业设计过程当中,创造性思维不仅决定设计的创意,还进一步影响着设计过程和结果,因此在大数据时代的背景下,创造性思维对于工业设计的过程十分重要。近年来,许多企业为追求效益忽视创造性思维在工业设计过程的影响,只重视生产加工技术,而对国外优秀设计进行“抄袭”,这已经成为国内设计圈公知的弊病。

1 大数据时代对工业设计思维的要求

1.1 创造性思维工业设计的内涵与思维方式

(1)创造性思维工业设计的内涵:工业设计的产品是现代工业化条件下批量生产的产品,因为产品具备相应的使用功能,让人用起来产生舒适感,使消费者接受它们。但产品并不是冰冷的机器,它们是为人服务的,做出来的产品应具备欣赏价值和其他种种要求,特别是大数据时代背景下,为响应社会需求的提升,这就需要多种学科知识的协同。很多人都会将工业设计只是做为单纯的造型活动,如此简单的理解却并不全面,外观造型设计是设计师通过运用多方面的知识来赋予产品的一种外在表现形式,但其设计内涵却远不止这些,内涵包含在设计当中的文化价值观念、人机关系理解、市场需求和技术知识等。

设计如今已经远远的超出了工业生产活动的范畴,它更是一种态度和观点,小到一些具体的物件如冰箱、汽车、化妆品,大到跨国企业、国家方案的制定,它影响着人类生活的方方面面,为人类健康的生存方式创造了有利的条件。

(2)工业设计的包阔范围很广,思维方式也不能仅针对其中的某一个方面,而是要跳出旧的牢笼,突破现有的设计模式,这就要从一种综合的理解出发,设计出拥有全新内容的产品或服务,所以,创造性的思维方式才是工业设计的核心。

工业设计的创造性思维简洁地来说,我们可以将它看成是思维发散和收敛互相交替并且互相扶持的过程。例如说,桌子的设计,你如果只去想:桌子,桌子……,头脑只是被“桌子”二字占据的话,工业设计作品的成果是不会好的,因为只针对一种具体事物来进行设计的话,只会被这件物体的概念将创造力束缚住,思想如果只是停留在如何设计出好看的桌子,创新性设计也只会停留不前,最多也就是把桌子的尺寸、材质和形状上进行改变,但是如果我们从实用性和材质上来考虑,思路就会瞬间开阔了,我们可以根据不同顾客的喜爱,从材质上来选择适合的,还能根据不同人的身高来制定桌子的高度,这就打破了一种思维定势 ,社会的现状、价值观差异和文化差异等这些因素都纳入到了具体的工业设计活动当中,而不是非常简单地“就事论事”这样的狭窄思维方式。

1.2 大数据时代背景下,创造性思维体现在工业设计过程中的作用

(1)概念设计效率和解决问题的能力都可以通过创造性思维来提高:工业设计过程是发现问题-分析问题-解决问题,而创造性思维能够有效的提高这一过程。例如日本获得G-MARK大奖的汤匙设计,日本在儿童用的汤匙中加了一个弯曲结构来解决儿童在用汤匙过程中掉落的问题。

(2)团队设计的最大效率可以通过创造性思维发挥:团队协作提倡创造性思维能够在很大程度上提高F队效率。对于一个设计团队来讲,设计过程要遵循“全面兼顾大局,长短互补”的原则,对于逻辑思维较强,而形像思维较弱的设计师,可以从产品可行之处和实用之处来多做考虑,相反,对于一些逻辑思维较弱,而形像思维较强的设计师来说,就可以大胆的考虑从不同的造型、颜色、材质等多种特性入手。由这些设计师组成的设计团队,效率将发挥到最大。

(3)创造性思维工业设计的设计风格,具备鲜明的中国特色,本土设计的国际竞争力也会得以显著增强:在如此激烈的国际竞争中,一个国家的工业设计要想生存发展,设计风格就必须要有民族特色,例如德国的奔驰轿车由于其设计思维严谨,卓越的产品品质使得其长期在汽车行业当中立于不败之地。我国的工业设计如果想要生存发展,工业设计水平就要必须提升,产品的竞争力必须增强。综上所述,在工业设计过程中,创造性思维发挥着十分重要的作用。

2 大数据时代工业设计的思维发展方向

大数据时代工业设计思维的设计核心不仅指的是人的个体,还包含全人类社会,因此,利用创造性思维演化出的社会化设计更关注人类的整体利益。它是以社会化思维中“以人为本”的设计理念中延伸发展出来的,包含 环境保护、资源节约、使用可再生材料、优化资源配置等方面,与“绿色设计”、“生态设计”一脉相承,这些恰恰都符合中国古代的“天人合一”的价值观。

3 结语

本文对工业设计的内涵和思维方式进行了一些剖析论证,两者的共同点都是不要“就事论事”,从事物的外侧去开阔思路,讨论大数据时代创造性思维的具体作用,进而延展出大数据时代工业设计思维的几大未来发展方向。

参考文献:

[1]王明昊,赵鹏飞.浅析大数据视角下的工业设计及其应用价值[J].商场现代化,2015(22):20-22.

数据分析方向例3

一、大数据对审计工作带来的影响和挑战

大数据审计是对各类电子数据、账套、文件进行审计,是计算机审计的延伸和发展,是对多行业、多领域、多种形式海量数据的电子审计方式。大数据审计既要处理结构化数据,又要处理大量的非结构化数据,对审计目标、审计内容、分析技术和审计思维模式都提出了新的、更高的要求。

1.审计目标的转变

在信息化发展初期,计算机审计能够通过对数据的观察和分析发现疑点,为审计提供线索。随着大数据时代的到来,审计目标逐步转向发现线索、评估风险、关注效益等方面,审计不仅要发现违法违规问题,更多的是要揭示制度方面存在的问题,评估内控风险,通过对经济社会相关大数据的获取和分析,洞察行业整体走向,探索发展规律,对国家、行业、部门的制度出台与发展策略做出前瞻性的思考和战略性的分析。

2.审计内容的转变

传统意义上的“数据”大多是指数字,如主营业务收入金额、营业费用等,由简单数字或用数字编码的简单文本组成,传统的数据分析工具基本上能够满足其需要。而大数据不再单纯指数字,其涵盖的内容更加宽泛;传统意义上的 “数据”是关系型的、结构化的二维表数据,而大数据则是指在不同时间生成的复杂、异构、多样化的数据,包括xml、html、文本、音频、视频和“影子数据”(如访问日志和web搜索历史记录)等。

3.分析技术的转变

顾名思义,大数据分析就是指对规模巨大的数据进行分析。大数据分析包括5个基本方面:一是可视化分析,利用图表完整展示数据分析的过程和数据链走向;二是数据挖掘算法,从海量的、随机的、不相关的数据中构建数据挖掘模型,提取有价值的、隐含在数据内部的信息;三是预测性分析能力,根据可视化分析和数据挖掘的结果,做出预测性的判断;四是语义引擎,借助一系列的工具去提取、解析和分析数据,从“文档”数据中自动提取信息;五是数据质量和数据管理,通过标准化的流程和工具对数据进行处理,保证数据分析结果的质量。

4.审计思维模式的转变

大数据时代带来审计思维模式三大转变:一是实现审计全覆盖而非抽样审计,对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计全覆盖[2]。二是审计数据的混杂性而非精准性。传统审计以财务数据为审计重点,其核心是结构化的报表和凭证信息,而大数据具有高度的数据混杂性,数据类型涵盖了结构化、非结构化和半结构化的数据,保留了最宝贵、最有价值的信息,其内涵具备更深、更广的洞察力。三是大数据主要反映事物的相关关系而非因果关系。大数据没有改变审计事务间的因果关系,而是注重对相关关系的开发和利用,使得数据分析对因果逻辑关系的依赖性降低了,甚至更多地倾向于基于相关关系的数据分析。

二、大数据审计的方式和途径

面对大数据时代对审计工作带来的挑战,审计方式和途径将实现以下4个方面的转变。

1.应用大数据分析技术,实现审计方法从数据验证性分析向数据挖掘性分析转变

传统的计算机审计,是通过电子数据采集转换对数据进行验证,通过构建查询分析、多维分析等方法模型进行数据分析,而应用大数据分析技术,则能够使审计数据分析逐步由传统的验证性分析向挖掘性分析转变。挖掘性分析是指采用大数据处理技术,利用数据仓库、数据挖掘和模型预测工具进行审计分析[3],从大量数据中发现蕴涵的数据模式和规律,包括分类分析、聚类分析、关联分析和序列分析等。其中,分类分析按照数据属性,将数据分派到不同的组中;聚类分析根据数据的相似性原则,将数据划分为若干类别,使同类数据差别极小,不同类别数据差异尽可能大;关联分析可发现隐藏在数据间的相互关系,通过挖掘发现不同数据间的密切度或关系;序列分析可发现数据出现时间、出现序列的规律,分析数据间的关联性。

例如,在金融审计中,运用数据挖掘中决策树的关联规则和挖掘方法,可对不良贷款与正常贷款之间相互错分的规律进行研究,创建对不良贷款和正常贷款具有较强分类能力的条件属性指标,从而增加分类预测模型的可理解性,并在一定程度上揭示商业银行信贷资产风险等级分类的相关规律[4];在税收征管审计中,利用聚类方法,根据聚簇规则,可将纳税户进行分组,使组内纳税户具有最大的相似性,组间纳税户具有尽可能大的相异性,从而产生聚类标准,并按照标准对纳税户进行分行业、分税种聚类分析,确定纳税群体的总体情况和特征,为审计目标和审计重点的建立提供依据。

2.应用大数据分析模式,实现审计方式从发现问题向风险预警转变

传统审计工作以发现问题为主,对经济形势进行预测分析,因而须等到相关事件发生并且形成一定规模后,再根据搜集到的足够数据进行分析研究,具有滞后性[7]。而大数据技术可通过对跨领域的大规模经济、社会行为数据进行分析,对经济社会相关异常动态实现早期关注,利用其对异常数据的敏感性实现早期预警。当前,审计可以运用大数据相关技术,对宏观经济社会风险问题展开初步分析。例如,可以综合利用政府债务审计数据、社保审计数据、宏观经济运行数据、金融市场数据等多种数据库构建大数据集合,运用数据挖掘等数据分析工具,结合多个数据库信息交叉分析与宏观经济社会运行相关的事件,通过基于个别领域、结构化的数据分析,不断将半结构化、非结构化的跨领域数据加入分析框架中,逐步提高大数据审计的分析能力。

3.应用大数据审计作业平台,实现单机审计向云审计转变

以审计大数据为中心建设“云审计”平台,实现远程存储和移动计算,使审计机关能够通过网络接入“云”实施审计,利用大数据分析、人工智能等信息技术,解决数据采集分析和管理中存在的问题,实现审计成果共享。其次,应完善联网审计系统,逐步建立预算、执行、财政、地税、社会保障、医疗机构、公积金等重要行业和部门的审计实时监督系统。再次,应建设审计数据综合分析平台,运用大数据技术,加大业务数据与财务数据、单位数据与行业数据,以及跨行业、跨领域数据的综合比对和关联分析,提高运用信息化技术查核问题、评价判断、宏观分析的能力。最后,应推广“总体分析、发现疑点、分散核实、系统研究”的审计模式。

4.构建专业的审计分析队伍,实现传统纸质账本审计向大数据审计转变

审计工作应实现“六大转变”,即由单点离散审计向多点联动审计转变、由局部审计向全覆盖审计转变、由静态审计向静态与动态审计相结合转变、由事后审计向事后与事中审计相结合转变、由现场审计向现场审计与非现场审计相结合转变、由微观审计向微观与宏观审计相结合转变。为此,需要在组织方式、人员结构、思维方式等方面与之相适应。在组织方式上,应尝试开展无项目审计,依托审计数据中心积累的数据资源,横向关联比对分析,纵向深入挖掘分析,从数据中发现审计疑点和线索。在人员结构上,应不断提升“四种能力”,即大数据分析能力、综合研究能力、创新能力和跨领域知识运用能力,不断加强对大数据先进理念和前沿技术的学习,掌握大数据分析方法,提升审计人员综合素质。在思维方式上,应培养“数据先行”意识,以数据为核心,使数据分析在审计工作开展前先行实施,根据数据分析结果,有重点、有步骤、有深度地在审计实施过程中进行核查验证、追踪线索、发现问题,全面深化大数据技术在审计工作中的应用。

三、大数据技术在审计中的应用

大数据技术在审计中的应用广泛,具体说来,主要表现在以下4个方面。

1.创新大数据工作模式,探索部门预算执行审计全覆盖

传统的以处(科)室为单位的孤立审计,已不适应大数据审计的要求,需要打破部门界限,以审计项目为管理主线成立大审计组,进行扁平化管理。大审计组分领导小组、数据分析组和问题核查组三个层面:领导小组负责审计方案的制定、领导决策等,由牵头机构组建;数据分析组由审计能手和计算机操作骨干组成,具体负责审计实施,筛查审计疑点和线索;问题核查组由审计一线人员组成,进行实地延伸核查。例如,在“同级审”项目中,采集各部门预算执行审计数据,通过对数据进行集中分析,发现是否存在部分预算项目缺乏科学论证、影响预算执行的问题;结合各预算部门的财务数据,发现是否存在预算项目因连年结转的情况下仍然安排新增预算、造成资金闲置的问题;通过对数据进行宏观整体分析,发现是否存在预算执行效率不高、分配下达预算不及时、拨付转移支付资金超期等情况。

2.应用数据分析作业平台,开展跟踪审计

通过建设审计数据综合分析平台,搭建关系国计民生的重点行业联网审计系统,用Hadoop等专业工具处理半结构化、非结构化数据,规范高效地汇集和处理大规模数据信息。例如,在地税审计中,可利用地税联网审计系统,集中进行全省地税数据整理分析,探索“数据集中采集、集中统一分析、疑点分布落实、资源充分共享”的大数据审计模式,实现全省联动审计;通过构建查询分析模型、多维分析模型,固化审计思路,对地税数据进行全面分析,重点选择税款征收、税款缴纳和税款管理等信息,在财政审计中,运用部门预算执行分析平台,将独立运行、分散存储的各部门预算编制、预算指标、部门决算、部门财务核算等业务数据,进行标准化清洗和整理,同时与组织预算执行数据进行整合,实现各类资金的横向关联,对资金分配结构、资金使用流向、资金管理情况进行总体分析,全面反映预算执行整体情况,实现对预算单位的审计监督全覆盖。

3.多领域数据融合,开展经济责任审计

运用关联分析,找出数据间的相互联系,分析关联规则,发现异常联系和异常数据,寻找审计疑点。在经济责任审计中,可利用财政、税务、社保、公安、工商、养老、房管、教育、培训等数据,进行纵向比对、横向关联分析。例如,可将城镇居民医保、城镇职工医保、新农合等信息进行综合分析,检查是否存在同时参保、重复报销、虚假报销、套取资金等情况;将小额担保贷款与人社部门行政事业单位人员信息进行关联分析,检查是否存在违规向行政事业单位人员发放担保贷款和进行财政贴息的问题;将职业技能培训补贴、创业培训补贴与企业法人和行政事业单位人员进行关联分析,检查是否存在向不符合条件人员发放就业补贴的问题;将人社、农业、扶贫、教育、民政管理的各项培训资金进行关联分析,检查是否存在虚报冒领财政资金的问题;将义务教育、中职中专、中学学籍数据与中职助学金发放、免学费补贴等信息进行关联分析,检查是否存在虚报冒领或者套取中职助学金、免学费补贴等专项资金的问题。

4.深入挖掘数据,开展宏观经济形势预测

利用数据仓库、数据挖掘和模型预测工具进行审计分析,运用回归分析等统计方法,分析趋势变动或数据关系,发现总体情况和规律,进而揭示体制机制性问题。例如,在“三公经费”专项审计中,可通过各预算单位财务核算数据提取“三公经费”预算编制和实际支出情况,结合单位人员花名册,构建统计分析模型,进行结构分析和时间序列分析,横向比对所有预算单位“三公经费”的支出规模、各项支出占比、人均支出金额与年度支出趋势等,分析其压缩控制比例是否符合要求,各项支出比例和人均支出金额是否存在异常和明显偏离,进而挖掘行业性、趋势性问题,并对离群点进行延伸,发现违规违纪问题线索等。再如,利用城镇或农村居民家庭人均收入指数和各地制定的最低收入保障标准进行分析,查找人均收入指数与最低收入标准间的差异,分析各地低收入标准制定是否科学,为政府制定宏观经济政策提供参考。

综上所述,大数据技术的发展对审计工作提出了新的、更高的要求,也为审计提供了新的工具。大数据审计应从数据、人才和技术等方面逐步积累基础资源,创新工作思路,研究技术方法,培养高素质人才,不断提升大数据技术在审计中的有效运用。

参考文献:

[1]怀进鹏.大数据是国家战略资源[J].中国经济和信息化,2013(8):49.

[2]秦荣生.《关于完善审计制度若干重大问题的框架意见》学习笔谈摘要[J].审计研究,2016(1):3.

数据分析方向例4

2016年1D6月,中国大数据领域投融资金额规模达到503.70亿元,排名第二的美国,投融资金额规模为111.38亿元。其他上亿元投资的国家分别为以色列5.35亿元、英国4.32亿元、德国2.24亿元、加拿大1.06亿元。

中美大数据领域投融资对比

从2016年上半年的整体投融资状况来看,中国和美国的投融资事件占全球绝大多数的比例,中美两国大数据业务的发展基本代表了大数据在全球的发展状况。深入对比中美大数据领域的投资,对掌握大数据的应用方向和技术方向具有较大的意义。

从图3可以看出,在大数据行业应用方面,中美都有涉及的行业有医疗、营销、物流、娱乐、体育和教育。其中,医疗领域是2016年上半年行业中发生投融资事件最多的领域,中国发生18起,美国发生5起;其次为营销领域,中国发生6起,美国发生3起。

相比美国,大数据的应用行业在中国更加广泛和活跃,2016年上半年中国有大数据投资而美国尚未涉及的领域比较多,如媒体、交通、金融、汽车、物联网、艺术、招聘、旅游、农业和租房等领域。其中媒体行业发生10起投融资事件,交通行业发生6起,金融行业发生6起。

在大数据技术应用方面,2016年上半年涉及的投融资方向有数据分析、数据应用、数据安全和数据工具。其中数据分析方向投融资事件最多,美国15起,中国14起;其次为数据工具方向,美国8起,中国5起;数据应用方向,中国6起,美国3起;数据安全方向,中国5起,美国3起。

从投融资的金额规模上看,2016年上半年,中国和美国的侧重点各不相同,中国偏重于大数据行业领域的应用,而美国侧重于大数据技术领域的应用。2016年上半年中国在大数据行业应用的投资总规模达到485.1亿元,在大数据技术应用领域只有18.6亿元;美国在大数据行业应用领域的总投资规模为26.9亿元,在大数据技术应用领域达到84.4亿元。

中国投融资规模的TOP3均为行业领域,分别为交通、物流和医疗,投融资规模分别为305.4亿元、105.0亿元和50.7亿元。而美国投融资规模的TOP3中有两个为技术领域,分别为数据工具44.2亿元、数据分析31.3亿元;有一个为行业领域――医疗16.6亿元。在行业应用方面,中美投资事件最多的均为医疗领域。

中美数据分析领域投融资市场对比

可以看出,美国比较侧重发展大数据的技术应用,而数据分析是大数据技术应用领域投融资最多的技术方向。2016年上半年,中国在数据分析方向的投融资事件达到14起,美国15起,高于中国。在金额方面美国更是远远超过中国,投融资金额高达31.3亿元,而中国只有7.3亿元。

数据分析方向例5

中图分类号:TP393.08

随着网络技术的高速发展,网络自媒体的数量庞大,网民人数的不断增多,互联网资源数量呈现指数型的增长,网络已经成为民众获取信息的最主要渠道。网络在传达社情民意方面的优势也逐步显现出来,成为反应社会舆情的主要载体之一,在表达民众心声、反映社会舆论方面发挥极其重要的作用。

在海量数据中,通过探测并发现网络舆情中的热点话题,有助于梳理舆情监控的思路,抓住纷繁的监控工作中的重点,从海量的互联网信息中找到目标信息,将有限的人力物力用到关键的地方,提高工作的针对性和有效性,更好地应对网络舆情。

而如何对网络舆情加以有效的监督和引导,积极化解网络舆论危机,使和谐的互联网环境为维护社会稳定、促进国家发展、构建社会主义和谐社会发挥重要作用,不仅具有重要的现实意义,也已经成为网络舆情工作面临的一个重要课题。基于上述分析,我们认为网络舆情数据越来越呈现出大数据特征。

1 问题与挑战

大数据环境下的网络舆情分析和挖掘方法具有如下挑战:

1.1 为了得到更准确的舆情信息,所需要的数据量大幅膨胀。随着数据生成的自动化以及数据生成速度的加快,自媒体时代的到来,为了获得准确的网络舆情信息需要处理的数据量急剧膨胀。一种处理大数据的方法是使用采样技术,通过采样,把数据规模变小,以便利用现有的技术进行数据管理和分析。

1.2 数据深度分析需求的增长。为了从数据中得到准确的舆情信息进而指导人们的决策,必须对大数据进行深入的分析,这些复杂的分析必须依赖于复杂的分析模型。所以对网络舆情信息的分析还需要路径分析、时间序列分析、图分析、What-if分析等。

1.3 自动化和可视化分析需求的出现。在TB级的复杂舆情信息环境下,网络舆情系统应该能根据网站的内容自动构造查询,自动提供热点推荐,自动分析数据的价值并决定是否需要保存。

2 大数据技术的主要进展

针对传统分析技术的局限性,研究者提出了一些试验性的解决方法和途径。R是开源的统计分析软件,IBM公司研究人员致力于对R和Hadoop进行深度集成,把计算推向数据并且并行处理,使Hadoop获得强大的深度分析能力,为应用开发者提供了丰富的数据分析功能。

针对频繁模式挖掘、分类和聚类等传统的舆情分析方法,研究人员也提出了相应的大数据解决方案。如,Iris Miliaraki等人提出了一种可扩展的在MapReduce框架下进行频繁序列模式挖据的算法[1],Alina Ene等人用MapReduce 实现了大规模数据下的K-center 和 k-median聚类方法[2],Kai-wei chang 等人提出了针对线性分类模型的大数据分类方法[3]。U kang等人使用“BP算法”处理大规模图数据发掘异常模式。Jayanta Mondal等人[4]提出了一个基于内存的分布式数据管理系统来管理大规模动态变化的图以支持低延迟的查询处理方法。Shengqi Yang等人[5]对基于集群上的大规模图数据管理和局部图的访问特征进行研究,为了在图查询处理中减少机器间通讯,提出来分布式图数据环境。Jiewen Huang等人提出了一个多节点的可扩展RDF数据管理系统,比目前系统的效率高出3个数量级。

3 网络舆情分析发展方向

3.1 实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势。在大数据新型计算模式上实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势,需要进行更细粒度的仿真、时间序列分析、大规模图分析和大规模社会计算等。

这些舆情主体间频繁联系、相互影响,在这个过程中涌现出一些大V,他们左右着其他主体的舆论方向,最终影响整个舆论场。同时,关注点相似的舆情主体间也自觉或不自觉地形成了一些联系相对紧密的子群体,在子群体中信息传播速度更快。要管理和引导网络舆情,就必须对网络舆情主体和舆论子群体进行研究,而社会网络分析方法就是有效的手段。

3.2 网络舆情信息的实时分析和挖掘。面对海量数据,分析和挖掘的效率成为网络舆情分析领域的巨大挑战。尽管可以利用大规模集群并行计算,但在数10TB以上的数据规模上,分析和发掘的实时性受到了严峻的挑战,而查询和分析的实时处理能力,对于舆情运用个体来说及时获得决策信息,做出有效应对是非常关键的前提。

3.3 关联不同领域数据进行舆情分析,非结构化大数据处理分析成为难点和重点。网络上的信息是千千万万的人随机产生的,从事网络舆情研究要从这些看似杂乱无章的数据中寻找有价值的信息。网络大数据有许多不同于自然科学数据的特点,包括多源异构、交互性、失效性、社会性、突发性和高噪音等,不但非结构化数据多,而且数据的实时性强,大量数据都是随机动态产生。网络数据的采集相对科学数据的采集成本较低,网上许多数据是重复的或者没有价值的,价值密度低。一般来说,网络舆情的数据分析及预测,比科学实验的数据分析更困难。所以我们不要一味的追求获取越来越多的数据,而是数据的去冗分类,去粗取精,从数据中挖掘有用信息,减少不必要的数据采集。

3.4 词汇理解的复杂性研究。既考虑词汇的情感倾向性,又权衡语义模式对评论的情感倾向值的影响,能比较全面地分析突发事件网络舆情的态势。但是词典的构建与语义模式的建设需要人工参与,个人的主观性影响比较大,机器学习的能力不强,准确度不高。另外,由于网络语言表达的灵活性,技术的发展速度跟不上社会话语变迁的复杂性。在国内的网络语境中,谐音、暗语是常用的表现手法,借古讽今、借外讽内是常用的叙事手段,隐喻、借代是常见的修辞。现有技术还不能完全准确地判定句子的情感倾向性,机器对词汇的理解能力需要进一步研究。

4 结束语

随着大数据时代的到来,我们要不断改进舆情的分析方法,将大数据思维及方法运用到网络舆情分析中去。首先要开始关注大数据分析,其次不再仅仅依靠语义分析,而是求诸于自动化的数据分析,再次要关联不同领域数据进行舆情分析,等等。总之,我们要突破传统,将舆情分析向大数据分析的方向创新。

参考文献:

[1]Miliaraki I,Berberich k,Gemulla R.Mind the gap:large-scale frequent sequence mining.SIGMOD’13,2013:797-808.

[2]Ene A,Im S,Moseley B.Fast clustering using MapReduce. KDD’11,2011:681-689.

[3]Chang K,Roth D.Selective block minimization for faster convergence of limited memory large-scale linear models.KDD’11,2011:699-707.

[4]Mondal J,Deshpande A.Managing large dnamic graphs efficiently.SIGMOD’12,2012:145-156.

数据分析方向例6

关键词:

主元分析;多维数据流;异常诊断;稳态特征向量;实时预警系统

0引言

隧道工程的变形监测内容多、周期长,且监测过程中随时存在安全隐患,而隧道健康监测手段目前主要集中在对隧道围岩位移的量测,对隧道围岩位移测量数据的处理方法有位移反分析法、时间序列法、回归分析法、灰色系统预测、神经网络模型预测等,也有很多学者针对监控量测数据处理的计算机辅助系统进行了研究,如孟陆波等[1]、吴连波[2]利用计算机软件编写了位移预测和回归分析的软件。还有专家学者提出一些新的隧道健康监测方法,如尚金光[3]通过研究变形监测的技术特点与物联网的技术架构,设计了基于物联网模式的变形监测具体解决方案;刘燕萍等[4]采用三维激光扫描技术分析隧道收敛状况等。但是隧道在施工过程中的健康监测手段主要集中对围岩位移的监测,目前还未见通过应变来进行监测的相关文献。

主元分析(Principal Component Analysis, PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽取的有效方法,被广泛用于信号处理和故障诊断,它用最少的特征量对数据样本进行描述,将多个相关变量转化为少数几个相互独立变量从而达到降低空间维数的目的[5]。主元分析方法作为一种压缩数据的方法多被应用于预警模型分析的前期数据处理中,如刘锋[6]运用主成分分析原理,对各类传感器采集的数据进行关联分析,对关联度较大的属性,利用PCA算法对各属性进行主元分析,对判别桥梁健康状态意义不大的数据进行降维处理,以减少数据的处理量,使输入模型的数据更加有效;李志华[7]通过传感器阵列采集火灾发生初期气体信息,采用基于PCA的神经网络算法对火灾信息进行识别实现火灾的早期判别以及分类;宋杰鲲等[8]采用基于PCAAR(Principal Component Analysis Autoregressive)和K均值聚类方法对煤炭安全进行预警研究;谷琼等[9]提出一种基于主成分分析的基因表达式程序设计算法,并将其用于边坡稳定性预测,构建边坡稳定性的预测模型。以上对主元分析方法的预警应用分析多集中于其数据降维功能,本文根据隧道自身结构特点以及多维应变监测数据的变化规律,提出了一种改进的主元分析方法,用于隧道的健康监测。

该方法的主要思想是:对数据流滑动窗口内数据进行主元分析,通过计算累积方差贡献率确定PCA模型的主元个数,针对相应主元所对应的特征向量,构建特征向量与原始数据流的映射关系,从而将对原始数据流的动态分析转换为对特征向量的稳定性分析。这种改进的主元分析方法能够及时识别同步多维数据流的异常变化信息,并且适用于非周期性监测数据流。隧道应变的实时监测数据是非周期性的同步多维数据流,以上述数据和方法为基础可对隧道进行实时稳定性预警分析,通过对特征向量的稳定性分析来计算新进窗口数据的稳定性级别,以该级别和前次的隧道断面稳定性预警结果为依据,判断本次的隧道断面预警级别,从而达到实时监控与预警的目的。实验结果表明,该方法可以实时准确地反映隧道应变的异常变化,从而为隧道施工期间的安全监测提供了有效依据,并为同类问题的研究提供了一种有效解决方案。

1改进主元分析方法

数据分析方向例7

Abstract:Support Vector Machines (SVM) based on structural risk minimization (SRM) principle is a new machine learning technique and has many advantages in solving small sample size, nonlinear and high dimensional pattern recognition. In this paper, it is applied to the credit scoring prediction of suppliers in the government procurement activities. To get better classification accuracy, PCA(Principal Component Analysis) is combined to SVM to mine the independent attributes of supplier credit.And then, SVM is trained by these independent attributes obtained. By this way, the model of PCA-SVM for credit ananlysis of suppliers in the government procurement activities is builtto evaluate the prediction accuracy of PCA-SVM,while comparing its performance with those of neural networks (NN) and traditional SVM.

Key words:government procurement;credit analysis; support vector machines

政府采购不同于一般的采购行为,它具有政策性强、规模大、资金多等特点。政府采购项目,尤其是国家重点建设项目,如北京奥体项目、南水北调工程、三峡工程等,更是集政治性、经济性、社会性于一身,对国家的社会效益、政治效益和经济效益都会产生广泛而深远的影响。因此,在政府采购中为避免国家的财税流失、保证政府投资效益,提高政府采购效率,必须规范政府采购市场,促进供应商在市场竞争中遵守国家法律、法规,规范经营,并将对供应商的管理提高到信用管理的高度。

在市场经济环境下,良好的履约能力对政府采购项目按时、保质、保量地完成是十分必要的,而供应商履约能力是与其信用水平密不可分的。因此,在对供应商进行规范化管理过程中,政府部门应对供应商的信用进行公正、客观地分析。这具有很强的理论与现实意义,引发了国内外学者广泛的研究和探讨[ 1-3]。常用的信用分析方法包括层次分析法、模式识别理论和神经网络等。由于信用分析具有多属性和非线性等特征,这些方法在应用中都很难取得满意的效果。

笔者尝试将数据挖掘技术与机器学习方法相结合,建立基于主成分分析——支持向量机技术的供应商信用分析模型。通过主成分分析技术进行数据挖掘,改善了信用属性数据的特性,提高了支持向量机的建模效率。

一、模型的总体设计

供应商信用分析效果的好坏,主要取决于信用分析中所选用的属性数据的特性以及所采用的方法解决非线性复杂问题的能力。

当前,商业信用分析主要是通过基于财务指标的信用特征而进行的商业信用等级划分。由于财务属性数据种类繁多,且数据之间往往存在紧密的相关性。这无疑加大了信用分析建模的难度。因此,有必要在进行信用分析之前,对信用属性数据进行数据挖掘。在众多的数据挖掘技术中,主成分分析方法既能够有效去除属性数据间的相关性,又可以降低数据维数。因此,它被选作供应商信用属性数据特征挖掘的工具,以构造新的更有效的信用属性数据。

数据挖掘后,接着面临的问题是如何有效地构建供应商的信用分析模型。由于在政府采购多采用“短名单”,这就造成了供应商的信用分析具有典型的小样本、多属性及非线性等特征。传统的信用分析方法很难进行有效地分析。神经网络技术虽然能够进行良好的经验学习[ 2],但由于其基于经验风险最小,易出现过拟合问题,从而降低了模型的泛化能力。

20世纪90年代兴起的支持向量机(Support Vector Machines,SVM)是基于结构风险最小化原理的统计学习方法, 适用于小样本分类问题。在解决高维、非线性问题时,SVM通过非线性映射把非线性分类化为线性问题来处理。从而,显示出其显著的优越性[ 4-5]。因此,SVM技术是进行供应商信用分析建模的有效工具。

 

笔者将PCA技术与SVM技术相结合构建政府采购中供应商的信用分析模型,建模的基本过程如图1所示。

二、信用属性数据的特征挖掘

主成分分析方法目前主要有两种:标准主成分分析方法和基于核的主成分分析方法。

(一)标准主成分分析

标准的主成分分析是一种有效的数据特征挖掘方法[ 6]。它基于数据二阶统计矩,对由一系列观测数据向量组成的向量组进行分析,通过选择样本点分布方差大的坐标轴进行投影来降低维数而使信息量损失最少。

记供应商的信用观测属性矢量为:

数据分析方向例8

中图分类号TP274 文献标识码A 文章编号 1674-6708(2013)87-0222-02

0 引言

数据的自动采集和分析是电子和软件技术发展的一个重要成果,它有效地替代了人们枯燥而重复的劳动。由于电控罗经和平台罗经的调试时间较长,并且需要实时记录数据,致使调试工作效率低、维修人员工作强度大。

为此,本文设计并实现了罗经姿态角信号自动采集和分析,提高了罗经调试工作效率,减轻了维修人员工作强度,同时也增强了调试数据的可读性与可保存性。

1 总体设计方案

1.1 技术性能需求分析

根据罗经姿态角信号自动采集分析仪设计需求,对国产和引进的各型船用罗经进行了广泛深入的调研,提出该分析仪必须具备以下功能:能够采集频率为50Hz、400Hz、500Hz的罗经姿态角信号,实时绘制姿态角信号曲线,分析罗经周期,计算方位稳定点,方位漂移率以及稳定点起伏误差,数据保存对比及编辑打印。

1.2 组成结构

根据技术性能需求分析,设计分析仪硬件、软件组成结构如图1所示。

数据采集仪对姿态角信号进行AD采集,并将采集数据通过RS-232串口通信传输至上位机;上位机通过运行数据分析程序完成数据分析,并输出结果。

2 数据采集仪设计

针对姿态角信号采集需求,设计数据采集仪组成结构如图2所示。

数据采集仪采用智能化方式设计,有微处理器,通道选择电路,专用轴角转换模块,电路和电源组成。数据采集仪的功能实现模拟信号的数字化,角度解算、显示以及向上位机发送姿态角数据。

2.1 微处理器

微处理器采用MCS-51系列单片机,该单片机广泛地应用于军事和工业控制领域,具有环境适应能力强,连续工作时间长,可靠性高等优点。

在数据采集仪中,单片机通过并口扩展来控制多个采集模块,并在收到信号采集模块传来的信息后,完成航向的解算,然后通过串口通信电路向上位机发送数据。

2.2 通道选择电路

通道选择电路在微处理器的控制下,选择数据信号的流向,从而使采集模块正确完成采集并送入微处理器进行解算。

2.3 数据采集

数据采集模块采用中国船舶重工集团716研究所生产的XSZ系列超小型自整角机/旋转变压器-数字转换器,具有体积小,重量轻,可靠性高的优点。

该转换器将模拟信号转换为计算机可接收处理的数字信号,转换精度可达0.001度,满足姿态角信号采集的精度要求。

2.4 键盘和显示

键盘和显示的主要功能是通道选择控制,航向初值装订,姿态显示。共有4个键盘,分别为通道选择、装订移位、装订数值以及确认键。

2.5 数据发送

数据发送采用单片机自带的串口通信,并使用EIA RS-232C标准。在数据传输过程中采用了数据纠错技术,确保了数据传输的可靠性。

2.6 单片机程序

采用51系列单片机汇编语言对单片机进行编程。单片机程序采用模块化设计,包含总控程序、中断程序以及各功能子程序;并在程序中设置看门狗,防止运行过程中可能出现的问题。

3 数据分析程序设计

数据分析程序流程图如图3所示,主要包含串口采集模块、数据保存模块、曲线显示模块及数据处理模块。

3.1 串口采集模块

串口采集模块包括电控罗经采集和平台罗经采集两部分。

Windows 平台下的串口采集程序通常可以使用三种方法实现:Windows API、封装好的串口通讯类(如CSerialPort类等)以及串口控件。

综合考虑性能、易用性等因素该数据分析程序采用的是Microsoft公司的ActiveX控件MSComm。

MSComm(Microsoft Communications Control)是Microsoft公司提供的简化Windows下串行通信编程ActiveX控件,通过串行端口传输和接收数据,为应用程序提供串行通讯功能。MSComm控件在串口编程时非常方便,编程人员不必花时间去了解较为复杂的API函数,而且在VC、VB、Delphi等语言中均可使用 。MSComm 控件的几个常用属性如下:

CommPort 设置并返回通讯端口号;

Settings 以字符串的形式设置并返回波特率、奇偶校验、数据位、停止位;

PortOpen 设置并返回通讯端口的状态。也可以打开和关闭端口;

Input 从接收缓冲区返回和删除字符;

Output 向传输缓冲区写一个字符串。

3.2 数据保存模块

针对保存数据量较大的特点,该数据分析程序采用数据库的方法保存和管理数据。Microsoft Access是现今小型数据库中使用最广泛的一种,数据库以文件的形式存放于磁盘中,扩展名为mdb,一个文件中可以存放许多表,每一个表就是一个最小的数据结构单位,单一的表有固定的结构(键、主键、对应的数据类型等),表与表之间可以通过键(字段)发生联系。

在Delphi中可以以ADO方式动态建立Access数据库并进行操作,具体的方法是使用ADOX对象,CreateOleObject('ADOX.Catalog')函数可用来建立ADOX对象,返回一个OleVariant变量,通过此变量可以在磁盘上建立一个空的Access文件。

该数据分析程序在每次数据采集开始时建立一个临时的Access文件,然后建立临时的数据集、数据源,通过SQL语句(CREATE TABLE)建立临时表,数据采集过程中每收到一个数据就将数据写入临时数据集中,采集结束后如果需要保存数据,就将临时数据库文件拷贝到用户指定文件中并删除临时数据库文件,如果不需要保存数据则直接删除临时数据库文件。

3.3 曲线显示模块

对于一个实时采集软件来说,数据曲线的显示功能是极其重要的,必须清晰、准确、方便的让使用者得到数据的图形表示。Steema公司的TeeChart系列控件无疑是图表显示控件方面的领导者,它具有非常强大的功能,广泛应用于工程、金融等许多领域。

该数据分析程序采用TeeChart Pro 7.0 for Delphi,编程时首先必须为每一个Chart建立Series。Series的类型有很多,在该数据分析程序中使用的是TFastLineSeries,它比较适合显示大数据量的曲线,通过设置可以定义坐标轴、线型、颜色、图表工具、标题、图例等属性,通过AddXY函数可以在运行时添加数据。

TeeChart提供一个图表快捷栏,通过它可以对曲线进行缩放、移动、打印等操作,本软件对该快捷栏进行了扩展,加入了显示坐标功能,在鼠标指针移动到曲线上时显示坐标。

3.4 数据分析模块

数据分析模块包括分析罗经阻尼周期、计算方位稳定点、计算航向起伏误差等功能。罗经阻尼周期为第一个和第二个航向返回点之间时间的两倍。

罗经航向稳定在1°以内,每隔30分钟的航向小于偏差0.5°,最后间隔十分钟的二十个数据的均值为方位稳定点。航向起伏误差为罗经稳定后,继续试验两小时过程中所有航向之间的最大差值。

4 结论

本文所设计的罗经姿态角信号自动采集分析仪能够完成实时采集频率为50Hz、400Hz、500Hz的罗经姿态角信号、实时绘制航向和水平曲线、分析罗经周期、计算方位稳定点、稳定点起伏误差、数据保存对比及编辑打印等功能,信号分辨率

经多次试验证明,该分析仪技术性能可靠,可作为罗经修理辅助设备,能满足多种船用罗经调试需求,提高了装备维修的质量与效率。

参考文献

[1]祝常红.数据采集与处理技术[M].北京:电子工业出版社,2008.

数据分析方向例9

平衡度误差即为理想要素与实际被测要素间的变动量,同时在平衡度误差数据处理过程中要求相关技术人员应注重确保被测要素与基准间的平衡性,继而由此达到最佳的误差数据处理状态。而分析法在误差数据处理流程中的贯穿,要求相关技术人员应注重获取直线度误差,且在计算过程中采取最小包容区域准则方向,以此达到高效率数据处理目的。

一、平衡度误差数据模型建构路径

第一,在平衡度误差数据模型建构过程中要求相关技术人员应注重对最小包容区域进行严格把控,即确保其符合相间准则,并注重选定两条最小包容平衡线,继而由此实现被测要素数据的获取,满足误差评定条件。同时,在平衡度误差评定过程中为了提升整体评定效果,亦应注重将被测要素、基准要素作为标准,获取直线度误差数据信息,并以误差数据曲线绘制形式将平衡度误差评定结果直观地呈现出来;

第二,在平衡度误差数据模型建构过程中为了满足模型建立需求,应注重依据误差数据将误差曲线设定为n个测点,并注重确保n=1,2,3,4……n,且利用y1,y2,y3……yn对基准要素测点误差值进行表示,同时设定被测要素测点误差值为yd1,yd2,yd3……ydn,并建立直线方程,y=(yi-yj/i-j)x+(iyj-yi/i-j),最终由此实现对测点误差值的判断;

第三,在平衡度误差值数据模型建构过程中亦应注重对误差数据的评定,且注重在误差评定过程中设定曲线上任一点到基准要素方向连线为Lij的y向距离,并设定平衡度误差为f,由此建立误差数据计算公式:f=yemax-yemin,由此达到平衡度误差数据分析目标,达到最佳的误差分析状态[1]。

二、平衡度误差评定方法

当前平衡度误差评定方法主要涵盖了对三角法、最小二乘法、三点法、基准面方程法等几种误差评定方式,且要求相关技术人员在平衡度误差评定环节开展过程中应注重合理贯穿计算机测量数据处理方式,将平衡度误差评定数据转化为测量矩阵,且在矩阵设计过程中将其计算单位设定为μm,并保持水平方向、竖直方向、测得数据方向分别为X轴、Y轴、Z轴,同时将矩阵数据置入到Windows 98操作分析环境下,继而利用AutoCAD2000对平衡度误差数据进行分析,达到高效率误差数据分析效果。

三、平衡度误差计算机数据处理

1、软件总体架构。基于分析法应用的视角下,平衡度误差计算机数据处理行为的展开对软件总体架构设计提出了更高的要求,为此,相关技术人员在总体架构设计流程开展过程中应注重首先针对平衡度误差分析条件对软件进行层次划分处理,即规划为主界面、数据运算处理、结果输出三个层次。同时,在主界面设计过程中为了提升整体误差数据处理效果,应注重确定计算规模,并发挥AutoCAD2000功能达到误差数据图形分析效果,且通过CAD图形分析模块、三角形准则运算模块等的完善,快速获取平衡度误差值,达到最佳的误差数据处理效果。其次,在软件CAD图形分析模块完善过程中,应注重导入点阵线框模型,同时确定平衡度准则,最终以图形分析的形式全方位展现计算数据,且实现对平衡度误差效果的判断[2]。

2、软件设计与开发。第一,在软件设计过程中为了满足分析法应用需求,应注重完善求解基准方向、平衡于基准方向被测要素两个软件组成部分。同时在软件系统运行过程中,创建Windows应用程序,且在程序建立过程中注重对Visual C++6.0的应用[3],由此获取代码信息:

Void Cwucha View::OnDraw(CDC*pDC)

………………

//求yemax

//求yemin

f=yemax-yemin//平衡度误差

即在此基础上满足平衡度误差数据处理需求,提升整体数据处理效果。

第二,在平衡度误差处理过程中亦应注重完善启动系统、初始化系统等软件结构组成部分,达到最佳的平衡度误差分析效果。

结论:随着社会的不断发展,工业生产等领域在可持续发展过程中逐渐凸显出平衡度误差等问题,影响到了产品生产质量。因而在此基础上,为了对此问题进行有效缓解,要求相关技术人员应注重从软件总体架构、软件设计与开发等角度出发,营造良好的计算机数据处理环境,达到最佳的平衡误差数据分析状态,且就此增强整体误差数据分析效果。

参 考 文 献

数据分析方向例10

[中图分类号] F239.1[标识码]B[文章编号] 1673-0194(2006)01-0044-03

分析程序又称分析性复核,是审计人员常用的重要审计程序(或审计技术)之一。根据信息对称性的特点,财务数据之间、非财务数据之间以及财务数据与非财务数据之间均存在一定的内在联系,审计人员通过分析数据之间的关系,找出其中的异常波动或不一致作为进一步审计的重点,此乃分析程序的原理所在。审计人员之所以广泛运用分析程序,原因有二:一是师事务所面临着、和竞争的压力,需要降低审计费用;二是运用此方法可以提高审计质量。在手工操作下,执行分析程序需要审计人员处理大量数据,并要从中找出相关信息的异常或不一致,这对审计人员的职业能力提出严峻挑战。本文借助Excel的强大数据和图表功能来执行审计分析程序,旨在帮助审计人员迅速而又准确地分析相关财务信息,找出审计风险之所在,为进一步审计指明方向。

一、分析程序原理

分析程序是指审计人员通过不同财务数据之间、以及财务数据与非财务数据之间的内在关系,对财务信息作出评价。分析程序还包括调查与其他相关信息不一致或与预期数据严重偏离的波动和关系。

1.执行分析程序的目的 分析程序在财务报表审计的三个阶段都可以运用,但在每个阶段运用所起到的作用有所不同。在审计计划阶段,执行分析程序可以帮助注册会计师确定其他审计程序的性质、时间及范围。即通过该程序了解、确认被审单位是否存在异常或意外的信息波动,以便找出潜在的错报风险领域,进而确定相应的审计重点和进一步的审计程序。在审计实施阶段,分析程序可直接作为一种实质性测试程序,以收集与账户余额和各类交易相关的特殊认定的证据。在审计报告阶段,分析程序用于对被审单位会计报表的整体合理性做最后的复核。按照注册会计师协会2004年10月和2005年7月两次的风险导向审计准则的征求意见稿的规定,审计人员在了解被审计单位及其环境并评估重大错报风险时应当实施分析程序,从而有助于识别异常的交易或事项,以及对财务报表和审计产生的金额、比率和趋势,并对这些异常或未预期到的关系在识别重大错报风险时应予以考虑。

2.执行分析程序常用的方法 执行分析程序常用的方法有比较分析法、比率分析法和趋势分析法三种。

比较分析法是通过对某一报表项目与既定标准的比较,以获取审计证据的一种技术方法。具体的比较包括本期实际数与计划数比较,本期实际数与预算数的比较,本期实际数与同业标准数之间的比较等。

比率分析法是通过对报表中某一项目同与其相关的另一项目相比所得的值进行分析,以获取审计证据的一种技术方法。

趋势分析法是通过对连续若干期某一报表项目的变动金额及其百分比的计算,分析该项目的增减变动方向和幅度,以获取有关审计证据的一种技术方法。

无论是对财务报表整体执行分析程序,还是对账户或交易执行分析程序,以上三种方法经常被结合使用。

3.执行分析程序的步骤 分析程序在审计各个阶段运用的步骤也有所不同,但在审计计划阶段的应用中尤为完整。在计划阶段,有效使用分析性复核程序,必须系统地执行以下步骤:

(1)确定将要执行的计算及比较:审计人员根据分析目标及获取的相关资料,确定执行何种类型的计算及比较。常用的计算及比较包括绝对额比较、结构比率分析、相关比率分析和趋势分析。

(2)估计期望值(确定基准值):审计人员可以根据各种不同来源的数据估计期望值。估计期望值常用方式包括:根据预算或预测估计期望值、根据被审计单位以前年度的会计信息估计期望值、根据会计要素之间的关系估计期望值、根据同行业资料估计期望值等。

(3)执行计算及比较:审计人员按照公式对被审单位相关数据进行处理,并把处理结果与期望值对比,确定差异或变动幅度。

(4)分析数据及确认重大差异:分析的主要目的是确认是否有异常或意外的波动。由于重大差异和意外波动是错报风险增加的信号,因此,注册会计师必须对重大的差异或波动进行调查。

(5)调查重大的非预期差异:对重大的非预期差异,审计人员必须进行调查,包括向被审计单位询问、检查交易凭证等。

(6)确定对审计计划的影响:不能合理解释的重大差异通常被视为错报风险增加的信号,审计人员通常会计划更详细的测试。执行分析性复核程序可指出高风险领域所在,使审计更具有效率和效果。

二、Excel在执行程序中的具体

1.财务报表整体分析程序 借助Excel执行审计分析程序首先应从被审单位的账务处理系统中将有关数据导入到指定的Excel文件,然后借助Excel程序强大的数据处理功能执行审计分析程序。将财务报表数据导出过程如下(以浪潮国强财务软件为例):进入账务处理系统的“报表管理系统”界面,在“报表”下拉菜单中选择“导出”功能,并指定保存的文件名、位置及Excel类型,见图1。

审计人员应通过对财务报表项目的横向、纵向和比率分析,综合观察和对比,确定重大或异常差异。

(1)利用Excel对财务报表进行横向分析:财务报表横向分析是将报表项目当年数与上年数进行比较,求出其增减数额及比率,以观察变化动态,寻找异常变动项目。以利润表横向分析为例,见图2。

(2)利用Excel对财务报表进行纵向趋势分析:财务报表纵向分析是每一报表项目占资产总额、负债及所有者权益总额、主营业务收入发生额的百分比,与上年同口径百分比比较,并观察和分析结构比例的动态变化,查找异常变动项目。以资产负债表纵向趋势分析为例,见图3。

(3)利用Excel执行财务比率分析:财务比率分析是根据财务报表项目数据计算出具有依存关系的项目之间的比率,并通过不同期间比率的变化(或与同行业平均值比较)来观察和分析报表项目的变动,查找异常变动项目。图4列示了常用的财务比率计算及分析过程。

图4中2004年各项财务比率计算如下:

D5=资产负债表纵向分析!D6/资产负债表纵向分析!D11;

D6= (资产负债表纵向分析!D6-26244)/资产负债表纵向分析!D11,26244为2004年末存货余额;

D7=资产负债表纵向分析!D13/资产负债表纵向分析!D10;

D8=资产负债表纵向分析!D13/资产负债表纵向分析!D15;

D9=(利润表横向分析!D19+利润表横向分析!D13)/利润表横向分析!D13;

D10=利润表横向分析!D7/26244;

D11=利润表横向分析!D6/28370,28370为2004年末应收账款余额;

D12=利润表横向分析!D6/资产负债表纵向分析!D10;

D13=利润表横向分析!D19/利润表横向分析!D6;

D14=利润表横向分析!D21/资产负债表纵向分析!D10;

D15=利润表横向分析!D21/资产负债表纵向分析!D15。

说明:图4中2003年各项财务比率计算与2004年类似。另外,为简化计算,在各项资产余额变化不大情况下,本例中财务比率的分母为资产平均余额的,均采用年末余额来计算。

2.账户或交易分析程序

在审计实施阶段,审计人员常执行分析程序,以证实账户或交易认定的恰当性。资产账户、负债账户收入账户以及费用账户广泛应用到分析程序,下面以毛利率分析为例来介绍分析程序在主营业务收入账户审计中的应用,有关计算和趋势分析见图5。

三、分析程序结果的运用

执行分析程序计算分析得到的异常波动,往往是重大错报风险之所在,特别是被审计单位不能做出合理解释的重大差异,审计人员应将涉及项目作为重点审计项目,必要时应当调整原定的审计程序或追加更为详细的实质性测试程序,以收集到更加充分适当的审计证据,从而降低审计风险、实现审计目的。如在前面的例子中,通过利润表横向分析、财务比率分析和毛利率分析,可以发现该公司主营业务收入无论是全年发生额还是12月份的发生额明显异常,因此主营业务收入的真实性成为审计人员需要重点审计的目标。审计人员通过计算分析被审单位“经营现金流入量/主营业务收入”指标发现,被审年度该项指标较以前年度明显偏小,而审计人员对有关应收款项发询证函也没得到回函。审计人员又进一步检查业务交易的合同和凭证,结果发现,该公司未能提供交易合同,而相关凭证上也没有授权交易人员的签章。最终,主营业务收入虚构的真相被证实。

Excel软件详尽的数表处理功能为审计人员执行分析程序,特别是处理繁杂的数据计算与分析提供了有力的工具。审计实务人员借助Excel软件能够更加高效的获取强有力的审计证据,为降低审计风险、提高审计质量提供了合理基础。笔者衷心希望审计实务人员能够充分利用现有的计算机技术执行审计程序,并开发出功能更为齐全和实用的计算机审计软件,以推动我国审计事业的。

主要

数据分析方向例11

需求分析必须能够表达和理解问题的数据域和功能域。数据域应包括数据流、数据内容和数据结构。数据流式数据通过系统时的变化方式,对数据进行转换就是程序的功能或子功能,两个转换之间的数据传递确定了功能间的接口;数据内容就是数据元素,数据元素由多个数据项组成,如在学校的学生管理信息系统中,“学生”字段有多个数据项,包括学号、姓名、性别、出生日期、成绩等。数据结构是带一种或多种关系的数据元素的集合。

需求分析必须按自顶向下、逐层分解的方式对问题进行分解和不断细化。软件的功能域和信息域都能做进一步的分解,可以是同一层次上的横向分解,也可以是多层次上的纵向分解。

需求分析给出系统的逻辑模型和物理模型。逻辑模型给出软件要达到的功能和要处理的数据之间的关系;物理模型给出处理功能和数据结构的实际表示形式。

二、需求调研

在做需求时,分析人员和客户必须达到和谐的交流,融洽的沟通。通常采用以下几种调研方法:

1.会谈、询问:围绕软件目标提出具体问题;

2.发放调查表;

3.收集分析客户使用的各种表格、有关工作责任、工作流程、工作规范、相关数据标准、业务标准的各种文字资料;

4.收集同类相关产品的宣传资料、技术资料、演示程序或软件程序;

5.情景分析:利用情景分析诱导用户能够把需求告知分析员;

6.可视化方法:结合情景分析,利用画用户界面图、业务流程图、功能结构图、时序图等图形与客户进行讨论。

一般分为规划阶段和业务领域分析阶段:

在规划阶段,第一步要构建高层次的企业模型,包括:调查组织结构、建立组织关系层次图;调查企业的任务、目标、战略重点和关键成功因素并予以分类;识别每个目标和关键成功因素所需的信息;给出每个目标完成的度量标准;分析信息技术对企业业务的潜在影响;建立高层次企业模型;与企业中高层管理人员讨论,对所得信息和分析进行补充和确认。第二步对功能进行分解,具体是输出功能层次图、功能关系图、功能/组织矩阵;第三步进行实体分析,主要是输出高层实体关系图、实体类/信息需求矩阵、业务功能/实体类矩阵。第四步评估企业当前环境。第五步识别和确定预期的数据存储和业务系统,建立业务系统的结构图,确定和记录业务领域。

在业务领域分析阶段,第一步确定业务范围、建立组织、制订计划;第二步进行数据分析、建立详细的数据模型,即详细的实体关系图;第三步业务活动分析,包括分析业务过程细节、分解业务过程、分析过程间的依赖关系、分析业务交互作用、建立业务活动模型;第四步现有系统分析,具体指操作程序分解表、数据流图、用户感兴趣的字段集;第五步业务领域模型的确认,包括完整性、正确性、长效性。

在做需求时不仅要求分析人员要有很强的沟通能力、语言表达能力,还要有相应的调研策略。首先确定用户的软件开发目标,确定系统基本范围,然后围绕这一目标,确定要访问的部门和人员,要了解的业务,以业务为主线,搞清每个业务的每个环节的流程关系、涉及部门、输入输出项;以数据为主线,搞清数据采集方式、数据流向、数据之间的内在联系;搞清哪些业务或数据是已建系统的,它们和新系统的关系是衔接还是替换;应思考是否有新技术可以改进现有工作,用户提出的需求用现有技术能否实现。

三、需求分析过程

取得了需求之后,要对需求进行分析,分析过程是:

第一,问题识别。

解决目标系统做什么,做到什么程度。需求包括:功能、性能、环境、可靠性、安全性、保密性、用户界面、资源使用、成本、进度。同时建立需求调查分析所需的通信途径。

第二,分析与综合。

从数据流和数据结构出发,逐步细化所有的软件功能,找出各元素之间的联系、接口特性和设计上的限制,分析它们是否满足功能要求并剔除不合理部分,综合成系统解决方案,给出目标系统的详细逻辑模型。

常用的分析方法有面向数据流的结构化分析方法SA、描绘系统数据关系的实体关系图E-R图、面向数据结构的Jackson方法JSD、面向对象分析的方法OOA(主要用UML)。对于有动态时序问题的软件可以用形式化技术,包括有穷状态机FSM的状态迁移(转换)图STD、时序图、Petfi网。

上述每―种分析建模方法都有其优势和局限性,可以兼而有之。以不同角度分析,应该避免陷入在软件需求方法和模型中发生教条的思维模式和派系斗争。一般来说结构化方法用于中小规模软件、面向对象方法用于大型软件。

结构化方法分析步骤是:画出数据流图;设计数据流图必须逐步求精;决定哪些部分需要计算机化和怎样计算机化;描述数据流细节,大型软件可以使用数据字典描述所有数据元素;定义处理逻辑;定义数据存储,即定义每个存储的确切内容及其表示法;定义物理资源;确定输入输出规格说明;确定硬件所需有关数值;确定软硬件接口和环境需求。

UML方法分析步骤是:调研、识别系统需求;分析问题领域:确定系统范围和系统边界、确定系统的约束、定义活动者、确定系统的综合要求、确定系统的数据要求、建立USE CASE模型并绘制、绘制主要交互图等;建立静态结构模型:对象类图、数据库模型、包图;建立动态行为模型:顺序图、协同图、状态图、活动图;建立系统物理模型:组件图、配置图;

第三,编制需求分析文档。

需求分析文档便于用户、分析人员和设计人员进行理解和交流。用户通过它可在分析阶段即可初步判定目标软件能否满足其原来的期望,设计人员将它作为设计的出发点。

第四,需求评审。

在将需求分析文档提交给设计之前,必须进行需求评审。一般以用户、分析人员和设计人员共同参与的会议形式进行,包括以下评审标准:正确性、无歧异性、完全性、可验证性、一致性、可理解性、可修改性和可追踪性。

四、需求管理

需求分析过程是一个由粗到细、渐进明晰、持续完善的过程。在指导后面系统设计和编码阶段时都应当不断完善修改需求文档,因此需求管理非常重要。

需求管理包括在工程进展过程中维持需求约定集成型和精确性的所有活动,它是CMM模型二级中的首要KPA(关键过程域)。这些活动包括:定义需求基线(需求文档的主体);评审提出的需求变更申请、评估每项变更可能的影响,从而决定是否实施变更;以一种可控的方式将需求变更融入到项目中;使当前的项目计划与需求保持一致;分析变更所产生的影响并在此基础上协商出新的约定;使每项需求都能与其对应的设计、源代码和测试用例联系起来以实现跟踪;在整个项目过程中跟踪需求状态及其变更情况。