大数据互联网论文样例十一篇

时间：2023-03-16 17:17:40

大数据互联网论文

大数据互联网论文例1

中图分类号：TP393.4 文献标识码：A 文章编号：1006-1010（2014）-13-0019-05

1 从“净网”到互联网舆情

从“净网”说起：为依法严厉打击利用互联网制作传播色情信息的行为，全国“扫黄打非”工作小组办公室、国家互联网信息办公室、工业和信息化部、公安部决定：自2014年4月中旬至11月，在全国范围内统一开展打击网上色情信息的“扫黄打非净网2014”专项行动。从内容和舆情管控的角度来分析，“净网”不是一个孤立的行动，它的根本目标是防止互联网业务和互联网工具成为不良信息和违规内容的传播渠道。

“净网”行动“净”什么？为了便于讨论，我们将互联网上的信息分为2大类：可信任源内容（Trusted Resource Content，TRC）和用户产生内容（User Generated Content，UGC）。一方面，TRC指由可信任的媒体的信息，如人民日报社、新华社等，这类媒体需要具备信息采编、的资质，且有非常严格的内容审核制度保证内容的可信、新闻的真实。另一方面，UGC指由互联网用户自写的内容，这些内容可以是文字、图片、音频、视频，并通过论坛、BBS、微博、自制小网站或者其他互联网媒介。它们具备一个最显著的特征，即用户自媒体特征。由于这些用户一般没有新闻采编和内容的资质，且内容可能未经严格的审核，易造成其内容失真、歪曲，甚至可能是或其他不良信息。“净网”的主要目标的就是保证UGC内容的合法合规。

让人又爱又恨的UGC：互联网媒体正在成长为继报纸、广播、电视之后的“第四媒体”，除了TRC内容以外，其推动力还包括以UGC形式出现的用户互动。这种互动真正体现了互联网的“互联”、“互通”和“互动”。它一方面促进了互联网的迅猛发展，但另一方面，若恶意用户利用UGC扩散和传播违规内容，将会给社会带来极大的负面影响。

UGC和互联网舆情：互联网舆情的组成元素是网民/公众的互联网UGC，它以互联网为载体，以社会事件为核心，是社会事件的言论、观点、态度、情感的集合体，且有较强影响力和倾向性。由于互联网UGC有着随意性、隐蔽性、高传播性、偏差性和易受影响性等特点，互联网舆情并不能等同于社会舆情。但是它代表了很大一部分人群对某一问题、事件的倾向性意见，且这些意见和情绪容易受到影响，甚至引导煽动。互联网舆情分析课题越来越受到重视，研究机构、部级重要媒体也纷纷成立互联网舆情研究办公室，如人民网舆情监测室、清华舆情研究室等。

2 大数据基础技术和应用技术

维基百科对大数据的定义是“一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集”。IDC报告中指出“大数据技术描述了一种新一代技术和架构，以很经济的方式，以高速的捕获、发现和分析技术，从各种超大规模的数据中提取价值”。大数据尚处于行业发展的初期，所以对于大数据是一个数据集还是一个技术集尚有不少的争论。我们认为，它既是一个数据集也是一个技术集，它更是一个场景集。需要从海量非结构化数据中去除噪声获取信息的场景都是大数据的场景；并行计算技术、分布式存储技术、数据挖掘技术等都属于处理海量数据的大数据技术。

大数据的基础技术主要指对数据的计算和存储技术，如分布式计算技术（Mapreduce，Hive等），分布式存储技术（HDFS，HBase等），这些技术用于对海量数据进行计算、存储以及综合管理。但是大数据的场景各种各样，除了基础技术以外，还需要其他技术对各种不同场景下的数据进行进一步处理，我们称之为大数据应用技术。在本文讨论的场景中，互联网舆情数据的处理除了需要借用大数据基础技术和平台外，还需要利用适合本场景的大数据应用技术加以处理，如数据挖掘技术、自然语言处理技术、汉语分词技术等。本文不过多的探讨大数据的基础技术，而着重研究大数据的应用技术。

3 基于大数据的互联网舆情管控

互联网舆情管控是一个非常典型的大数据场景。首先，用户在互联网上产生的UGC数据量大；其次，这些数据的种类繁多，且以半结构化数据和非结构化数据为主，包括文字、图片、数字、音频、视频等；第三，这些数据的价值密度低，需要在海量的信息中去除噪声，找出有用的信息。

基于大数据的互联网舆情管控的理想模式包括了数据采集、舆情发现和信息源定位3个步骤，如图1所示。首先，作为大数据场景，需要有海量的数据作为舆情分析对象，且数据的获取需要具备一定的实时性，否则将无法从中分析出热点舆情。其次，对海量数据的分析处理、发现淹没在噪声中的有价值信息是舆情管控的重要步骤。在这个过程中，我们要发现最新的广泛传播、广泛评论的热点，需要了解网民对热点的基本态度、倾向，并初步判断社会事件在网络传播过程中的真实性、准确性以及判断舆论是否被恶意引导和煽动。第三，若发现互联网舆情有被恶意引导的趋势时，需要准确的找出哪些互联网用户在引导话题和舆论，定位信息扩散的源头和传播的关键节点。

图1 互联网舆情管控的3个步骤

3.1 大数据采集

面向互联网采集的海量信息是大数据分析的对象和基础。由于互联网舆情一般是在线的实时数据，所以需要利用网页爬虫技术[1]将被监控网站、微博的内容全面抓取、存储并索引。这是一种相对比较成熟的技术。它通过定义抓取目标，过滤无关链接确定待抓取的Web页面URL队列，并通过一定的抓取策略从队列中选取下一个需抓取的URL，并重复直到某一条件时停止。抓取策略一般包括广度优先、深度优先和最佳优先3种。由于互联网TRC、UGC有数量大、更新频率快和页面动态等特点，所以在进行互联网舆情数据抓取的过程中需要注意设置抓取对象的优先级，并且需要动态的对URL队列进行更新，以备新页面的产生和旧页面的失效。

作为互联网舆情管控的第一步，大数据采集还需要注意以下几个方面。首先，采集的对象需要全面。从传播范围上说，需要关注传播面广的重要新闻网站、音视频网站，网民参与度高的BBS、论坛、博客、其他社交工具等渠道；从地理位置上说，需关注大中城市、重点区域等地域的相关新闻；从行业角度看，需关注行业主管单位、协会等机构的相关新闻。其次，信息采集要及时，尽量做到第一时间和高频度。对于权威媒体的新闻及相关评论，用户参与量大且活跃度高的论坛、BBS、微博或其他自媒体渠道需要第一时间抓取，且尽量提高信息抓取的频度，以便及时了解互联网舆论的变化趋势。

3.2 大数据处理和舆情热点发现

当从互联网上获取了大量的舆情信息之后，我们需要迅速的从海量的数据中挖掘出热点信息。在这个阶段，我们需要利用大数据应用技术，包括信息检索技术、数据挖掘技术和自然语言识别技术。信息检索技术[2]和数据挖掘技术[3]都是对海量信息进行信息查询、挖掘和处理的技术。它们的区别在于信息检索技术着眼于已知信息的查询，而数据挖掘技术侧重于未知信息的发现。

信息检索技术是通过索引的方式从信息集合中找出所需信息的过程。它一般根据一系列的模型进行索引和查询，如神经网络模型、模糊集合模型、向量空间模型等。通过该技术可以对互联网舆情数据进行索引和归类。比如将数据归类为“时政”、“经济”、“娱乐”、“科技”等类别，也可以将数据根据者、行业、时间等不同的索引和属性进行归类。这些数据的整理和归类是对海量数据初步处理的必要步骤。

数据挖掘技术是从海量数据中通过算法发现并找出隐藏于其中且原先不了解的信息。其常用的方法包括分类、回归分析、聚类、关联规则、特征、变化和偏差分析。这些方法是从数据挖掘的不同角度出发的。比如分类方法是通过分类模型将数据映射到某个给定的类别；回归分析主要面向数据组合和序列的趋势特征，数据间的相关关系；聚类的处理目标是将相似度大的数据放入同一类别中；关联规则是分析数据之间的关联关系；特征重点在于表达某一数据集的总体特点；变化和偏差分析是对分类中的反常样本、无法归类样本进行分析的技术。数据挖掘是在信息检索的基础上对信息的进一步处理。比如新华社新一条关于房地产改革的新闻，被抓取和归类到“经济”类，数据挖掘技术就可以在经济类数据中找出这条从未出现过的新闻。

另外，需要注意的是，舆情分析的对象是人类的语言。从大量的语言中分析出语义、情绪则是舆情分析与传统的数据挖掘不同的地方。所以除了利用信息检索和数据挖掘技术外，舆情分析还需要借助另外一个非常重要的技术：自然语言处理[4]。自然语言处理是人工智能研究领域的一个分支，它是人机之间自然语言的互通。它的难点在于自然语言在各个场景下存在歧义和多义性，汉语尤为明显。在汉语中，词与词之间没有明确的分隔标记，古时就有“句读之不知，惑之不解”的困惑，现代汉语也是如此。比如“南京市长江大桥”就可以理解为“南京市――长江大桥”和“南京――市长――江大桥”2个不同的意思。所以我们需要利用中文分词技术[5]对文字进行处理，即借用计算机给中文语句进行断句、分词。在中文分词领域我国已经有了多年的研究经验，有着基于词典的分词方法、基于概率统计的分词方法等诸多分词方案。一些分词算法的准确度能够达到99%。比如ICTCLAS开源项目[6]，单机分词速率将近1Mbps，分词准确率达到98.45%。

利用信息检索、数据挖掘和自然语言处理技术，海量的、非结构化的舆情数据则能够得到归类、索引，并找出其中重复出现的关键性词语，并最终归纳成事件。那么，我们有理由认为热点事件、热点舆情的属性或模型的着眼点在于关键词。通过一系列标志性的关键词的集合则可以很好地表达、归纳某一事件，并给事件建模。比如，对党的十报告进行分析，文中出现“中国特色社会主义”81次、“改革开放”19次、“科学发展观”15次、“全面建成小康社会”13次，这些关键词及其出现次数组成的向量空间，则是可以映射这一报告或某一热点事件的最简单的模型。我们称之为基于关键词的建模方法。

3.3 信息源定位

当从海量的数据中找出热点信息之后，在对有害信息的扩散进行限制的同时，需要对信息扩散的源头进行定位。不同种类的社交工具和场景下，其信息扩散的模型是不同的。如即时通信工具的信息传播是嵌套式传播，而微博类社交工具的传播模型是嵌套式和叠加式的结合。以微博为例讨论信息源的定位问题。首先，微博博主的属性包括以下几个方面：基本资料、关系网、行为数据、内容和评论。其主的内容、转发、评论是反映其个性、观点、倾向的重要内容。通过分析博主的历史内容，可对某一博主进行基于关键词的个性建模。其次，利用模式识别技术[7]对热点舆情的关键词模型和微博博主关键词模型进行匹配，匹配相似度越高的博主就越接近热点传播的源头或关键节点。

4 小结和探讨

互联网发展到今天，它在信息传播和扩散方面起着传统媒体所不具备的作用效率。它正逐渐成为人们自由表达观点的重要场所，也逐渐成为反映社会舆论的重要渠道。但是UGC内容的多样性、渠道的复杂性使得未经证实和审核的不实新闻、别有用心的假新闻在互联网上随处可见。更有甚者，一些恶意的互联网用户利用互联网媒体、传播、扩散各种有害信息，如、暴力、极端思想、恐怖主义等。在这种现实场景下，我们就更加需要第一时间了解互联网上广泛传播的热点信息，从而屏蔽不良信息和虚假信息，使得互联网真正成为推动社会发展和信息交互的良性工具。

本文探讨了一个利用大数据基础技术和应用技术处理海量互联网舆情数据的场景。其中大数据基础技术用于平台的构建，为计算和存储提供最基本的功能支撑。大数据应用技术，包括网络爬虫技术、信息检索技术、数据挖掘技术、自然语言处理技术，是用于适配互联网舆情这个大数据场景的应用技术。通过信息获取、舆情发现和信息源定位这3个步骤，我们可以从互联网上抓取数据以供分析，可以从数据中找出热点并发现在热点扩散中起到重要作用的用户和节点，为行业主管部门对互联网舆情的管控提供依据和支撑。

对互联网舆情管控的研究目前尚处于初期阶段，行业内已有的舆情管控解决方案解决了有无的问题，但尚未达到高效和强大的程度。我们希望通过总结和研究为从业者提供一定的启发：在信息获取阶段能够非常全面及时地找到待分析数据；在舆情发现阶段能够准确迅速地从海量数据中找出正在扩散和传播的热点信息；在信息源定位阶段能够找到关键的扩散节点，从而对互联网舆情实现有效的监测和管理。

参考文献：

[1] 周立柱，林玲. 聚焦爬虫技术研究综述[J]. 计算机应用， 2005（9）： 1965-1969.

[2] David A， Grossman， Ophir Frieder. 信息检索：算法与启发式方法[M]. 张华平，李恒训，刘治华，译. 北京：人民邮电出版社， 2010.

[3] Mehmed Kantardzic. Data Mining： Concepts， Models， Methods and Algorithms[M]. John Wiley & Sons， 2002.

[4] James Allen. 自然语言理解[M]. 刘群，译. 北京：电子工业出版社， 2005.

[5] 奉国和，郑伟. 国内中文自动分词技术研究综述[J]. 图书情报工作， 2011（2）： 41-45.

[6] 中国科学院计算技术研究所. ICTCLAS汉语分词系统[EB/OL]. （2014-06-22）. http：///.

[7] Richard O.Duda， Peter E.Hart， David G.Stork. 模式识别[M]. Wiley Press， 2001.

作者简介

大数据互联网论文例2

中图分类号：F832.2 文献标识码：A 文章编号：1001-828X（2014）09-00-02

2004年美国《连线》杂志主编克里斯・安德森（Chris Andersen）首次提出长尾（The Long Tail）这一概念之后，在互联网时代长尾理论受到越来越多的关注。在互联网技术持续快速发展、经济社会正朝大数据时代过渡、移动终端持续扩张的前提下，安德森（2012）同时指出了“长尾理论”与互联网经济的依赖关系，并相信“长尾理论”将指引互联网经济的发展方向并能创造出巨大的盈利空间。另一方面，随着互联网技术的进一步成熟，线上财富潜力的进一步挖掘，众多互联网企业开始进军金融业，同时传统金融业也紧随时代脚步开始了互联网金融的征程，互联网金融成为最近一段时间在金融界出现频率最多的词汇之一。

然而，“长尾理论”究竟核心在哪里，互联网金融参与者们又应该从哪些方面尝试实践？本文将结合“长尾理论”的内涵及其与互联网金融的关联尝试提出部分实践建议。

一、长尾理论的内涵

根据克里斯・安德森在其著作《长尾理论》（2012）中对“长尾理论”进行的定义，其可以简单概括为“我们的文化和经济中心正在加速转移，从需求曲线头部的少数大热门（主流产品和市场）转向需求曲线尾部的大量利基产品和市场”。

“长尾”实际上是对统计学中幂律和帕累托分布特征的一种口语化表达。在正态分布中，曲线的头部代表着重要的人或事（这往往是之前人们关注的重点），而曲线的尾部，则是需要花费更多精力与成本才能关注到的大数量的人或者事。在之前的黄金“二八理论”中（帕累托，1897），20%的重要部分会造成80%的重大影响，可以理解为20%的热门产品会创造80%的收入。而在“长尾”经济理论中，利润将被一分为三。2%的大热门产品、8%的次热门产品以及剩下90%的长尾产品会创造出相等的，也就是33%的利润。克里斯・安德森通过运用大量的数据统计，证明了大热门产品实际上与冷门产品拥有相同的利润创造能力。这也就意味着关注“长尾产品”与继续争夺热门产品是可以达到相同的现实意义。

二、互联网金融

虽然目前互联网金融正处在蓬勃发展期，但各界对于互联网金融的定义是众说纷纭。根据辛琪等人论述，各界对于互联网金融的理解可以粗略的概括为四个方面：一是认为互联网金融是利用网络手段达到去中介化、去中心化金融业态；二是强调互联网金融的行为主体是互联网企业，也就是互联网企业领导的金融；三是从技术层面出发，认为利用了互联网技术的金融就是互联网金融；四是认为互联网精神或者互联网技术与金融业融合并实现金融创新为互联网金融。进而，辛琪等人对于互联网金融的进行了定义：以互联网经济为基础、互联网为信用平台开展金融活动的金融业态就是互联网金融。

目前业界对于在互联网上进行金融活动的这个概念存在分歧。有些人将其一分为二：互联网金融以及金融互联网。根据辛琪等人的论述，这两者是统一的。但马云认为“未来金融有两大机会，一个是金融互联网，金融行业走向互联网；第二个是互联网金融，纯粹的外行领导。”也就是说他将其严格划分为了两个概念。但是这种划分排斥了二者融合的可能性，在现实意义上作用有限。

三、“长尾理论”对于互联网金融发展的实践启示

不难看出，长尾理论是基于互联网技术带来的信息成本下降；另一方面，互联网经济的蓬勃发展正是长尾理论的实际体现。对于互联网金融而言，“长尾理论”会带给互联网金融企业怎样的启示呢？结合我国商业银行实际提出三点建议：

首先要实现扩大数量，降低门槛，加强客户与产品的对接的“长尾”优势，平台的建设将会是重中之重。在“长尾理论”中，“个性化”是盈利的核心，从而产品的设置可以更大程度上放回客户自身，让客户自己来为自己定制产品，选择服务，甚至自己为自己提高用户体验。而这些的实现都要建立在一个强大的平台基础之上。

硅谷投资教父约翰・杜尔（2011）提出“SOLOMO”概念：“SOLOMO”实际上是三个词的组合“Social（社交），Local（本地化），Mobile（移动化）”。目前，商业银行的手机银行已经实现了较出色的用户体验，较完备的功能设置，较突出的实用价值，是一个非常先进且潜力极大的用户平台。移动终端APP的设置实现了移动化的金融运用，定位功能及周围网点功能也在向本地化靠拢。但是，在此基础上如果加入Social的元素将会极大的提高用户体验和用户粘性，甚至会创造出巨大的其他财富空间。目前的运用当中，商业银行手机银行交流部分是以客服为主，以通知式的活动宣传为主。例如，在平台中设置游戏币或者积分，实现整个商业银行电子银行营销奖励的规范化，然后通过这种类型的积分或者游戏币给用户更多的空间去发挥使用，同时通过平台内社交规则来激励用户，从而使用户产生对平台的粘性。并且在用户粘性产生的同时也就实现了推广和营销。

另外，本地化也是该平台最为重要的一个方面。对现实没有意义的社交可能并不会引起大部分用户的注意，从而会使平台变成“白送”的一种网络游戏。本地化的加入不仅会让用户体会到实实在在的“价值”，更多的，对银行来说也会是衍生产品的扩张。例如，平台中可以签约大量的本地商户，商户打折或者其他类型的商户活动都会以游戏或者论坛帖子的形式出现在平台上，这样pos收单、信用卡业务也会随之得到扩张。更进一步，平台建设甚至可以通过收购或者邀请加盟的方式扩大功能窗口，从而实现一站式的金融加生活服务。例如，和携程或者去哪儿合作，可以开拓更加全面的旅行金融服务。当然这样的一个平台的建立并不能单纯依赖金融产品方面的考虑，更多的可能是需要技术上、人才上乃至机制上的支持。

其次如何才能有效地降低信息处理成本将会是互联网金融参与者的首要课题。长尾效益的实现是要将大量的“长尾”进行划分、整合从而实现产品的在长尾市场上的蔓延，在小市场收获大利润。从而，这样的整合过程中的成本将会是决定成败的关键。徐子沛（2013）的《大数据》给了我们很好的答案。正在到来的数据革命、扁平化社会、互联网时代，正在将“开放，平等，协作，分享”的互联网精神传递给社会的各个方面。据《大数据》所述，大数据时代是历史的必然趋势，新一轮的竞争必然是围绕大数据进行。进而，步步为营的大数据基础建设可能会为企业在下一轮竞争中奠定更扎实的基础。

大数据的基础必然是数据获取与处理的技术机制。但是，对于技术系统的改革在短期内效果应该并不是很明显，并且在技术上的变革转型及被接受相对较快。然而要在管理机制以及文化方面做好对大数据准备将会是相对长的一个过程，而在这个转型的过程中先行企业则会赚取这个相对的时间差中所带来的利益。一个方面，就目的而言，商业银行可以考虑设立独立的互联网金融部门，专门负责互联网数据以及互联网产品相关事宜，并且采用平行的管理模式，自主人事权，更多地考虑借鉴互联网企业的管理模式，以激发员工的创新意识和数据运用。另一个方面，整个企业文化中需要更多的加入大数据要素，以“是否有数据佐证”为重要决策依据，并且为一线员工提供更多的数据信息，在整个企业中形成对数据的尊敬语重视。然而，在此同时，在这个过程中数据信息安全以及对客户隐私的保护也应该得到制度化的控制。同时，大数据要求更深层次的数据挖掘，所以相关人才的吸纳以及培养也应该尽早列上日程。但只要建立起了相关部门以及文化基础，相信相关人才力量的支持也会水到渠成。目前，有部分商业银行对于数据的获取及分析工作已经是走在行业前沿，然而对于大数据的价值运用还可以有更大的发挥空间。其中一个部分就是本文的下一个观点：基于数据基础上的“定制化”特色产品。

最后打造更多“个性差异化”产品。“长尾理论”有效的前提是满足个性化需求的产品可以通过互联网等新技术与新方法将渠道成本趋近于零。这个前提一个方面决定了产品数字化是“长尾理论”是否有效的关键：同时也说明了“长尾”产品最重要的一个特质就是“个性差异化”。目前对于定制化产品不少商业银行已经都有相关的定制产品，如招商银行的金葵花贵宾卡、广发银行生意人卡、平安银行的贷贷平安卡、光大银行乐惠金卡等特色卡种实现了不同人群的定制服务。然而随着互联网精神的深化，单纯的卡种绑定服务的定制并不能完全满足所有客户的个性化要求。这样，客户可以清楚地看到某一项服务所需要的要求，从而根据自己的生活习惯及喜好选择其中的某几项服务，从而形成各式各样的新型产品。例如，我们可以将商业银行白金卡卡的各大优惠单列出来，每一项都设立固定的达标要求及管理费标准，客户可以自己在网页上打勾，并且有些部分客户不想要的可以按照金卡甚至普卡的标准进行配套，从而形成各式各样的符合客户想法的新卡种。同时再赋予每一项服务以分值，按分值来划分卡种档次，从而形成卡种的大数据。这种大数据就为进一步细分市场打下了良好的基础，在同一档次的卡种中又可因为偏好或者生活及经济环境不同再次进行划分，这样就为更深层次更个性化的产品开发提供了更多数据支持。

大数据互联网论文例3

大背景下的中国互联网

互联网一直与中国传统经济的发展息息相关，不论是在国家政策层面上还是产业发展上，互联网都是经济链条上的重要一环。中国信息经济学会理事长杨培芳在第十届中国互联网经济论坛主论坛的致辞中说：“党的十报告指出推进信息化工业化融合，促进工业化，信息化，城镇化，农业现代化的同步发展。这是每一个ICT从业者的机遇，也是中国互联网未来发展的重要契机。”他认为农业生产力是适应了一种小农分散化的生产方式，工业时代的生产力是适应了大机器集中化的生产方式，信息生产力更适应网络化的协同生产方式。未来中国的互联网经济不再追求大而全，而是转向“小而美”。他还将信息称为“第三只手”，“前沿理论已经发现，除了市场竞争和政府干预这两只手之外，信息网络正在发挥第三只手的力量”，互联网体现了“新的信息哲学，将为未来指引方向。”

对于互联网经济的发展现状，中国电子商务协会会长宋玲引用数据说，截止今年三季度我国互联网用户达5.5亿人，同比增长44.1%，总规模达5万亿人民币，同比增长13.7%。广大网民可以通过互联网获得各种便利的服务，互联网产业也成为国家扩大内需、提振经济的重要引擎。她还特别谈到了移动互联网的发展，她认为随着国家3G网络的建成和成功运营，移动互联网获得巨大的发展空间和发展机遇，传统互联网企业、创业者和风险投资都在关注这一新兴的市场。现在人们上下班的路上，工作的间隙，很多人都手持智能手机、平板电脑等移动终端在上网。用户对于移动互联网的使用习惯已经养成，这对于企业来说就是机遇。现在包括传统电子商务企业甚至电信运营商都在布局移动电子商务，还有手机阅读、手机视频等移动互联网应用都在开花结果，移动广告也随之跟进，移动互联网产业日渐成熟。

中国社会科学院信息化研究中心秘书长，互联网周刊主编姜奇平则从产业发展大势的角度，对2012年的中国互联网进行了高度概括，他认为互联网作为一个行业，正在和我们经济主战场和经济主流进一步融合，这会成为下一步发展的巨大趋势。随着国家扩大内需的战略实施，电子商务的重要性会更加显现出来。未来电子商务必然从B2C的模式向C2B转变。同时互联网的发展还将与城镇化进程紧密结合，中国的城镇化建设如火如荼，随之而来的还有各地政府对智慧城市建设的重视。利用信息化的手段提升城市的运作效率和环保程度。这对于很多互联网企业是很大的机会，未来十年将是互联网大爆发的时代。

新华网总裁田舒斌则从文化建设的角度阐释了互联网的意义，他说：“新华网作为网络媒体的一员，我们经常思考一些问题，比如说网络媒体能否跟上网络技术迅猛发展的潮流，加强新业务和新信息的衔接，支撑和推进网络文化产品的创新生产？比如说网络媒体能否不断提高网络文化产品的供给能力，提升网络文化产品的品质，打造网络文化产品的品牌，引领网络文化的健康发展？网络能否适应网民参与文化建设的需求，还有在以微博为代表的自媒体井喷式发展，深刻搅动既有传播格局的这样的一种态势下，网络媒体能否主动的出击，因势利导，打造两个舆论场，抢占舆论制高点？”而他的答案是，近两三年，作为一个互联网文化企业和综合性网站的新华网已经呈现在网民的面前。在网络文化的大发展，大繁荣的时代前沿之下，新华网的发展，既要有自己的文化价值观的坚守，同时也要加快系统性转型和希望创新，努力实现世界一流的网络媒体和具有较强创新能力和市场竞争力的互联网文化企业的发展目标和愿景。如今新华网正在进行四个转型：从门户网站向综合性互联网信息平台转型；从WEP1.0向2.0，乃至3.0转型；从单一的网络经营业态向多远的网络业态转型；从行政化的市场管理向现代化的市场管理转型。

特定视角下的互联网经济

具体来说，中国互联网经济正在经历哪些转变？IBM开发中心首席技术官，创新工程院院长毛新生以“大数据与互联网”为主题发表演讲，他认为移动化的趋势必然带来数据的爆炸式增长，人们需要应对大数据带来的挑战，同时抓住大数据蕴含的机遇。他说：“大数据带来了很多的可能性，因为我们变成了全知全能的上帝一样，我知道所有发生的事情和已经发生过的事情。我有办法了解过去，甚至是预测和洞察未来。每一家企业都非常希望，对自己的竞争对手，对客户、对合作伙伴，对市场，对各种各样的事情，不管是风险还是机遇比别人更早一点，更多一点去了解。而大数据可以实现这一点，这是非常诱人的一件事。”IBM利用大数据的挖掘和分析机会，从金融证券等特定的行业人手，为客户提供更具洞察性的分析结果，实现了大数据业务的落地。

微软大中华区副总裁谢恩伟则从微软发展的角度阐述了他们眼中的互联网。他谈到了微软当面的主要任务：怎样从一个软件操作系统公司延伸到终端设备，怎样以软件和硬件为核心，更多地支撑硬件的体验和互联网服务的体验。他认为在整个IT行业出现了一种趋势，即IT消费化，越来越多的移动终端开始进入办公领域，终端的功能进一步融合。顺应这一趋势，微软推出了兼具办公和娱乐功能的平板电脑Surface，并将这样的融合理念应用到Windows 8的研发之中。

大数据互联网论文例4

一、前言

我国人们生活水平的提高使其对社会生产要素的需求发生了改变，越来越多的人在生活中依靠互联网。无论是出门旅游还是日常生活，都呈现出了互联网对人们消费上的影响。如今，越来越多的电商出现，也出现了很多的第三方支付平台，互联网成为人们生活不可获缺的组成部分。阿里巴巴集团所提出的购物策略，利用网络的便捷，在2016年11月11日，天猫的销售额达到了1207亿元，双11再次创下恐怖的新纪录。马云曾预言，“无边无界的互联网，将引爆未来天翻地覆的30年”；用互联网预言家凯文.凯利的话说：“互联网时代，一切的生意都是数据的生意”，这一切说明，“互联网+”时代已经降临在我们的身边。管理会计是企业管理工作中的重要组成部分，能够为企业的决策提供真实的建议和数据，使领导者做出更为准确的决策判断。在“互联网+”的时代，企业需要对管理会计工作进行改善，从而使管理会计的工作能够符合企业发展的需求。

二、“互联网+”时代下管理会计的兴起

当今社会，越来越多的企业都已经呈现出低增长率和低利润的态势，而在“互联网+”时代到来之际，企业的管理需要转向精细化管理的方向，利用云计算才能够使自身的企业得以创新。“互联网+”，指的是新的经济状态下下，人们利用互联网的信息集成特点来为生产要素进行重新配置的过程。企业利用“互联网+”来实现生产要素价值的最大化，使自身的思维更加优化。正是利用“互联网+”的基数，企业才能够使自身的信息和技术更加畅通，从而在市场竞争中拥有更多的创新思想。

“互联网+”时代下的管理会计的内涵将进一步丰富，对精细管理提出了更高要求，通过对财务会计所提供的数据进行企业前景的分析，加速了财务与业务的深度融合，推动数据管理进一步完善，对企业内部日常发生的情况进行总结，以报告的形式将资料进行汇总，最终传达给领导者，促使领导者根据企业的实际情况进行发展决策，以此来提升企业的经济效益。

在“互联网+”时代背景下，云计算、大数据等技术的在管理会计当中的应用，出现了更多新的管理工具与业务模式，使得企业财务呈现出了一体化的业务模式。2015年7月20日，我国的中国财会高峰论坛暨会计报年会在北京召开，会议的主要内容是讨论在“互联网+”的时代企业如何对管理会计进行创新，促使企业内部的会计向着国际化的方向发展。在“互联网+”的运作之下，管理会计的模式和理念都将转变，并且向着财务信息共享以及云采购等形式转变。随着企业内部以及企业与外界环境的沟通与联系，企业的精细管理将发展到与其它企业之间的联系当中，从而使企业的数据与互联网数据联系在一起，使管理会计的意义呈现出最大的价值。

三、“互联网+”时代管理会计的挑战

1.重新规范会计信息

随着社会逐渐步入“互联网+”时代，信息技术也得到了快速发展，市场上出现的各种数据变得更为复杂，这使得财务人员在处理财务时将会变得更加困难。因此，企业要想实现高效运转，就需要利用“互联网+”时代中先进的科学技术。如今，管理会计的信息已经在“互联网+”的影响下变得更加多变和复杂。企业要想获得最先进和及时的信息，就需要对管理会计信息提出高要求，如此，管理会计所提供的会计信息才能够辅助企业的管理，帮助其降低成本，从而实现企业利益的最大化。

2.财务人员素质普遍偏低

管理会计在发展过程中所遇到的另一挑战是财务人员素质问题。当前，我国企业中财务人员所具备的素质整体呈现偏低的情况，无法满足“互联网+”时代对于管理工作的需求。当今越来越多的企业对于管理会计的数据载体提出了新的要求，需要财务人员学会运用互联网软件来进行会计数据的修改和保存。而财务人员虽然经过了专业知识的系统性学习，但却对“互联网+”时代所使用的财务共享中心模式、云空间、云制造、精细管理等工具和方法认识不够，对于电算化的操作系统也不够熟练。

3.理论与实践之间的脱节

当管理会计这一理念出现在我国时，其不仅受到了很多学者和财务工作人员的认可，还受到了企业的支持并将其应用在企业的运营当中。与此同时，很多研究人员并对其进行了大量的分析和研究，形成了具有我国企业特色的理论体系。然而，由于管理会计在发展过程中同我国企业内部环境和市场环境有着一定的联系，其在“互联网+”时代这一背景下，云计算、大数据等互联网广泛应用，管理会计借助互联网工具，带来了包括服务模式、信息集成、数据整理等全方位的优化升级。企业不仅没有对上述新工具、新方法进行深入的分析，还没有了解在这个时代中企业和市场的真正需求，只是在理论上不断完善管理会计方法和体系，从而导致管理会计在发展中出现理论和实践相脱节的情况。因此，理论和实践的脱节是管理会计在“互联网+”时代所遇到的重大挑战。

4.管理理论体系的缺乏

自从2008年全球爆发了经济危机以后，我国企业经济的增长速度变得十分缓慢，甚至有些企业的经济已经面临停滞的情况。正因如此，企业开始寻求新的发展道路，这便使企业产生想要从管理上促进企业的发展，而在管理上的要求则主要来自于管理会计，希望能够借助管理会计实现转型。然而，从目前我国在这方面研究情况来看，其还主要是着重于财会相关方法和理论的研究，没有根据“互联网+”时代的特点对管理会计进行研究，这在一定程度上造成我国管理会计的理论和体系相对较为落后，只能够通过借鉴国外发达国家先进的管理理念和管理体系，没有根据我国企业的具体特点进行对管理会计进行进一步的深化。随着云计算、大数据在社会当中的进一步普及，管理会计所面临的挑战也将会越来越大，我国相关工作人员应当根据“互联网+”时代的特点，对管理会计进行深入的分析和研究，以便能够形成适合我国企业发展且较为完善的管理会计体系。

四、 “互联网+”时代管理会计的机遇

1.会计电算化程度的提高，推动数据管理常态化

相比较于管理会计所遇到的挑战，其也获得了更多的发展机遇。该时代促使企业要在财务信息管理中不断引入大数据思维，以便解决企业在运营中所出现的极为复杂和庞大的财务数据。同时，企业还应当根据自身在该时代的发展情况构建相应的财务系统，使财务人员在处理当前企业财务信息时，能够同以往的财务信息相结合，以识别各类风险指标，财务人员通过对这些风险指标进行分析，来发现企业运营中可能出现的财务风险。此外，在“互联网+”时代中对于企业最基本的要求就是要具有较高程度的会计电算化，借助云数据处理平台，集聚企业内部的“小数据”与互联网“大数据”，对数据进行足够精细化的管理与整合，从而提高企业财务信息的处理效率。

2.更新思维方式，学习新工具，对财务人员素质进行全方位提高

“互联网+”时代下管理会计所遇到的另一发展机遇便是财务人员素质的提高。企业为了在该时代下能够获得良好的发展，首先就要提高财务人员素质以满足时代的需求，更新思维方式，不断学习网络会计、在线财务服务、云会计、云审计等新工具、新方法，进而促进管理会计的发展。同时，企业还应当聘请掌握最新“互联网+”管理会计工具的财务专家对企业财务人员进行培训，使其了解“互联网+”时代的相关理念和该时代下管理会计发展对企业内部的具体运用，夯实技术基础，提高服务质量，让财务人员充分认识到财务数据处理的重要性，使财务人员在对这些数据进行处理，具有较高效率与针对性，使其能够满足“互联网+”时代下的数据处理需求。

3.促使管理会计实践和理论之间的结合，大力推进管理会计体系建设

“互联网+”时代促使管理会计实践和理论之间的结合，使管理会计会计获得更加广阔的发展空间。在对两者进行研究时，应当在理论方面应投入更大的研究力度，但却要摒弃以往的拿来主义，应当由相关研究人员自身进行研究，同时结合我国当前所处的时代和环境的变化，对管理会计的相关理论进行分析和研究，以构建符合“互联网+”时展的管理会计体系。在企业运营过程中应当加强管理会计的应用，大力推进管理会计体系建设，观察其应用的具体效果，并根据“互联网+”时代下经济发展的重要趋势进行相应的改进，以便使管理会计能够适应多样化的经济环境。此外，在理论和实践结合过程中，应当以实践为研究中心，不断去完善管理会计的相关理论知识，从而使两者能够完美的契合在一起，以满足“互联网+”时代对管理会计的需求。

4.优化信息管理，提高企业决策和预算的合理性

在“互联网+”时代下，企业能够利用大数据技术来实现在不同平台上进行信息联合。企业管理者能够从不同的角度对不同的信息进行整合，然后再对其进行比较与分析，同时企业还能够从信息系统当中获取自身以外的数据信息，然后经过相关软件的筛选和整合最后形成一份能够包含企业内外各部分相关信息的分析报告。此时，管理会计会根据最终所生成的数据信息，对企业内部的实际数和预算数进行比较，然后编制成所需要的预算执行报告。管理者通过该执行报告，能够在做相关决策时更加合理，有利于企业的发展。如今，我国已经进入“互联网+”时代，企业管理也逐渐在向信息化和网络化的方向转变。这种对于在信息管理上所进行的优化，是“互联网+”时代管理会计一个新的发展机遇。企业利用管理会计对信息进行管理，能够充分体现和发挥出其所具有的时效性，使企业在做相关决策上变得更加的准确与合理，从而提高企业在经营过程中各项决策的成功率，促使企业能够在“互联网+”时代下获得更好的发展。

五、结论

总而言之，在“互联网+”时代到来之际，企业应该转变自身的管理会计制度，充分利用互联网的便利之处，以大数据的思维方式来实现管理会计的进步。“互联网+”的背景下，企业需要在技术以及管理理念等方面进行创新，如此，才能够使企业的决策更加合理，在管理会计的配合下，企业才能够制定出正确的战略发展决策，增加自身的核心竞争力，保持稳定发展的态势。

参考文献：

[1]于淇，王迪.大数据时代企业管理会计面临的挑战与解决对策[J].中国高新技术企业，2016，10（12）：167-168.

[2]王智博.是“寒冬”还是“暖春”――“互联网+”时代传统会计面临的挑战与机遇[J].商业经济，2016，07（05）：83-84-134.

[3]郑奇茹.“互联网+”时代高校档案数据管理面临的机遇与挑战[J].城建档案，2016，09（07）：70-71.

大数据互联网论文例5

网络数字音视频需求的增长，在催生出大量视频网站的同时，也对网络传输环境提出新的要求。尽管目前有CDN和P2P等技术解决方案，但服务器端的建设成本、大量无功流量对网络带宽的占用，以及网络数字音视频的服务品质等问题，仍制约着产业发展。本文通过对中国工程院李幼平院士提出的广播网络和互联网络相互融合的“播存结构”理论的理解，结合近年在IP数据广播技术和业务领域的实践，构思了广播网络和互联网络相互融合的数字媒体网络基本架构。希望藉此文抛砖引玉，引发有关专家和业界同仁的关注和研讨。

基本架构篇

借用清华大学宽带网络实验室戴琼海主任及程鹏博士在国家广电总局《下一代通信技术和计算机技术对广播电视发展的影响》项目调研报告中提出的“数字媒体网络”概念，本文对所研究的“数字媒体网络”定义为：“有线电视广播网络与互联网络相融合的，以IP技术为基本框架的，以媒体服务为主要承载业务的网络。”

选择IP技术为数字媒体网络基本框架，主要是考虑目前IP技术在广播网络和互联网络两种异构网络应用均非常成熟，在数字电视传输标准DVB数据传输协议中，对lP数据传输有明确规定。

数字媒体网络理论基础

经过多年对互联网与广播网络信息服务的研究，李幼平院士指出：互联网已演化成幂律分布／随机分布同时并存的网络。一方面，少数网站集中了大量的用户访问量，而且随着互联网“传媒化”的发展，这种现象将越发显现；另一方面，Web2.0带动草根文化的风行，仍反映了互联网文化的多元化特征。图1为对某网络端口某一时刻用户通过P2P下载视频文件的行为统计分析。

互联网上述信息服务特点，需要构建一种更合理的新型网络传输体系，以适应网络信息服务，特别是网络媒体服务需求的发展。李幼平院士创造性地提出，通过广播技术与存储技术相结合的“播存结构”，构建一个互联网的覆盖网(Overlay)，全面提升网络媒体服务品质。以“播存结构”为核心的网络融合技术体系的实现方式是：互联网络在保留TCP/IP为主结构的基础上，增添“广播传输和分布存储”的“播存结构”做为次级结构，通过主结构实现个性化的交互服务，通过次级结构实现共享信息内容的分发服务，通过用户端透明计算实现业务汇聚，用户无需了解内容从何种网络提供。

上述网络结构体系，也被李幼平院士称为“双结构互联网络”，奠定了数字媒体网络的理论基础。

数字媒体网络基本架构

1　数字媒体网络的技术核心

数字媒体网络将以IP技术为基本框架，实现有线电视广播网络与互联网络两种异构网络在传输层的融合，应用具有内容计算的“广播传输+分布存储”的“播存结构”理论，实现有线电视广播网络与互联网络融合所形成的双结构网络在应用层的汇聚。

2　数字媒体网络的层次化体系结构

数字媒体网络自上而下由应用层、传输层、网络层和物理层四层结构构成，如图2所示。

3　数字媒体网络的协议体系

IP技术为基本框架，通过以TCP/IP为主要传输协议标准的互联网络，与以UDP为主要传输协议标准的有线数字电视广播网络的相互融合。形成数字媒体网络协议体系，如图3和表1所示。

4　数字媒体网络的网络拓扑结构

如图4所示，数字媒体网络为广播网络和互联网络两个互为重叠的网络结构。

数据传输协议

在上述数字媒体网络协议体系中，多种协议标准及技术在互联网络中已得到广泛使用，在这里不复赘述。本文只对在协议体系中所涉及的数字电视DVB标准中的数据传输协议做简要介绍。

目前，在我国数字电视采用的DVB标准中，定义了六种基于MPEG-2 TS流的数据传输协议，分别为数据管道(Data Piping)、数据流(Data Streaming)、多协议封装(Mutiprotoeol Encapsulation)、数据轮播(Data Carousels)、对象轮播(ObjectCarousels)以及用户定义服务。

考虑到多协议封装协议对IP数据传输的支持，具有很好的通用性和可扩展性，因此在本文所论述的数字媒体网络中，广播网络选择采用多协议封装的IP数据传输技术。

关键技术篇

关键技术一：IP数据广播播发控制技术

IP数据广播播发控制技术主要提供数字媒体网络广播传输通道带宽分配、内容播发时间、服务优先级控制和管理，这里主要体现为差分并播技术机制。应用64QAM调制方式，有线电视广播网8MHz模拟带宽，数据传输速率可达到38Mbps，差分并播技术将用于解决高优先级的数据内容在广播网络的及时传输(Qos)和广播带宽的有效利用的问题。差分并播技术原理如图5所示：

在数字媒体双网络传输体系中，根据信息传输的路由选择策略，共性信息内容(如广播信息)一般通过广播网络传输通道进行传输。为保证广播网络传输带宽的有效利用，在优先级别高的业务结束后，其所占用的带宽应及时释放，供优先级别低的业务使用。图5将四种优先级别的播发业务对广播带宽的占用情况做简单示意：在广播通道信息传输开始阶段(t=0)，广播网络传输通道正在播发“立即播发”级别的几路视频直播流，其余带宽用于传输“尽快播发”级别的业务(一般为传输共享IP数据包)当一路视频直播播发结束时(t=TO)，系统将其占用带宽释放，而优先级别低的“尽快播发”的业务马上填充所释放的带宽；当优先级别最高的“紧急播发”的业务需求提交时(t=T1)，系统将立即响应，分配所需传输带宽，正在传输的“立即播发”级别的业务所占带宽不受影响，而优先级别低的“尽快播发”的业务所占带宽将被压缩；当前三个优先级别业务传输带宽需求小于广播网络传输通道总体带宽时(这里为38Mbps)(t=T2)，剩余带宽将由优先级别最低的“争取播发”业务所填充。

关键技术二：IP数据包传输路由选择技术

IP数据包传输路由选择技术关键在于共享IP数据包的确定。并将其通过广播网络快捷地分发到用户端，用户对两个传输通道接收的数据包进行组包。通过这种方式，热度越高的内容，用户获取的速度越快。整体的服务品质得以提升。

共享IP数据包主要通过以下三种策略形成：

首先是用户需求动态捕捉策略。通过互联网络响应用户的下载需求，同时对用户行为进行动态分析统计，根据信息内容需求热度，形成共享lP数据包，通过广播网络进行播发；

其次是信息内容订阅策略。通过对用户的服务内容预订信息进行统计，形成信息内容热度排行，确定共享IP数据包，通过广播网络进行播发；

第三是用户需求预判策略(也可称为Cache方式)。根据用户消费习惯，对用户需求进行预判，事先将热度较高的内容，按一定比例(如80％)通过广播网络播发、预存在用户端，将热度次之的内容，也按一定比例(如60％)通过广播网络播发、预存在用户端。依此类推，通过在用户端对内容的预存，减少用户需求的响应时间，提高服务品质。

关键技术三：内容计算一语义标引(UCL)

根据本文对数字媒体网络定义，数字媒体网络应是以媒体服务为主要承载业务的网络。因此，有关信息内容的标引(定位)就显得十分重要。

受香农(Shannon)信息理论忽略语义的影响，在通信工程中缺失语义管理，只注重端对端的连接，不关心通信中传送的是什么内容。针对上述问题，李幼平院士在“播存结构”理论中提出了一个创新的概念：语义标引(或语义地址)，也称为统一内容定位(Uniform Content Loca60n，UCL)，并就应用UCL对传输的信息内容进行标识，提出在IP报头的任选(Option)段，嵌入UCL代码。使得IP数据包带有了内容的语义标引，这种ID数据包称为BIP分组，由此形成的传输规则称为BIP标准。数字媒体网络用户接收端通过对BIP分组自动进行识别，可从网络传输的大量的IP数据包中，将符合要求的IP数据包过滤出来，收存在本地。

如果说“广播+存储”带来了广播网络信息服务由“瞬态”到“常在”的变化，那么“语义标引”概念的提出，则带来广播网络与互联网络双网络传输环境内容的识别与重组，实现了广播网络与互联网络在存储节点(Buffer)的融合。同时，改变网络信息内容的无序状态，使用户可以从海量的信息中，准确地找到自己所需的内容，保证了网络所信息的准确性、权威性，实现了对网络公共信息的控制监管，这将是网络走向“新媒体”的必由之路。

应用篇

基于“播存结构”理论构建的广播网络与互联网络相融合的数字媒体网络具有如下四个特点。

特点一：帮助互联网络克服带宽瓶颈、提升服务品质

随着互联网应用，特别是互联网音视频应用的不断发展，对互联网传统的传输体系带来了新的挑战。有调查显示。互联网很可能会因承受不住大量数字媒体对带宽的拥塞而崩溃，

同时，目前互联网应用所呈现的需求趋同特征，为数字媒体网络提供了“英雄用武之地”。通过将大量共享信息从互联网中剥离出来，通过广播网络一次传播给所有的需求用户(而不是为每个用户都单独发送一遍)，这将大大缓解目前互联网面临的带宽危机，提供网络服务品质。

特点二：提升广播网络在信息传播领域的价值

数字媒体网络构架充分发挥了广播网络的传输优势，而这种优势过去一直被业界所低估和忽视。通过“播存结构”理论的引入，使广播网络信息服务由“瞬态”改变为“常在”，实现了用户互动。而与互联网络的融合，又满足了用户个性化的需求。

广播网络运营商可利用广播网络所特有的低成本传播特性，建立有别于其他网络运营商的、差异化数据业务经营模式，为数据增值业务的开展，开辟新的发展空间。

特点三：语义标引实现了公共服务信息的规范管理

语义标引UCL技术数字媒体网络传输内容增加了定位标识，实现对传输信息有效的识别和过滤，保证了信息内容传输的安全性，也有助于政府对公共信息的可靠监管。

大数据互联网论文例6

一、前言

互联网技术及其应用在中国已经迅速普及。截至2015年6月，我国网民规模达6.68亿，互联网普及率为48.8%。我国网站总数为335万个，年增长4.6%，互联网产业发展的微观主体是互联网企业，众多互联网企业不但深刻改变了中国经济生态和居民生活，其彼此之间的相互影响对于互联网产业的发展演化，特别是企业之间的竞争性具有重要影响。然而，由于互联网产业是一个较为特殊的新兴产业，传统产业组织理论不适合被用于解释互联网产业的发展规律和企业之间的相互影响。

本文通过组织生态学视角，运用组织生态学中较为成熟的理论――密度依赖理论、生态位理论等，来研究中国互联网产业发展演化过程。通过研究互联网企业数量的变化来探究组织之间竞争性、产业合法性和移动互联网技术的重大变革对于互联网产业的影响，这有助于我们发现和理解互联网产业的演化规律。由于互联网企业数量的变化并没有权威数据可查，互联网网站又是主流互联网企业的主要经营平台，因此本文选用互联网网站数量作为企业数量的替代变量。

二、相关理论

组织生态学是基于生态学的隐喻的方法，借鉴生物学、生态学、社会学等学科的知识，结合新制度经济学和产业经济学等学科的理论来研究组织个体的发展和组织之间、组织与环境之间的相互关系。本文主要应用了组织生态学中比较成熟的密度依赖理论和生态位理论。

1. 密度依赖理论。对于产业组织来说，组织密度指的是一个产业内部企业的拥挤程度，组织生态学认为它主要由企业的数量所决定。组织密度会影响到一个产业组织的竞争性和合法性。竞争性弱代表企业数量较少，因此企业容易生存发展，死亡率较低，新企业进入也容易；竞争性强，则企业之间为了争夺生存发展所需要的资源就会采取各种竞争行为，导致实力弱的企业容易死亡，新企业进入该产业也会比较困难，从而使得总体企业数量增长缓慢甚至下降。合法性是指一个产业提供的产品和服务被潜在消费者和社会大众接受的程度。由于社会中信息的传播、社会大众改变固有认识和习惯都是个渐进的过程，消费者认识和认可新产品、新服务需要时间。因此，在产业形成、发展的初期，产业组织的合法性比较低。此时新产业尚未获广泛认可，企业的生存和发展就会比较困难，导致新进入企业较少。随着组织密度的增加，更多的企业从事新兴产业产品和服务的推广与销售，组织的合法性得以强化，市场也逐渐扩大。

密度依赖理论认为产业内企业数量的变化是竞争性和合法性共同起作用的结果。在产业建立初期，企业数量很少，组织密度很低，此时企业之间的竞争性弱，但同时合法性也弱。此时，合法性起到主要作用，企业生存比较困难，死亡率高。随着新进入企业的增加，产业的组织密度提高，合法性也随之提高。合法性的提高改善了企业的生存环境，企业的死亡率降低，利润率提高，吸引更多新企业进入，使得组织密度进一步提高，新兴产业由此进入快速发展阶段。但是随着组织密度的不断提高，一方面组织合法性的提高潜力逐渐发掘殆尽，另一方面企业之间的竞争会越来越激烈。因此，竞争性逐渐取代合法性成为组织密度的主要影响机制。这导致现存企业死亡率提高，整体利润率下降，新企业进入困难，产业内的企业数量增加速度放慢，甚至开始下降。因此，企业的数量变化和组织密度的增加的对应关系曲线呈现倒U形。具体可以分为五个阶段：

从表1可以看出，在产业的前期成长阶段，前两个阶段合法性起到主要作用，后三阶段竞争性起主要作用。在第一阶段，组织密度很低，企业生存艰难。在第二阶段和第三阶段是竞争性适度而合法性较高的阶段。此时，企业之间的实力差距比较小，企业的死亡率比较低。这也是产业发展、企业扩张的黄金阶段。随着组织密度的提高，企业之间的竞争性加剧，死亡率提高，产业发展进入第四个阶段。这是企业优胜劣汰的阶段，存活下来的企业往往实力强劲，规模比较大。这些企业构成了第五个阶段的产业主体，此时产业进入成熟期，企业数量趋于稳定。

2. 竞争性与企业生态位。组织生态理论借用生态学中的生态位概念来描述产业演化过程。该理论认为产业中每个企业都有自己的生态位，即其特定的资源获取渠道。企业生存发展所需要的资源在不同的生态位分布密度是不同的，资源较为集中的生态位被称为中间生态位或主导生态位，资源较为贫乏的生态位被称为边缘生态位。产业发展早期，企业间的竞争性较弱，竞争性对于生态位的影响不明显。随着企业数量的增加和规模的成长，企业之间竞争性加剧，实力比较弱小的企业难以和实力强大的企业在相同的生态位上竞争。因此，实力强大的企业为占据理想的生态位，以获取更多的资源，生态位向着中心移动，从而让出部分边缘生态位。而相对弱小的企业为了避免和强大企业的直接竞争，生态位会向着边缘移动。新进入企业由于自身资源和实力有限，也会选择进入边缘生态位。

由于每个企业占据的生态位宽度是有限的，一个产业内能够容纳的企业数量往往取决于其生态位的总体宽度。而产业的生态位总体宽度并不是一成不变的，它会随着社会、产业的发展，特别是创新和技术进步而变动。新兴产业的一项突破性技术创新，可以导致自身的生态位显著拓展，传统产业的生态位收缩。而生态位的拓展会给企业的生存和新企业的进入提供更多生态空间，从而在短期内降低产业内企业间的竞争性，容纳更多企业生存发展。

三、实证研究

1. 样本选取和模型设立。中国互联网信息中心自1998年起定期半年一期的《中国互联网络发展状况统计报告》。本文以该报告为数据来源，研究1998年～2014年互联网在我国的演化过程。由于数据可得性的制约，本文以网站数量作为企业数量的替代变量，来衡量互联网产业的组织密度。组织生态学认为，影响产业发展演化过程的因素可能包括组织密度、产业年龄、生存环境等。此外，本节也将考察互联网产业是否存在传染效应，即上一期企业的增加量对于当期企业增加量是否具有同向影响作用。

本文首先根据组织生态学理论建立模型1，考察互联网产业是否符合密度依赖理论。然后通过加入网民数量分离出合法性对于互联网产业发展的影响，更清楚的观察竞争性的影响状况。两个时间序列模型如下：

其中，？驻Nt为网站数量增加值，表示组织的成长，Nt表示网站数量，代表组织密度，Mt表示网民数量。以上三变量分别以百万个、百万人为数量单位。T表示产业年龄，取《中国互联网络发展状况统计报告》1998年年中数据为第一期数据，此时T取值为1。其中，T、Nt是影响组织种群发展的内部因素，而Mt代表t期的网民数量的，是互联网发展中的需求因素。

模型1是使用组织生态学研究组织密度对于企业数量的影响的传统方法，把网站数量作为唯一的因变量，来考察互联网产业演化是否符合密度依赖理论。模型2是通过加入网民数量，衡量合法性的提高对于互联网企业数量变化的影响。因为网民数量代表社会对于互联网产业的认可程度，是最好的衡量合法性指标。同时在模型中加入时间项T，来考察产业年龄的变化对于企业数量变化的影响。这样，模型2的实证结果就可以清晰的反映出合法性、竞争性、产业年龄分别在两个阶段如何影响互联网产业的演化。

2. 实证结果分析。产业演化过程是个动态发展过程，而产业发展的转折过程在现实中总会有所体现，特别是革命性的技术冲击。移动互联网领域的技术革命是中国互联网产业的重大变革，移动互联网的异军突起，也带动了互联网产业格局的快速变化。2009年苹果手机和安卓系统进入中国市场所引发的智能手机普及，可以说是移动互联网革命的标志性事件。因此，本文以2009年年中为分段点，拟合其发展过程。

从拟合值R2的变动可以看出，总样本回归中，模型的整体回归拟合度较差；分段研究后，模型对组织成长过程的拟合度得到显著提高，可以较好地拟合互联网产业的发展过程。谨慎起见，以邹检验进行验证，以检验分段数据是否存在显著差异，结果通过检验。

从模型一得出实证结果如表2所示，并没有发现明显的的传染效应。在2009年之前，上一期互联网网站的数量对于当期企业增量的具有正向的影响，而在2009年之后，转为负面的影响。这说明，在2009年之前，合法性在企业数量的变化中起到主要作用，而在2009年之后竞争性起到主要作用。因而互联网产业符合组织生态学中密度依赖理论的一般规律。

表2是根据模型2得到的实证结果，仍然具有总体样本拟合度较低，而分样板拟合度提高的特点，进一步证实分段数据存在显著差异。在加入了网民数量的滞后项Mt-1后，合法性对于网站数量变化的影响就被分离出来，此时上一期的网站数量对当期网站数量增加量的影响主要体现了竞争性的变化。表2中，组织密度对于组织成长具有负向影响，反映了竞争性对于企业数量增加量的抑制作用。与此同时，从分样本来看，2009年之后比2009年之前的影响系数绝对值明显降低，说明2009年之后企业之间的竞争性下降了。这反映出了移动互联网革命对于互联网产业演化进程的巨大影响。移动互联网的发展，使得互联网产业的生态位持续拓宽，企业可选的生态位选择增多，相同、相近生态位上的企业的数量减少，竞争性下降。从而，组织密度对于组织成长的负面影响降低了。

Nt-1为组织成长的滞后项，其系数衡量的是组织之间的传染效应。在加入了更多因变量之后，虽然2009年之前其影响仍然不显著，但是2009年之后却变得显著，这反映出了近几年互联网产业的演进变得更加有序。

T所代表的产业年龄，对组织数量变动产生的作用在2009年前后出现了反转，仍然是由于移动互联网革命冲击了传统互联网产业，新兴起的移动互联网为互联网产业的发展注入了新动力。

网民数量在2009年之前对于网站增量具有显著的正向影响，这说明在互联网发展前期，合法性的增加是互联网企业数量的增长最主要的推动力，这符合密度依赖理论。然而，在2009年之后，网民数量对于企业数量的增量变化却起到了明显的负向作用。这不是仅仅用密度依赖理论所能解释的。最可能的原因是，2009年之后，互联网产业的发展孕育出了一些实力强大的主导企业，同时网民的增加量放缓，而且新增加的网民的上网习惯更趋向于最便捷的主流网站，而主流网站通常由主导企业运作。因此，新增加的客户进一步增加了主导企业的实力，主导企业规模增大之后会占据更多的生态位，使得产业内中小企业和新生企业的生存变得更加艰难。这导致被大企业抢占生态位的中小企业死亡率上升，网站的增量下降。

四、结论

中国互联网产业的发展演化规律是符合组织生态学传统的密度依赖理论的，即随着组织密度的增加，企业数量的增加速度在两个阶段内先提高再下降。但是由于是新兴产业，企业的数量虽然增速下降了，但是绝对数量仍然在增加，说明互联网产业总体上处于快速发展期，还未进入成熟期。在实证中进一步加入了网民数量、产业年龄、增加量滞后项等变量之后，发现始于2009年的移动互联网革命对于互联网产业的演化进程产生了巨大的影响。由于产业生态位的拓宽，企业间的竞争性在2009年后出现了下降。合法性的提高使得网民数量增长在2009年之前对于企业数量的增长具有显著正向作用，然而，在2009年之后网民数量增加却对于互联网企业数量的增长起到了抑制作用，产生这一现象的原因值得做专门的后续研究。

参考文献：

[1] Amburgey T.L.，Rao H.， Organizational Ecology：Past，Present，and Future Directions，The Acade？my of Management Journal，1996，（39）：1265-1286.

[2] Bruderl，J.，Schussler，anizational mortality：The liabilities of newness and adolescence.Administrative Science Quarterly，1990，35（3）：530-547.

[3] Hannan，M.T.，Freeman，anizational mortality.MA：Harvard University Press，1989.

[4] Hannan，M.T.，Carroll，G.R.，Dobrev，S.D.Han，J.，Torres，J.C.“Organizational mortality in European and American automobile industries：Coupled clocks”.European Sociological Review，1998，14（3）：303-313.

[5] 彭璧玉，李熙.生态学视角的产业组织成长理论研究[J].经济评论，2009，（1）：147-153.

[6] 郭鸿雁.移动互联网演进与新一代信息技术勃兴：2008-2011年[J].全球化与中国，2013，（5）：106- 112.

[7] 李一明.移动互联网商业模式组成及典型案例分析[J].电信科学，2011，（7）.

[8] 郎为民，杨德鹏.移动互联网发展趋势研究[J].通信管理与技术，2011，（6）.

大数据互联网论文例7

1在自然界和人类社会中存在各种各样的网络，像作为基础设施的铁路、公路、航空等各种交通网、电力网，近年来广泛应用的技术网络万维网(www)、对等传输(P2P)网络、互联网等。一个典型的网络由许多节点和连接节点的边组成，通常节点代表真实世界中的个体或组织，而它们间的关系用边来表示。例如，在互联网中，可以用点来表示自治系统(AS，autonomoussystem)，边来表示其间的连接关系，即形成自治系统级的网络拓扑；如果把互联网中的路由器看成节点，而路由器间的连接关系看成边，这样就形成了路由器级的互联网拓扑。数学家和物理学家在研究网络的时候，为了抓住本质，通常进行一定的抽象，表现在既不关心节点的特定物理位置、大小，也不在意边的长短、曲直、相交与否，只关心节点和节点间是否相连。例如，欧拉在解决哥尼斯堡七桥问题的时候，虽然当时(1736年)讨论长短大小的几何学是主流，而不考虑长短大小、不牵涉量计算的情形几乎没人研究，但他却撇开研究对象的长短、大小、面积、体积等度量性质和数量关系，把2座小岛和河的两岸分别抽象成4个点，而把7座桥抽象这4个点之间的连线，开创了拓扑研究的先河。当人们把网络抽象成这种不依赖于节点的位置、大小和边的具体形态，所得到的性质就成为网络的拓扑性质，相应的结构称作网络的拓扑结构。网络结构和功能是网络理论研究的核心内容。其中网络结构通常用网络的统计特征(如度分布、聚集系数、平均最短路径、度一度关联性等)来刻画，网络功能由网络上的动态变化过程来反映。这两者并非相互独立，而是存在必然的本质联系。通常结构决定功能，功能反过来影响网络结构的演化。例如，交通网中不同的结构决定了网络的容量有很大的不同，而交通量的增加也可能引起人们增加路径，从而影响网络的演化。 2大规模复杂网络拓扑结构分析与其他学科的关系网络拓扑结构知识需要通过拓扑结构分析获得。当前网络科学关心的主要对象是大规模复杂网络，如互联网。而网络拓扑结构分析方法是网络科学的核心内容。从学科角度看，这方面的研究要以传统统计学、图论、统计力学、随机过程等学科为基础。因为复杂网络规模巨大，网络结构又具有多样性、动态性、复杂性，必须经过统计处理；而图论提供了简洁精确的方法来描述网络，已成为研究人员的共同语言和必要工具。近年来，国内外已出版了相关的一些文章和专著。但是网络拓扑结构分析方法与传统学科中的方法还是有很大不同。传统的统计学侧重于对属性数据的分析，网络结构的分析方法则通常侧重于对关系数据的分析。属性数据是指节点或一组节点自身拥有的数据。关系数据是指节点间关系、社团(eOlllmullity)问关系、整体层次、块层次间的关系，是2个或更多节点共同拥有的。关系数据与属性数据是不同的分析对象，其分析方法也有很大的差异。经典图论的研究对象通常只有几个或几十个节点，数学家们可以对其做精确的网络优化，而复杂网络结构分析方法处理的节点数目常常为数千、数万、数亿甚至更大规模，因此，需要从不同尺度作抽象。而过分抽象可能导致所得结论与实际情况相差甚远，从而引发各种争论，这就要求研究者需要根据实际情况从不同尺度来看问题。常常可以发现，一个尺度上发现的结论在另一个尺度上并不一定成立。如互联网自治系统级拓扑的度分布满足幂律【l，8惟1，而在互联网路由器级拓扑中，由于路由器接口数目的限制，度分布显然不会满足幂律。由于不同学科的研究者看问题的尺度不同，最近就引起了激烈的争论，计算机网络领域的研究人员对网络科学领域的研究结论产生异议就是一例【9J。这好比拿《庖丁解牛》中的庖丁与普通厨师的工作做比较，庖丁是在反复实践的基础上，掌握牛的结构(即事物的规律，现在的说法就是一个“科学问题”)，再去指导实践(“解牛”)，而普通厨师则不必做庖丁的工作，只要把牛肉做成牛排、做成菜就可以直接满足用户需要了，更多的是一个“技术问题”。也就是说，两者是两个层面的工作，但都是有益的工作。网络结构分析在社会网、技术网、生物网的研究和实践中都已发挥了重要作用，互联网就是一个典型的例子。作为一个真实网络，互联网从最初的4个节点，发展成为当今世界的信息基础设施，其应用的深入发展和无处不在的广泛性深刻地改变了人们的工作、生活和学习方式，己成为一个名副其实的具有复杂结构的巨大系统。对互联网拓扑结构研究所蕴含的科学意义和应用价值正受到学术界、应用部门和军事部门的普遍重视。下面主要对互联网拓扑结构分析的成果及其应用做比较详细的说明。 3互联网拓扑结构特征千差万别的网络都可以通过图来描述，邻接矩阵和邻接表包含了网络的所有信息，是2种传统的图表示方法，但都不能直观地告诉人们给定网络的特征。由于网络规模常常很大且结构复杂，为了刻画网络的性质，需要通过一些概念、统计的特征量和度量方法来直观地表征一个网络的主要结构特点。常用的刻画一个网络特征的指标有：节点度分布、平均路径长度、聚集系数、度一度关联性系数、介数、核数等。近年来，人们通过对互联网拓扑结构的分析，发现了多项互联网的拓扑结构特征。 3．1幂律的发现在互联网拓扑研究中，1999年法鲁托斯(Faloutsos)等人对美国应用网络研究国家实验室(NLANR，nationallabforappliednetworkresearch)1997年至1998年的3份BGP(bordergatewaypro．toc01)数据以及1995年的一份traceroute眦探测数据进行分析，发现了互联网拓扑中存在4条幂律。在SIGCOMM’99和《计算机通信评论(ComputerCommunicationReview)))…上。这个实验结论所指的幂律是近似幂律。这一结论最重要的是在本质上揭示了节点间的差异，表明与原先占主导地位的随机网络【l州根本不同的是，在自治系统级拓扑中，少数节点有大度值，而多数节点的度值小。 #p#分页标题#e# 这个发现引起了广泛的关注，掀起了一股研究热潮。需要特别说明的是，自治系统级拓扑上度分布满足幂律并不意味着互联网在其他尺度(如路由器级拓扑)上也满足幂律。事实上，平常所见的构成互联网底层网络的各种子网常常是星型、树型等结构，并不遵从幂律，但把这些子网互联之后，从宏观的自治系统层面看，就出现了幂律特征，这是一种“涌现”现象。这类似于社会科学领域中人类个体间的相互作用会产生经济制度，神经元间相互作用会产生智力。 3．2小世界网络文献【2】给出了具体的实验数据，说明了互联网自治系统级拓扑有小的平均距离和较大的平均聚集系数，是一个“小世界”∞网络。文献【11】分析了互联网演化的数据，在2001年12月至2006年12月期间，互联网自治系统拓扑中节点数目、边的数目翻一番的情况下，平均距离为3．62—3．82，平均聚集系数为0．242～0．296，也验证了互联网自治系统级拓扑具有小世界网络的特征。 3．3同配性与异配性纽曼(M．E．J．Newman)从节点度的角度考察多种网络的度——度关联性【12’l31，发现互联网自治系统级拓扑的连接存在异配性，即网络中的大度节点倾向于与小度的节点连接。文献f14]从k．shell分解的角度考察多种网络的层次关联性，发现互联网自治系统级拓扑的连接存在层次异配性，即拓扑图按k．shell分解后，外层倾向于和内层的连接，而互联网路由器级的拓扑结构呈现层次同配性。作为对比，互联网自治系统拓扑和路由器级拓扑的度——度关联性却均呈现异配性。 3．4高度节点间连接呈宦人俱乐部结构文献【15】中指出，在互联网自治系统拓扑中，拥有大量边的少数节点间更倾向于相互连接，并比拟地称之为“富人俱乐部现象”，可以用富人俱乐部连通性系数痧(，．／Ⅳ)来刻画：州Ⅳ)=而L该系数表示网络中最大的前，个度的节点之间，实际存在的边数L与这r个节点之间可能存在的最多连接边数r(r一1)／2的比值。如果dp(r／Ⅳ)=1，说明最大的前，．个度节点组成的网络为一个完全连通的子图。该文作者对互联网自治系统拓扑与一些常见的网络模型的富人俱乐部系数作了比较，在自治系统图中极小比例的高度节点有大的连接数，而且其富人俱乐部系数大于常见的网络模型的富人俱乐部系数。作者还在按度值大小排列的基础上将所有节点划分为20等份，比较了各区段间的连接边数情况，也可以得出高度节点间有较多连接的结论。文章在以上2个比较中认为：在自治系统级拓扑中具有“富人俱乐部现象”。文献【16】对存在富人俱乐部现象提出了异议，他们认为一个简单的富人俱乐部系数用于区别是否存在富人俱乐部现象是一个误导，应该将该度量建立在同样度分布的随机网络基础上，并提出了一种判定方法。定义富人俱乐部系数与相同度序列随机网络的富人俱乐部系数的平均值之比死(七)=烈七)／谚。(七)，如果该值大于l，则说明该网络存在富人俱乐部现象，否则不存在富人俱乐部现象。文献『17]对判定富人俱乐部现象提出了自己的看法，他们从统计的角度上提出了另一种判定方法：即对文献[161所提出的相对富人俱乐部系数计算n次，然后统计在这n次中，相对富人俱乐部系数值小于等于1的概率，如果该概率值小于口(文中设口=5％)，则说明该网络存在富人俱乐部现象。然而，文中最后举了一个反例，说明这种方法在某些情况下也不适用。至此，针对网络中富人俱乐部现象的判定方法不断进步，但仍不完美。不同领域研究者从自己的学科特点给出了相应的定义，从中也可看出工程技术背景的研究者与物理学研究者的思维方式的不同。 3．5共生效应通过对多种真实网络的分析，文献[18】发现了互联网自治系统级拓扑中基于2种不同中心性(度、介数)都呈现富人俱乐部结构(两者的富人俱乐部系数趋于一致)，这种现象称作富人俱乐部结构的共生效应。实证表明，许多真实网络如互联网路由器级拓扑、蛋白质交互网络、科学家合作网络都没有(或较弱)这种效应，而广泛应用的BA汁4模犁119]及其变种ESF(extendedscalefree)扩展的无标度网络模型脚】、GLP(generalizedlinearpreference)广义线性优先12¨、PFP(positive—feedbackpreference)正反馈优先【2副都有(较强的)这种效应。这种效应可以通过区别网络的宏观结构来选择是否采用BA模型及其变种，作为网络建模的一个准则。 3．6自相似结构研究了中国互联网的拓扑特征，中国互联网在网络建设和规划中要考虑已经存在的许多中国特色，如社会制度不同、运营商的特点不同、用户众多等，但研究表明，作为世界互联网的一部分，中国互联网自治系统级拓扑与世界互联网自治系统级拓扑的主要宏观特征可以用同一个PFP模型模拟出来，表明作为互联网局部的中国互联网的拓扑结构与全球整体的互联网拓扑结构是自相似的18J。传统的自相似结构通过分形的概念来刻画【231，文献[24】提出了互联网结构的一种概念模型Medusa：约占70％的节点构成一个极大连通子图。这个子图可以不经过核(nucleus)而构成一个连通图，这个子图存在自相似结构，并可用分形的方法来刻画。 3．7局部聚集现象文献【25】在局部聚集系数和节点度的关联性、三角形的分布、连通子图的冗余性3个方面研究了互联网自治系统级拓扑中的局部聚集特性。虽然表面上自治系统之间的连接大多数是自由选择的，但在地区和国家区域划分的现实环境下存在相当强的局部聚集现象。说明互联网的连接不是随机建立的，节点倾向于和局域的节点连接。另外，低度节点间存在连接冗余性。这些冗余连接可以丰富网络的路由选择并增强网络的健壮性。网络的局部聚集特性会对网络的性能产生很大的影响。#p#分页标题#e# 根据互联网中观察到的局部聚集现纠251，文献[26】改进了PFP模型，提出了LDPFP(10cality—drivenPFP)模型。 3．8向心性结构文献[141把网络经k-core分解后各层节点与最深核(nucleus)节点倾向于连接的结构称作为向心性结构，并指出互联网自治系统级拓扑具有明显的向心性结构，这种结构可以降低网络的平均距离，提高路由效率。 3．9层次结构互联网自治系统级拓扑的层次结构有多种表述，如Jellyfish(水母)模型【27】以节点度为基础，把自治系统级拓扑形象地表示为水母形状；Medusa模型阱l以核数为基础，把自治系统拓扑分成了3个部分：由所有最大核数节点构成最深核，剩余部分存在一个极大连通子图以及其他孤立的连通块；文献【ll】提出了核心一边缘模型，指出了核心与边缘不同的演化规律，文献【14]还提出了层次关联性、向心性结构等都从不同角度体现了互联网的层次结构。 3．10健壮而又脆弱互联网拓扑结构具有“健壮而又脆弱”(robustyetfragile)的双重特性，在不同尺度上，其形成机理不同。在自治系统级层面上同时表现出【28J：对节点随机失效的健壮性和在有意攻击情况下，只要移除少数重要节点，全网就会招致瘫痪，即表现为十分脆弱。这种脆弱性，也被称作阿基琉斯之踵(Achilles’heel)。其根源在于度分布的不均匀性。但在路由器级拓扑上，表现为互联网可以有效容忍在设计时考虑到的不确定因素，具有健壮性，而对设计时未被考虑的不确定因素(如IP前缀劫持、分布式拒绝服务)变得非常脆弱【29】。其双重特性是由于考虑到网络设计与优化等因素形成的，根源不在网络的度分布。4互联网结构知识的应用网络结构知识无疑有广泛的用处。利用结构知识可以解决一些网络性能、抗毁、安全传输等问题，散见于各类资料中，至今未发现有比较系统性的材料，如文献[30】利用节点的度作为OSPF(openshortestpathfirst)路由协议中连接权值的一个因素，使得路径更多样化，流量更均衡；文献【3l】利用自治系统拓扑中边割集的宏观动态变化来检测网络中前缀劫持的发生：文献[32，33】把结构知识应用于可扩展路由。多年前，笔者认识到拓扑结构的重要性，近年与同事利用互联网拓扑结构知识在流量优化、网络抗毁路由、服务器部署、网络体系结构、路由算法设计、节能等应用方面做了探索，部分已逐渐应用到多项实际工作中。具体的例子如下。 1)在流量优化方面，利用互联网拓扑知识降低骨干网流量、优化网络性能，提出了PPM(P2Pmatcher)技术，使上层对等连接(P2P)网络与承载网络的拓扑相匹配1m了71，主要思想是根据节点的m前缀和自治系统号来优化P2P应用的邻居选择和数据调度，提高对等连接流量的本地化程度，比国际上具有类似思想的p4p138]出现早了3年。2009年，还提出利用网络编码数据调度算法并结合位置感知技术来优化对等连接应用流量的方法【391。该方法与此前的最好方法相比能将类似BT的服务的流量降低一半，几乎接近理论极限，从而可以实现ISP、P2P内容提供商和终端用户三赢的完美局面。部分工作正成为国家通信行业标准136J的主要内容，国内所有网络运营商和主要设备制造商都参与了该标准的制定。另外，还针对互联网中大量NAT(networkaddresstranslation)的客观存在，进行对等连接流量优化，提出了穿越私网的解决方案I姐411，旨在充分地利用接入网络的资源，进一步提高对等连接流量的本地化程度，减轻域间和骨干网络上的流量。 2)在网络抗毁方面，通过构建一个覆盖(oveday)网络体系结构来实现。为了在覆盖网络中可以构建更加多样化的网络路径以及使构造的备用路径的平均长度较短、转发效率更高，利用介数和核数刻画网络的特征，提出了一种在覆盖网络中可以实现高效选择转发节点的算法1421。另外，利用核数和度的一些特点，结合转发节点位置信息及链路性能测量结果，达到所生成的备用路径的可靠性更高、实用性更吲4引，这些工作为抗毁路由的实施提供了技术保障。 3)在服务器部署方面，文献[441从网络结构特征的角度对覆盖网络研究领域中覆盖中继服务器部署低效问题进行研究，利用互联网异配特性和富人俱乐部结构的特点(即度大的节点既倾向于与度小的节点连接同时又与度大的节点连接比较密集)，提出一种基于度等级的覆盖中继放置(DROP'degreerankbasedoverlayrelaysplacement)的启发式方案。该方案可以有效地选取一组用来放置覆盖中继节点的位置集合，使用很少的物理拓扑信息便可以优化整个中国互联网的冗余性和通信可靠性。 4)文献[451为了提高网络服务的性能，有效利用自治系统粒度上拓扑结构信息相对稳定且信息量适度的特征，使多路径覆盖路由的效率最大化，设计了分布式启发式路由选择算法BFSQ。仿真结果表明BFSQ算法可以为终端节点有效选取多条覆盖路径，并可在实际的覆盖系统构建中部署实施。上面2)～4)利用网络拓扑结构知识实现了服务器部署、转发节点选取、路径多样性等关键技术，为实现网络传输优化、网络抗毁等目标构建了一个具有overlay网络体系结构的实际系统【伯】，这项实践不同于前人的网络体系结构研究工作，引入了体现网络摹本属性的拓扑特征，为拓扑结构知识与网络体系结构研究相结合提供了积极有益的探索，把网络科学知识应用到了网络工程技术中。未来将进一步对后IP网络研究产生积极影响。 5)在路由算法设计方面，文献【47】提出了利用网络的无标度和强聚集特征来设计可扩展的路由算法，将网络看成由一个骨干树和许多捷径组成。由于无标度网络上的长捷径很少，因此使用骨干树和少数长捷径构造的生成树可以在路由表规模和拉伸系数上获得较低的上限，通过实验验证了该方法的有效性。文献【48】提出了一系列基于最大度地标的紧凑路由算法——HDLR、HDLR+、NIHDLR+，具有比通用的紧凑路由算法更优的基本性能，仿真验证了这些方法的有效性。#p#分页标题#e# 6)在优化网络容量方面，把网络结构知识用于扩大网络容量，在最短路径路由占主导地位的情况下，提出了删边扩容的方法D9J和在节点能力总和不变条件下，基于节点度的最优节点能力分配方法即】。利用删边扩容策略，可以实现接入网流量优化140’4¨，也可实现高效转发节点选择，避免拥塞【421。 7)在节能方面，文献【5l】通过设计对能耗敏感的网络拓扑，利用聚合和休眠方法实现网络中处于工作状态的设备数与网络负载正相关，当负载减轻时，更多设备会休眠，从而实现节能。另外，通过上述提到的P2P流量优化、服务器部署等方法大幅降低交通量以及在NAT环境下私网穿透方案[40,41]中增加感知等技术，达到节能目的。 8)文献[52】以网络体系结构为汇合点，将拓扑结构研究同制度经济学研究结合起来，对体系结构衍生的契约进行分析。重点研究向用户开放末端网络的技术，提高自治度从而丰富契约关系，并进一步产生促进网络经济发展的作用。这种研究不仅帮助我们理解互联网体系结构及其系统在微观经济学层面上的意义，同时从经济学层面提出了衡量网络体系结构实用性的评价方法。 5结束语正如弄清事物的结构是人类认识一个事物和对其进行改造过程中首先面临的基本问题一样，对网络结构的掌握也是认识和改进网络的基础。互联网拓扑结构是互联网信息基础设施最基本的内在属性。对互联网拓扑特征和知识的发现及其应用正在快速发展中。当前热点的信息系统工程领域(如云计算、三网融合、智慧地球、社会计算、物联网等)都离不开互联网这个信息基础设施，上节介绍的各种应用中部分可以用于这些工程。对互联网结构的揭示及其知识的深入理解，可以为人们有效利用网络、合理构建以互联网为基础的信息系统工程提供科学依据，为网络建设、升级改造、上层应用的优化、设计新一代网络体系结构和协议提供理论指导。互联网是网络科学领域的一个典型的网络实例，对其拓扑结构知识的深入研究与应用可以丰富网络科学的内涵，推动网络科学这个新兴学科的发展。网络科学具有广泛的交叉性和复杂性，涉及数学、物理、计算机、系统科学等众多学科，在数学中，又常常涉及图论、统计学、随机过程、拓扑学等知识。网络科学对复杂系统的一般性描述和总结出的规律也为深入研究互联网拓扑结构或其他具体网络提供新的视角和指导。当前，国家有关部门正着力部署后口网络、三网融合、网络舆情等方面的研究，应该不失时机把网络科学知识与网络工程技术结合起来。网络与通信领域的顶级会议INFOCOM在2010年首次引入网络科学的专题讨论。期待在不久的将来，在网络结构分析领域能有更多朴素优雅的科学发现，为技术的进步提供方法论指导，进而产生简洁高效的技术方法服务于社会。

大数据互联网论文例8

中图分类号：F276.6 文献标识码：A 文章编号：1003-9031（2015）12-0048-03 DOI：10.3969/j.issn.1003-9031.2015.12.10

2014年3月11日，根据中央深化改革领导小组和国务院的有关要求，银监会在各地转报的推荐试点方案中择优确定首批5家民营银行试点方案[1]。有10家民间资本作为发起人参与其中，其中以腾讯、阿里巴巴两家互联网企业作为互联网民营银行的发起人尤为引人关注。以互联网为主要手段和工具，全网络化运营，不设物理网点，不做现金业务，提供具有网络特色的金融服务和产品。互联网技术的核心在于大数据的运用，而良好的公司治理结构是银行实现金融安全和稳健发展的重要基础，在“互联网+”的产业形态下，银行业的公司治理也势必呈现出新的特征。

一、大数据对互联网民营银行公司治理的影响基础

（一）公司治理的理论概述

公司治理对商业银行稳健运行具有重要意义。公司治理理论的根本问题是公司的本质和目标，这在不同历史时期、不同法系有不同的理解。其中以公司社会责任理论和公司契约理论为主要学说，另外还有团体生产理论、公司理论等新近理论成果[2-4]。公司社会责任理论是相对于股东利益至上原则（shareholder primacy norm）而言的。该观点认为，随着现代公司企业的发展，公司应被视为最大限度保护和实现包括股东在内的公司所有利益相关者之利益的组织体系或制度安排。公司契约理论则认为股东是公司的所有者，而董事的义务是使股东利益最大化。外部人利益只是一种外在性（externality），亦称第三方效应（third-party effects），更宜通过成本“内部化”实现对外部人利益的保护。

时至今日，两个学说的争论一直没有停歇①，但银行业本身具有高杠杆率、高风险性和外溢性，无论是立法思想还是实践中均较为倾向于承认商业银行治理目标应包含“其他利益相关者”的利益。2010年10月，巴塞尔银行监管委员会（BCBS）在最新的《加强银行公司治理的原则》中规定“银行除了应对股东负责外，还要对其他利益相关者负责”，“利益相关者”包括“监管机构、政府、债券持有人和存款人等”。

（二）互联网民营银行公司治理结构的分析范式

互联网民营银行公司治理结构主要有两个方面：一是互联网民营银行公司治理的体系结构，包括股东大会、董事会等机构的地位、功能、作用和权力配置，明确股东、董事、经理和其他利益相关人之间权责分配，规定公司的议事规则和程序，以及监督公司经营的监督机制；二是互联网民营银行公司治理的目标实现，主要指公司利益的指向。根据现代公司法的发展，社会责任融入公司治理，需要处理的利益关系包括股东利益、股东之间的利益冲突以及非股东的公司参与人的利益保护。

根据制度经济学交费费用的分析范式，制度具有减少交易费用的作用[5]。威廉姆森认为经济制度的主要目标和作用都在于节约交易成本，而交易成本分为交易因素和人的因素[6]。不同的互联网民营银行公司治理制度会导致不同的交易费用，一个好的制度会降低交易费用，而交易费用的降低亦会促进制度的不断创新[7]。因此，这一分析范式的的基本思路可归纳为：交易之特性――交易费用最小化――可采的治理结构――实证研究。具体而言：一是分析大数据模式下互联网民营银行交易模式、大数据、商业银行行业的特点等方面；二是互联网民营银行公司治理结构作为一种秩序治理制度的影响因素；三是受大数据模式影响的互联网民营银行的公司治理制度的交易费用的变化预测；四是通过实证进行比较制度分析。

（三）大数据对互联网民营银行公司治理的影响因素

从2014年选定5家民营银行的试点方案，到2015年相继正式批准5家试点银行开业，腾讯和阿里巴巴两家互联网企业作为首轮参与的民间资本的优势在于：一是互联网金融在吸揽小额资金上的优势，二是两家互联网企业在发放小额贷款方面积累的业务经验。大数据对互联网民营银行公司治理产生影响因素的分析，需借助物理上的“耦合”（Coupling）概念①，借以指代两个或两个以上的系统或运动，通过各种相互作用彼此影响，从而联合起来的一种均衡状态。这种良性互动体现为相互依赖、相互调和、相互促进的动态关联关系。通过耦合理论，可以发现大数据的特殊经营模式和互联网民营银行的公司治理具有四个维度的契合点：大数据模式、互联网民营银行的行业特点、互联网民营银行的经营特点和公司治理制度的基本影响因素。

第一，大数据模式具有四大特点（4V）：体量（Volume）、速度（Velocity）、多样性（Variety）和价值（Value）。体量是指大数据之“大”，大数据模式的数据库存在海量信息且不断处于更新之中；速度是指大数据之“快”，大数据模式之快，更新快、运算快、分析快、结论快；多样性是指大数据之“繁”，数据来源呈现多元化，可为浏览记录、购买记录等，甚至可细化从网页浏览、悬停的时间分析客户的偏好；价值是指大数据之“质”，数据即信息，信息即价值。

第二，互联网民营银行作为商业银行的一种，亦存在资本结构的复杂性、风险的集聚和外溢性的行业特性。

第三，互联网民营银行的经营特点为差异化市场定位，主要服务中小微型企业。互联网民营银行独特的市场定位，其针对性的服务导向能使其发挥独特作用。

第四，公司治理机制可分为内部治理和外部治理，主要为一个核心机制、三个主要机制缺一不可。核心机制即为董事义务制度，谋求董事独立性和负责性两个价值目标的平衡，而三个主要机制为法律规则、市场约束和社会道德。

二、大数据对互联网民营银行治理结构法律影响的三层维度

互联网民营银行作为一种新型的商业银行模式，以计算机互联网技术的运用为基础，以低成本高效率为服务质量，以数据挖掘为基本方式，矫正由信息不对称导致的供需失衡，从而实现民间资本在银行业进行合理资源配置的根本目标。大数据对互联网民营银行治理结构的影响可以通过三层维度分析。

（一）资源配置角度：足够的用户群体、用户亦客户与复杂的股权结构、小资本控大资产的耦合

互联网民营银行存在复杂的股权结构，负债规模远大于股权规模。这种高资本杠杆率、流动性管理难等特点使互联网民营银行处于小资本控制大资产的境地。大数据模式使互联网民营银行依托成熟的互联网平台，使庞大的用户群均成为潜在的客户群，直接接触需求市场。同时，互联网民营银行能够合理引导民间资本，也有利于维护金融体系稳定。一直以来，民间资本经过改革开放得到迅猛发展却碍于投资渠道有限，民营企业已逐步成为国民经济的重要支撑却难得充足的信贷融资。民间资本游离于正规的金融体系之外，处于内发无序的状态，稍有偏颇便触雷池。2011年浙江省温州市许多中小企业主为逃避民间高息借贷而跑路的现象，就是民间资本没有得到合理的引导和配置，导致金融体系不稳定的突出表现。另一方面，用户群体的庞大亦会由于互联网的无界性，使互联网民营银行的债权人具有分散性，使得股东与债权人利益的调和需要加大制度成本。因此，这一组耦合关系在交易费用的分析范式中表现为：提高资源配置效率，降低整体法律规制的成本。互联网缓解区域的不平衡发展，使不论哪个梯度的区域均能直接引进先进技术，实现地方竞争的反梯度推移发展。同时，信息渗透到各个产业的各个环节，利用信息的不断交换减少实体经济的冗余，实现资源配置的帕累托最优。秩序是创新必要的前提，但秩序的可预测性往往使其缺少内生性的创新源泉。互联网在激活产业创新的同时，也在与秩序的博弈中探索制度本身的创新，并且以此过程往复作用，循环发展。在这一角度上而言，民营银行的公司治理实现法治必须为金融创新和发展留白。

（二）信息对称角度：海量的客户信息、数据与矫正的供需结构、差异化市场定位的耦合

银行本身就是信息不对称的产物，而信息获取是主要的交易成本。作为民营银行和互联网技术相结合的互联网民营银行，其核心优势之一，就在于可以减少信息获取成本。在交易前的阶段，互联网民营银行依托成熟的互联网平台（比如电子商务平台），已然积累了海量的客户信息数据。以阿里金融为例，客户数据就包括电商平台的交易数据、信用记录、客户评价等内部数据，以及纳税记录、征信记录等外部数据信息。互联网民营银行通过互联网技术挖掘分析庞大数据库的信息，得出一定的逻辑和规律，在一定程度上缓解由于信息不对称导致的资金供需失衡。在交易阶段，互联网民营银行的信用评级和贷款管理可由数据的量化模型进行自动化的分析，有效迅捷地甄别企业资质，提供具有针对性的贷款方案，形成高效率的存款吸收方案。同时，互联网民营银行能够促进银行业间竞争，提高银行服务质量。互联网民营银行以市场为导向，在一定程度上打破由于国有银行长期垄断地位导致的服务质量不高、服务效率较低等现象，促进多层次、多规模、多所有制的金融机构并存竞争，产生“鲶鱼效应”，倒逼既有的银行金融机构提高服务质量，深化银行业体制改革。在这一角度，互联网民营银行有利于降低由于银行业垄断导致的社会成本。因此，这一组耦合关系在交易费用的分析范式中表现为：互联网民营银行通过差异化的市场定位，以海量数据库为基础，缓和信息不对称，矫正资金供需结构。信息获取的交易费用在一定程度上得到降低，但需要防止互联网民营银行过于追求利益，导致过度的冒险行为。对于互联网民营银行的监督成本应相对提高，必须在治理目标中体现维护金融体系稳定的宏观治理目标。

（三）技术变迁角度：独特的互联网技术、便捷又迅速与全新的信用体系、实时化全息化的耦合

信用体系作为互联网民营银行外部治理的社会基础，对于交易费用有重大影响。一方面，信用体系可以有效减少交易费用，在达成契约、执行交易和监督合约等方面降低交易成本。另一方面，信用体系会通过影响“市场半径”影响交易活动①。信用体系构建的成本取决于技术条件和社会条件。以阿里巴巴为例，阿里巴巴作为互联网民间资本参与首批互联网民营银行的建立，核心竞争力就是基于长数据链的信用体系，数据链越长信用风险越低，信用体系越完备。对数据进行定量分析，引入互联网数据模型和在线视频资信调查模式，通过交叉检验和第三方检验。这种新型的信用体系具有实时化和全息化的特征，前者依托于互联网技术的快速，而后者是互联网海量数据的体现之一。因此，这一组耦合关系在交易费用的分析范式中表现为：信用是银行业发展的基石，对于新生的互联网民营银行而言更是维系发展的动力。互联网民营银行的治理机制需要完善信用体系的支持和监督，而形成这种信用体系需要投入庞大的企业资本和社会资本。民营银行推动资金融通，助力兼顾银行业的法治保障和金融创新，其开放性、包容性和创新性的特点能使互联网民营银行提供更多惠及各方的公共金融产品。

参考文献：

[1]陈莹莹，高改芳.网络民营银行“五牛”争春，百花齐放尚待制度“联动”[N].中国证券报，2014-03-12（8）.

[2]黄辉.现代公司法比较研究――国际经验及对中国的启示[M].北京：清华大学出版社，2011：19.

[3][美]玛格丽特・M・布莱尔、林恩・A 斯托特.公司法的团体生产理论.黄辉译.载王保树主编《商事法论集》第9卷[C].北京：法律出版社，2005：267-343.

[4]Stephen Bottomley.The Constitutional Corporation： Rethinking Corporate Governmence[M]. As hgate，2007：38.

大数据互联网论文例9

中央财经大学中国互联网经济研究院院长孙宝文教授以《互联网经济、产业转型与时尚创意创新》为题发表了精彩演讲。孙宝文教授介绍，目前我国正处于工业经济向互联网经济加速演变的历史转折点，电子商务经济体正在成为未来中国经济发展的重要动力。电子商务可以加速传统产业转型升级的进程，催生大量就业机会，为中国经济赢得“降速转型”的空间，可以带动农业、提升工业、革新服务业，是现代产业体系中的枢纽型主导性产业。中国应该抓住机遇，探索新模式、新形态。如果错过互联网经济，错过的将不是一个产业，而是一个时代。

上海宝信软件股份有限公司模式研究中心高级总监徐哲显先生的演讲紧扣云计算、大数据、“工业4.0”和“互联网+”等关键词，重点讲解了云端时尚的具体内容，涉及流行趋势、面辅料交易、企划管理、快速设计、订货会到用户以及其它公共服务等内容，并从理论落地的角度介绍了云端时尚基地的运营及推广情况，为与会人员展现了云端时尚这一“互联网+时尚产业”的新图景。

《时尚北京》主编贾扬女士以女性的独特视角强调了“互联网+”要抓住时尚生活的本质，并以自身为例讲述了如何通过互联网高效定制生活。她认为，“互联网+”对于生活、生产和销售的改变是全方位的，消费者可以做自己的设计师，也可以与设计师合作。贾扬女士预测“互联网+”的未来世界是创客的世界，呈现一幅“大众创业、万众创新”的壮观图景。

大数据互联网论文例10

大数据正在改变着互联网和移动互联网行业的未来——从基础设施、数据管理平台，到一系列软件应用——包括数据分析、商业智能、工作协作、移动化办公以及各垂直行业的方方面面，因此，2012年也被称为大数据元年。

中国是体量上的数据“大”国，许多应用产生的数据量已经在世界上名列前茅。随着中国的互联网巨头纷纷走上开放道路，如何制定开放策略？如何应对开放过程中面临的众多技术挑战、对数据进行有效管理？是整个大数据生态系统亟待解决的问题。

由idg-accel主办的“大数据论坛”邀请了上百位业界资深专家参与此次论坛，idg资本创始合伙人熊晓鸽先生、微软全球资深副总裁本文由收集整理张亚勤博士、accel partners合伙人吉姆·布莱耶（jim breyer）先生担任联席主席。

本次论坛就大数据领域最值得关注的话题，设置了数据平台开放策略和生态、企业如何拥抱大数据、大数据处理和管理技术、移动互联网和数据驱动类应用等五个小组讨论环节。30多位大数据领域的业内人士在讨论中发表了精彩观点。

数据平台的开放性决定了数据的流动性，也决定了数据未来的收益性。factual公司营销及运营副总裁eva ho与参会嘉宾分享了数据作为资产如何解决流动性和可分享性的问题；淘宝网首席商业智能官车品觉则认为，没有首先很好解决自己公司的数据管理问题，开放数据

转贴于

平台几乎不可能。

英国爱丁堡大学/ 苏格兰皇家学院院士樊文飞也介绍了他的观点。樊文飞认为，“看大数据不光是要看量还要看质，质和量一样重要。”与会嘉宾的讨论涉及数据的生产、存储、处理平台，到分析、隐私处理、数据分享各个本文由收集整理环节。

大数据互联网论文例11

[文章导读]“趋势”是本刊最新的栏目尝试。中国本土杂志，多设有“科技”板块，但要么是商业化的消费噱头，要么是猎奇性的国外动态。我们的目光集中于传统和当下，但缺少对于未来的严肃讨论。“趋势”不是科幻式的探讨，也不是神秘性的预测，而是对即将并可能产生重大影响的科技变动，作出冷静的观察、分析和批判。正如胡凌这篇文章展示的，不是要欢呼大数据时代的到来，而是反思在这过程中，谁将得到好处，谁又将丧失哪些东西，对个人、企业和国家，这又各自意味什么？我们将持续关注以下议题：3D打印与知识产权、虚拟物品的生产与监管、算法的政治学、电子书包与教育、比特币、无人驾驶汽车与机器人产品责任、移动医疗与隐私、数字遗产等。敬请各位读者关注与回应。

大数据伴随着互联网产业的发展而产生，特别是移动互联网和物联网的兴起，使得数据搜集更为便利和广泛。同时，数据分析业务开始成为互联网行业的特色和主营业务，它可以更为精准地分析和预测消费者与客户的行为，带来更多价值，从而迫使传统行业纷纷向互联网靠拢。大数据革命作为一种被投资人追捧、被媒体炒作的概念还将持续升温，但人们往往忽视大数据在中国成为现实的历史进程和诸多条件，特别是网络经济作为一种新兴的经济力量如何借助成熟的商业模式和不完备的旧法律制度来开拓疆域。笔者将简要讨论这些因素，试图帮助理解未来如何发生。首先，作为一个整体的互联网行业发现了免费模式，在吸引消费者的同时获得了大量数据资产，这一过程伴随着互联网平台和移动互联网的兴起变得更加明显。其次，新经济通过生产工具的变革重塑了互联网的架构，从更多的免费劳动力手中攫取有价值的生产资料。第三，无论是免费内容还是消费者数据，互联网都没有受到强大的法律约束。而商业模式、技术变迁和用户协议中体现的所有权和使用权的分离原则为大数据时代铺平了道路。最后，互联网带来的由商品到服务的转变，进一步扩展了新经济对数据的占有和使用，并对保护旧生产方式和生产力的传统法律提出挑战。免费商业模式与数据资产免费内容与服务基本上已成为互联网行业的标准模式，通过免费来吸引用户，赚取广告收入和增值收入。如果说最早的门户网站还秉持着传统媒体经营的思路，那么从电子邮件、即时通讯到安全软件、网络游戏等行业纷纷实行免费，都证明了这一逻辑的势不可挡。免费商业模式的影响是巨大的，它将传统垄断经济学上的“双边市场”理论推到极致，依托多个免费的产品市场吸引用户，而通过少数市场获取增值收入；因为可以向无数用户同时提供低成本的服务，只要有少数人付费即可获利。这就是为什么很多互联网公司在提供一项主要服务以外，都逐渐扩展至各种服务。互联网公司之间的竞争也不仅仅局限在单项产品市场中，而是跨越多个市场的综合竞争（Evans， 2011）。这一点最近在腾讯垄断案中得到广东省高级法院的确认，拓展了人们对新经济本质的认识。这些免费服务被一些互联网公司视为“基础服务”，与“增值服务”相对应。它们不靠一次性出售书籍、光碟、报纸、流量获利，因而是对传统文化产品、媒体和电信服务生产方式的反动。消费者享受了免费而便捷的基础服务之后，才有动力留在互联网上进一步消费。可以看到，基础服务的范围在不断扩大，从信息内容逐渐扩展至金融、保险、医疗、教育和邮政领域。用户使用的基础服务越多，互联网企业对其偏好和信息的了解就越广泛，并通过大量用户类似行为进行相关性分析。（Sch?nberger & Cukier， 2013）在这一过程中，数据本身对这类轻资产公司而言越来越重要，其价值可以得到二次或多次挖掘，逐渐成为一种宝贵资产。基础服务本身要求被免费提供，而基于数据分析提供的增值服务才是互联网价值链上最耀眼的一环。从这个意义上讲，互联网并非传统媒体和文化行业的竞争者；它们需要把后者纳入其平台，承认自身的地位，并迫使其合作。互联网十余年来同音乐界、文学界、影视界和电信业的战争已经无数次说明了这一点。（Levine， 2012）这也是为什么互联网内部的不正当竞争越来越围绕数据资产展开，例如大众点评网和爱帮网的诉讼，以及最近的360综合搜索与百度的纠纷。越来越多的互联网公司开始通过技术手段保护自己的数据资产不被恶意复制和侵占，这些信息内容可以免费被消费者使用，却不能被其竞争对手轻易获取，防止反过来同自己展开竞争。为完美地实现这一点，互联网平台的兴起在所难免。通过对内容、服务、应用、操作系统、硬件终端甚至是管道的垂直整合，互联网公司可以排他地向用户提供一站式服务。苹果公司的产品就是一个极好的例子，也成为众多互联网公司效仿的榜样。1990年代中期，微软因在windows操作系统上捆绑独家IE浏览器和媒体播放器而受到反垄断指控并受处罚，但十余年后终端捆绑现象无处不在，这说明了互联网架构从开放转向封闭已经深入人心。（Zittrain， 2008）无处不在的计算、终端和劳动力在发展过程中，互联网形象在人们心目中经历了不同的想象：从新媒体、信息服务到现在的数据分析业。前两者甚至决定了国家管理互联网的基本思路：归口和属地化管理。但数据分析业务将真正超越条块分割的现状，从各种渠道和方式获取价值。一旦互联网行业无法被封杀打压，在积累了海量数据的基础上，它们就会减少对纯粹吸引用户的基础服务的需求（可以同传统行业展开合作或者外包），减少对盗版内容的需求，从而向更加精细的大数据分析进发。海量数据的获取离不开数据聚合处理的平台，以及生产数据资产的劳动力和工具。随着移动终端的大规模普及和背后云计算的支撑，个人电脑不再是用户接入互联网的唯一方式，甚至不再是主要方式。未来的眼镜、手表、汽车、各种可佩带物品均可成为人们相互沟通、获取信息的媒介和硬件。人们通过这些信息终端使用在线服务的时间和地点，将不像台式机时代那样固定。当人们可以在盈余时间中使用无处不在的互联网服务时，大量个人数据就可以更容易地得到深度记录和分析，生产工具的廉价和普及为大数据时代奠定了物质基础。（Shirky， 2010）从数据生产的意义上讲，用户和互联网的关系不仅仅是消费者和服务提供者的关系，或者反对传统利益和权力的同盟军的关系，而是可以被看成是免费劳动力和工厂的关系。互联网时代预示着人们不再是被动的文化产品消费者，他们通过创生性的终端同样可以成为文化的生产者和创造者。对新经济而言，用户不仅仅是他们自身文化的生产者，同时也在为互联网企业生产信息内容（Scholz， 2012； Boutang， 2012）。每时每刻都有大量的文字、图片、视频上传至网上，在用户之间分享。信息传播和流通的速度越来越快（可以比较下早期的BBS和当代“共时性”的微博），同信用货币一样，信息能够转化为更多的价值。同时，在一系列意识形态的鼓舞下（言论表达自由、信息自由流通、礼物经济、分享、合作、积极行动），用户对群体生产者的身份引以为傲，这进一步推动了互联网经济的发展。如果说用户是初级生产资料（非结构化数据）的生产者，第三方应用开发者（或者参与QQ互联的网站）则是大数据时代新经济生态系统的次级生产者和初级挖掘者。他们从平台提供商那里获得开放API接口和不同目标用户的信息，开发各种应用服务，获得的收入与后者分成，反过来又增加了平台的整体价值。平台免除了中小开发者自己开办网站积累流量、从头搜集用户数据的不确定性，允许他们有条件地使用自己的海量数据。未来随着平台和终端可以扩展至对一切事物的控制，用户越来越难以转换到另一个竞争性的平台，从而成为某一割裂的互联网帝国的忠实属民。所有权与使用权的分离上述围绕数据展开的复杂权力结构和利益关系的法律基础常常被忽视，这一基础可以归纳为法律学者耳熟能详的“所有权与使用权的分离”。尽管很多学者还在探讨信息所有权的法律结构，现实已经清楚地表明：互联网时代的信息所有权并不重要，重要的是谁有权使用各种信息和数据，能够产生何种价值。首先，如前所述，终端经历了从台式机到无处不在的信息设备的演化。当人们的文档、图片、音乐还能够储存在本地、通过本地计算使用的时候，很容易将其比拟成可以支配和控制的“财产”。然而，当越来越多的个人文档被鼓励上传至云端，能够通过移动终端随时访问时，它们将脱离拥有者的控制，并被云储存服务商进行使用和分析。通行的用户协议要求至少以分析的方式永久使用用户上传的个人文档，要求获得这种使用权，是大数据产生价值的必然要求。其次，类似地，当人们通过磁盘或光盘安装某种软件或游戏的时候，对物理实体的认知容易将这类产品视为和鞋子一样的“财产”，因为可以自行掌控。然而当越来越多的软件、信息内容和游戏通过在线方式提供，并可以随时更新的时候，它们不再被看成产品，而是一种源源不断的服务。用户需要容忍它们的质量瑕疵，甚至无法获赔由此造成的损失。通过用户协议进行的这种约定，有利于向大规模用户同时提供服务，并将互联网公司自身的风险降至最低。它们不会授予用户所有权，而只是免费的无保障的使用权。类似的机制，还普遍体现在网络游戏中的虚拟物品和企业虚拟货币上面，它们迎合了人脑对金钱和实物财产的敏感和本能欲望，却绝不通过用户协议为用户创设财产权利，从而并不保护这类“虚拟”（illusionary）产权。再次，像百度MP3或文库那样的利用盗版作品的服务模式一度促成了互联网的“非法”兴起。这可以部分归因为互联网公司从免费使用盗版作品获得的可能收益远远超过侵权损害赔偿数额，部分归因为各种官办著作权集体管理组织维权的低效。同时，由于存在“避风港”规则的庇护，作家或音乐人长期以来只能要求互联网公司被动地删除侵权作品，而不能强制其主动监控侵权内容。因而，在大量盗版作品被通知删除之前，互联网公司事实上通过使用而获得了非法收益。“避风港”规则意在平衡新旧利益，但实际上保护了作为一个整体的靠免费信息内容为生的互联网行业。更重要的是，互联网免费模式要求在生产方式上（opt-out）改变传统的授权模式（opt-in），这进一步凸显了使用权的重要性。（胡凌，2013）第四，互联网还通过各种机制鼓励用户为其生产信息内容。这一生产活动的最终分配，通过用户协议明确约定：即用户仍然对其发表在某一互联网服务公开区域上的内容享有所有权，但同时要授予互联网公司享有永久和免费的使用权。这一条款能够确保互联网上永远有信息存在和不断流通，即使用户注销其账户，也无权要求从服务器上彻底删除全部个人活动和信息。这是两权分离带给互联网的最大好处。同时，关于用户隐私的约定，也仅限于那些能够直接识别出用户身份的基础信息，对于能够从用户网络行为中发掘出的大量有价值的数据，则无需用户同意即可使用，这就为大数据分析扫清了法律障碍。最后，从平台提供商和第三方开发者的关系来看，也存在两权分离的广泛实践，即第三方中小开发者作为外包的劳动力，可以免费使用平台的API接口和某种特定类型的用户信息，由此产生出的价值再和平台提供商分成。《互联网周刊》主编姜奇平先生很早就看到了两权分离作为新经济模式的核心特征（姜奇平，2012）。然而，他始终强调的是这最后一点，却没有提及大量用户在所谓“分享型经济”中初级生产资料提供者的地位。再次回到前述观点，用户帮助互联网战胜了传统利益群体，同时，也将自己牢牢捆绑在新经济的机器上，通过集体行为像农民一样不断为领主生产食粮，或者更不恰当地，像蜜蜂一样不断为养蜂人生产蜂蜜。大数据的法律障碍至此可以看出，大数据革命的重要现实条件，是拥有海量数据的平台出现，围绕互联网平台及其封闭价值链，产生了一系列初级和次级的资产提供者。因此，围绕数据资产的争夺就成了互联网治理中重要的争论议题，我们由此可以理解，为什么谷歌联合创始人会把苹果公司和facebook同中国与好莱坞放在一起批评，因为它们都阻碍了数据在世界范围内的自由流通，从而阻止其从中获利（Katz， 2012）。我们同样也可以理解互联网公共领域的实质和局限，例如，尽管社交网络允许人们迅速传递消息和真相，挑战传统权力和媒体，但社交媒体的架构，仍然从属于商业化盈利的需求，进而影响甚至决定网络言论和表达的效果。未来的大数据发展面临着一系列约束数据和信息流通的障碍，而互联网巨头一直要求打破这些障碍，解放各种信息，并在自己的势力范围内重组。中国目前和互联网相关的法律，仍然是以原子时代的思维方式，一味依靠政治逻辑进行治理，而没能够从商业逻辑角度思考互联网的本性，由此，不仅没能有效规制互联网产业的有序竞争，还影响了其他重要社会价值的实现。在商业逻辑看来，约束个人信息流通的法律至为关键。隐私保护在中国的法律制度中一直处于灰色地带，因为中国幅员辽阔，又处于从农业熟人社会向工商业陌生人社会的急剧转变当中，很难统一人们对隐私权的认识和实践。互联网第一次用实践强行统一了标准，即通过用户协议将互联网隐私界定为可以追溯和识别个人身份的基础信息。无论用户是否真正阅读，这都是一种进步，它适应了信息技术的现实，取消了传统的空间隐私权的地位，并承诺未经用户许可不向第三方出售或转让用户隐私。缺陷则在于，没有赋予用户对个人数据的控制权，加之大部分用户对个人数据安全的无谓心态，都直接造成了个人信息无序搜集、买卖和盗窃的泛滥。巨头平台的兴起，对个人数据利用的混乱状态可能是一个纠偏，允许第三方开发者有效有序地开发，却默认了自身的合法性。如果中国未来的个人信息保护法像欧盟一样严厉，那么很难设想现有的巨头还会继续存在。鉴于互联网经济的持续影响，基本上可以肯定中国不会效仿欧盟的实践，而很可能进一步区分属于人格权和基于空间形态的传统隐私与更加中立的个人数据，从而为新经济的发展保驾护航。消费者们也可能继续拥护这个二分法，允许互联网创新进一步发掘波兰尼意义上的默会知识和情境知识，从而更好地满足自身的需求（Weinberger， 2012）。而且，通过算法和机器对个人信息进行的分析与预测，似乎也不同于以往人为地侵犯个人尊严的行为，例如搜查和监视。研究已经表明，即使经过匿名化处理的数据，仍然可以追溯至具体的个人，可见，以“是否能够直接识别”为标准不足以保护用户的隐私（Ohm， 2010）。更何况，用户完全失去了对个人数据的控制，并不能知晓这些数据在未来能够以何种方式被创造性地挖掘和利用。问题的实质，仍然在于用户的自主选择，在于他们是否有意愿自己掌控数据的流向与使用。对于掌握大数据的企业，同样有必要对其使用用户数据的行为进行监管，但无论如何，上述历史，反映了互联网企业如何通过用户协议和隐私法律的模糊，利用用户数据进行搜集和使用信息，而讨论任何未来的法律，都不会实质性地损害到新经济的根本。版权法是阻碍大数据革命的另一个障碍。和隐私相似，如果版权法过于严格，则会影响依靠海量信息生存的互联网发展。中国互联网的历史已经基本排除了这种可能性，作为一个整体的互联网行业不会因为盗版的“原罪”而被摧毁，更何况它们正在努力漂白，不仅为自己的合法性宣传，也为拓展业务同旧利益群体开展合作，通过更新的生产方式而游说立法者，试图将法律体系按照它们的意愿重新塑造，例如网络广告、反垄断、在线交易征税、电子货币、投资结构等等。围绕信息网络传播权展开的大量诉讼，都表明法律最终没能解决盗版侵权问题，真正解决问题的毋宁是新旧利益之间的密切合作，互联网产业真正做到了让自己成为旧法律的“例外者”。新经济的一个更为长远的意图在于将我们日常生活的世界全部数字化，从而可以交由某一个先进的算法进行处理，当算法可资处理的数据足以反映人类社会最为基本的关系和行为的时候，真正意义上的人工智能就诞生了。但这个过程并非田园诗般美妙，而是伴随着利益的争斗和权力关系的消长。大数据革命是我们过去的互联网时代的延续，而非某种“惊人的一跃”。塑造互联网过去发展的商业模式和法律制度，仍将继续影响未来大数据的实践。可以预见的未来，将是互联网产业进一步破除阻碍信息流通的种种障碍，获取更多可分析的数据，并不断从传统法律保护的种种利益和价值中获利。笔者认为，必须将劳动重新引入法律分析，因为传统法律保护的利益在互联网时代全都可以转化为点滴的集体劳动，并可以成为赢利的资产，例如言论、隐私、版权和信息财产等，否则，我们就无法理解用户在互联网崛起过程中扮演的关键角色。限于篇幅，本文无法讨论数据挖掘和预测的工具（“算法”）的历史及其社会效果，读者可以参考两本新近出版的著作进一步思考。（Sch?nberger & Cukier， 2013； Gitelman， 2013）（作者单位：上海财经大学法学院）