欢迎来到速发表网,咨询电话:400-838-9661

关于我们 登录/注册 购物车(0)

期刊 科普 SCI期刊 投稿技巧 学术 出书

首页 > 优秀范文 > 复杂网络分析

复杂网络分析样例十一篇

时间:2023-07-05 15:57:53

复杂网络分析

复杂网络分析例1

方剂是中医临床治疗疾病的主要手段,是在辨证、立法的基础上选药配伍而成的。在辨证确定病机和通过立法确定遣药组方指导原则的前提下,方剂的配伍仍遵循基本的组方结构和药物配伍原则,进行“君、臣、佐、使”配伍,从而使各药形成“有制之师”,针对患者或证或病或症,达到整体综合调节的作用[1],体现了方剂在中药饮片层次的组织原则。同时,药物配伍的原则如“七情合和”研究两个药物之间的功能组配关系,与方剂配伍形成互补性的组织原则。

在中医临床诊疗过程中,我们通过对临床处方数据的初期分析,并与临床专家的交流中发现,名老中医的临床复方的配伍规律主要体现在两个层次。第一层次为临床医生一般以经典复方(包括经方、时方和验方等)为基础进行临床处方;第二层次为在药证或药症关系基础上的药物随症加减处理。这两个层次的临床处方配伍过程形成了既有核心处方结构,又具有较大灵活性的处方集合。因此,通过对名老中医处方集的共性网络结构分析,能够发现体现其处方思维和临床特点的核心处方配伍结构,从而辅助进行名老中医经验的传承和整理研究。

复杂网络是当前科学界研究的热点问题[2],诸如蛋白质网络、万维网、生态网、交通网和文献引用网等都具有非常有趣的统计特性。其中,除了小世界网络特性[3-4]之外,无尺度网络(Scale Free Network)[5-6]是一种具有节点度幂律分布现象的复杂网络,科学家对其动力学原理和应用问题的研讨已经成为相关科学研究的亮点。复杂合作网络如文献作者网等也具有无尺度网络的规律[7]。何氏等[8]把中药复方视为广义的合作网络是合适的。无尺度网络现象反映了复杂网络在一定驱动力的影响下动态的自组织过程宏观规律。我们认为,网络中节点个体的分类特征、网络组织的角色需求和组织中元素的关系分类是其潜在驱动力。不同于何氏等[8]的研究结果,我们基于古方及当代临床复方数据的分析表明,中医药理论指导下的复方配伍过程具有无尺度复杂网络现象。这对中医药理论如复方配伍、药物相互作用以及药性理论等的研究提供了实证基础,为进行中医特色的科学研究提供了方法学启发。笔者利用复方药物配伍的无尺度网络规律,研究实现了基于图论网络分析的处方核心药物配伍知识发现方法。该方法在名老中医处方经验的分析中得到了较好的应用。

1 复方药物配伍网络的构建

我们把单个复方的组成药物(目前仅考虑药物组成,对药物剂量暂不考虑)为节点相互构成完全图。连接某两个不同药物的边的权重表示这两种药物在多个复方中被使用的频度。由此,一个较大的复方集合构建的药物配伍网络将成为大量药物节点与带权重的边连接的网络。药物节点之间的连接边的权重在一定程度上表现了药物之间同时配伍应用的强度。中药配伍网络的构建过程的示例见图1,如大承气汤由大黄、厚朴、枳实和芒硝4味药物组成,因此,这4个药物构成了4个节点的完全图,其每条边的权重为1;而小承气汤则由大黄、厚朴和枳实组成,因此,连接该3个药物的每条边的权重都增加1,其权重为2;由此,随着复方的增加,该药物配伍网络的节点和边的权重会逐步增加。当大规模的复方集合如古方集和大量的临床复方集构成药物配伍网络时,该网络中节点及其相互关系反映了全局性的药物组配规律。而当由面向某一特定病证的复方集构成网络时,其网络反映了针对特定病证的药物配伍知识。当然,某名老中医一段时间的临床复方形成的药物配伍网络反映了其在某些病证条件下临床处方的配伍经验知识。

2 复方药物配伍网络的节点度分布特性

在辨证施治的基础上,复方反映了医生从治疗角度对患者病证一定程度的定性或定量认识,是患者病证演变的间接体现,用于临床治疗的稳定复方药物集系统性的自组织规律,是一个复杂的药物组织集。我们通过构建药物配伍网络并采用节点度分析方法发现,中医古方集合(80 000余古方数据,见图2)和临床处方(20 000门诊处方,见图3)等都具有无尺度网络现象(即节点的度分布服从幂函数分布),是一种加权无尺度网络[9],其边权重的幂值在2.2左右。复方药物配伍的无尺度网络现象在医生处方中的具体体现就是某医生对药物的使用具有比较集中的趋势,某些名老中医偏好使用某些药物,使得这些药物的已有或潜在功效得到更大的发挥或挖掘。

基于古方及当代临床复方配伍过程的无尺度复杂网络现象表明,某一特定复方集中存在可能共性或核心的药物配伍子网络。结合复方配伍中的无尺度网络规律和基于图论的网络分析方法,我们能够对名老中医的基本处方药物配伍经验或者面向某一特定病证的药物配伍经验进行分析,从而发现其关键的药物组配结构如核心药物、药对等信息,以辅助研究名老中医的处方思维和临床处方特点。

3 临床复方的核心药物配伍网络分析研究

无尺度网络的现象表明,中医处方中存在核心的组织结构,这些组织结构代表了医生临床处方的思维结构知识和临床经验。我们以无尺度网络的幂值为基准寻找医生(特别是名老中医)的核心处方药物配伍网络。我们通过开发相应算法实现了核心药物配伍结构的发现[10]。该算法基于无尺度网络现象,选取药物配伍网络中的“Hub”药物节点,从而寻找一定代表性和覆盖度的某名老中医的共性处方配伍网络。当针对某一病证或在总的日常诊疗过程中,某名老中医的处方配伍网络表达了该老中医的处方思路或首选处方结构,是其临床经验和处方“偏好”信息的表现。同时,我们可以根据处方配伍网络中的节点度分布,发现处方配伍网络的核心节点,并根据这些节点在处方中的同现频度计算其覆盖度。我们以北京市地区20余位名老中医的门诊病例数据为基础进行了核心处方配伍结构的知识发现应用研究,如分析方和谦老中医的和肝汤处方配伍结构、谢海洲老中医治疗类风湿疾病的核心处方配伍结构、田从豁老中医的核心穴位配伍结构、孙桂芝老中医的肿瘤治疗复方、薛伯寿老中医的和法处方配伍结构和咳嗽病痰热阻肺证门诊病例的处方配伍等等。下面以咳嗽病痰热阻肺病例的处方配伍核心网络分析作为示范。见表1。表1 门诊咳嗽病痰热阻肺证病例处方配伍网络对应的药物关联频度(略)

在门诊咳嗽病中痰热阻肺证占有较大比重,在20 000余诊次病历中经数据筛选后,确认满足条件的病例为165诊次,以小儿支气管炎为主(这与我们选择收集的门诊病例特点有关,并不是咳嗽病痰热阻肺证的本身疾病分布特点),样本中患者平均年龄为6岁左右。相应的症状体征除咳嗽之外,主要有咽红、舌红、有痰、大便干等。我们通过基于网络分析的方法确定咳嗽病痰热阻肺证的处方配伍结构知识。利用网络分析算法计算获得的分析结果,该网络中核心药物(通过节点度分布计算)为黄芩、杏仁、紫苏子、葶苈子、百部和仙鹤草,这些药物在90.2%的样本处方中出现。说明几乎所有咳嗽痰热阻肺证患者都使用以上药物。且网络核心节点的周围相关药物如前胡、芦根、瓜蒌、乌梅等表示对不同个体病例的主要随症加减思路。该网络中节点的颜色以节点药物的药性进行区分,药物配伍网络中节点3种颜色总体分布信息,有助于为有经验的中医临床医生提供该核心药物配伍网络相应的基本病机(如寒热、阴阳等方面)的直观认识。除了产生可视化的处方配伍网络之外,我们同时对该网络的药物关联频度信息进行数据库存储。该关联信息描述了临床处方中的主要药对知识如葶苈子、紫苏子,紫苏子、杏仁,葶苈子、杏仁,仙鹤草、百部,黄芩、杏仁等,这些药物配伍体现了我们所采集的门诊病例中治疗小儿支气管炎痰热阻肺证的主要药物搭配思路。因此,网络结构图与关联数据信息结合可以进行针对某特定病证的处方配伍结构分析,提炼归纳形成中医临床的处方经验知识,从而用于指导临床诊疗或供年轻医生学习。

由以上咳嗽病痰热阻肺证的处方分析可见,处方配伍网络具有直观的表现形式,对于中医临床中发现或者验证经验性的“小方”具有显著的效果;同时也能够辅助发现和验证临床医生针对特定病证的处方思维或思路。且这种结果是可靠的,因为我们已经试验表明临床处方中存在无尺度网络的现象,而无尺度网络的特点就是存在共性的核心网络结构。

4 探讨与未来研究工作

中药复方是一个有机整体,是理、法、方、药的主要环节之一。复方的有机配伍是实现药物增效减毒,针对病机对证用药的基础。《素问·至真要大论》说:“方制君臣,何谓也?岐伯曰:主病之谓君,佐君之谓臣,应臣之谓使。”《神农本草经·序列》将药物配伍关系归纳为单行、相须、相使、相畏、相杀、相恶和相反等“七情合和”的关系。由此可见,中药复方配伍是方剂形成之后中医处方用药的基本原则。大规模复方集的无尺度网络现象表明中医诊疗过程中复方的组配存在一些“偏好”现象。这些“偏好”现象可以表现在药物的选择、药物的组配、医生对病机的认识、疾病的发生发展机制和人体系统的状态变化与调整途径等。研究发现,这些“偏好”的来源、运行机制和病、症、证等相关知识将有助于人们对复方复杂干预的理解,对疾病发生发展的理解等。

本文针对中医临床中的处方配伍经验分析目标,研究利用复方配伍的无尺度网络现象和基于网络分析的数据挖掘方法,实现具体病证或名老中医的核心处方结构知识发现。该方法通过图形化的方式表达分析结果,从而为结果的阐释和临床专家的人机交互提供了便利。在未来的研究工作中,在一定适应症的条件下,具有稳定结构的复方组配知识发现问题;考虑多种“偏好”信息,进行复方配伍无尺度网络现象的组织动力学机制研究问题;对临床处方中的核心处方配伍群(多个反映处方集核心配伍结构的子配伍网络)的挖掘算法的深入研究等问题;将是揭示和发现中医复方药物配伍与临床诊疗规律的重要课题。

参考文献

[1] 于友华.方剂配伍理论的系统科学思想[J].中国中医基础医学杂志, 2004,10(8):63-64.

[2] Newman MEJ, Barabási A-L, Watts DJ. The Structure and Dynamics of Networks[M]. Princeton:Princeton Univ Press,2006.

[3] DJ Watts, SH, Strogatz. Collective dynamics of’small-world’ networks[J]. Nature,1998,393:440-442.

[4] MEJ Newman, C Moore, DJ Watts. Mean-field solution of the small-world network model[J]. Phys Rev Lett,2000,84:3201-3204.

[5] R Albert, H Jeong, AL Barab’asi. Diameter of the world

wide web[J]. Nature,1999,401:130-131.

[6] AL Barabási, R Albert, H Jeong.Mean-field theory for scale-free random networks[J]. Physica,1999,272:173-187.

[7] Newman MEJ. The structure of scientific collaboration networks[J]. Proc Natl Acad Sci USA,2001,98(2):404-409.

复杂网络分析例2

中图分类号:TP316.8 文献标识码:A 文章编号:1672-7800(2013)005-0070-02

0、引言

随着当今社会科学的不断发展和进步,各学科的发展都需要与周围的众多学科产生关系,因此复杂性学科应运而生。复杂性学科的引入能够更加充分、全面地对事物进行研究。复杂性学科是系统学科和非线性学科相结合的产物,其不仅具有两者身上的优点,更是对两者的补充和发展,因此复杂性学科已经成为了现代科学研究中最有效和常用的研究领域。而在上世纪末小世界效应和无标度特性的发现,为人们提供了一个新的研究复杂性学科的角度,让复杂网络在更多的领域里得到了应用,并取得了不错的效果。随着城市的不断发展,城市交通网络也成为了越来越重要的问题。近年来,复杂网络在城市交通网络领域中的不断应用,大大提高了城市交通网络的分析准度率和效率,也让人们看到了复杂网络在城市交通网络应用的光明前景。

1、复杂网络在城市交通网络分析中应用的可行性

关于复杂网络在城市交通网络中的应用,各方观点不一,很多人认为由于城市交通规模不足,城市交通网络的研究条件距离复杂网络研究还有很大差距,复杂网络不能够准确地在城市交通网络分析中进行应用。而另一些人则认为,随着城市交通网络的不断发展,城市交通网络已经成为了一个复杂的、庞大的网络系统,因此在某些研究上能够完全遵循复杂网络的研究方向。虽然城市交通网络在很多方面还不能完全符合复杂网络的研究标准,但是在很多方面具有较大的相似性,并且相关实验数据也能够证实复杂网络所描述的城市交通网络与实际相符,因此复杂网络能够在城市交通系统中应用。

在笔者看来,复杂网络在城市交通网络上的应用是可行的,主要因为以下3点内容:

(1)虽然城市交通网络在某些方面具有规则网络的某些特征,因此具有拓扑统计的相关性质。但在研究城市交通问题时可以对简单的拓扑进行抽象研究,这样就能够将城市交通网络中复杂的拓扑现象展现出来,从而反应出城市交通网络其它方面的重要特征。

(2)由于城市交通在不断地流动和变化过程中,因此在特征上具有明显的复杂性。例如:在每个路口处,即复杂网络中的每个节点处,都会有不同的变化,这些变化并不能确定其变化的方向,因此能够采用复杂网络对其进行研究。

(3)在交通网络的不断演变过程中,拓扑在交通网络上的应用对交通网络的分布和发展起到了重要的推动作用,因此将复杂网络应用在城市交通中对城市交通意义重大,符合城市网络交通的发展规律。

2、复杂网络在城市交通系统中的相关应用

2.1 复杂网络对城市交通网络的描述

由于城市内部交通复杂,交通模式不同,因此在复杂网络上会产生很大的不同。当今社会发展迅速,交通网络也随着社会的发展而不断变化,在交通网络的变化过程中,受到了包括地理、经济、规划等多种因素的影响,而复杂网络对于这些复杂因素的问题有着极强的处理能力。在研究城市交通网络时,只需要将城市网络抽象成复杂网络,然后对其进行研究。一般理论上对城市交通的抽象方法有两种:第一种是原始法,只需要简单地将交叉路口视为节点,并将连接这些节点的马路当做边,这种方法较为直观,容易理解;而第二种方法和第一种完全相反,其将交叉路口当作边,而把连接的马路当作节点,这样的方式虽然不直白,但在很多研究中有着第一种方法所没有的好处。

2.2 研究中面临的问题

目前,复杂网络理论已经在多个领域内取得了不错的发展,但是在城市交通网络上并没有太长时间的研究,在与城市交通网络的融合和描述上还有出入。但随着复杂网络在城市交通网络中的不断运用,会有更多的相关研究成果,这样能够促进两者更好地融合,从而为城市交通网络的发展做出更大的贡献。笔者分别从网络实证研究和网络演化机制两个方面来对城市交通网络复杂性进行阐述。

2.2.1 网络实证研究

网络实证研究能够有效地确定每个参数的基本意义,对一些忽略的系统宏观性质进行探寻。从目前的情况来看,网络的实证研究主要在于城市的网络道路建设和城市的公共交通网络建设。

(1)城市的网络道路。有关城市的网络道路建设早在十多年前就进行了研究,科学家通过对不同国家城市道路网络的研究得出,一般的道路交通量服从幂律分布,并且通过进一步研究发现,这些研究中的城市网络均为无标度网络,这就体现出了复杂网络中小世界的特征。

(2)城市的公共交通网络。相比于城市的道路交通网络,城市的公共交通网络的数据更加准确,研究起来也相对简单。根据中国相关城市的公共交通网络进行分析,公共汽车网络的分布呈指数分布。在此基础上对公共汽车网络的演化过程进行了模拟,结果与理论符合情况良好。此外,据国外文献记载,在对国外众多城市的公共交通网络进行研究后可以看到,这些网络都存在小世界的特性,城市交通网络均符合幂律分布或指数分布。上文已经介绍了城市交通网络的描述方法及一些常用的统计参数,但仅有这些还不够,还需要寻找更好的描述方法和更为有效的统计参数来刻画、分析城市交通网络的复杂性。

2.2.2 网络演化机制

网络演化机制研究是探索具有特定统计性质的网络形成机理的重要手段,主要涉及网络演化中的5类事件:加点、加边、重连、去边、去点。此后,涌现了大量关于网络演化机制的研究,为发现复杂网络形成机理以及进一步研究复杂网络上的动力学行为奠定了坚实的基础。就城市交通网络而言,主要研究网络无标度性和流量集中性两个方面。

(1)网络无标度性。目前,对无标度网络的演化机制研究主要集中在优先连接和Hub节点形成这两个方面,这些研究大多是对抽象的网络进行研究,而对于实体城市交通网络的研究并不常见。文献通过建立模型将优先连接和距离选择联系起来,从而搭建了无标度性与空间网络的桥梁。文献提出了一种基于预期效用最大的加点模型,并深入分析了地理信息的引入对网络度分布、聚类系数和匹配方式的影响。此外,对于无标度网络的演化机制研究,文献的部分研究结果也可借鉴。

复杂网络分析例3

一、引言

在1978年之前,中国一直实行建立于社会主义制度上的经济和金融系统。中国人民银行(PBC)不仅发行货币,而且是国家经济计划的中心。从1979到1992年经历了第一阶段的改革,形成了两个银行体系,从中国人民银行(中央银行)中分离出四大国有银行。当时四大国有银行之间的功能高度细分,明确的分工范围使它们互相之间并无竞争。1992年之后,为了提高银行业的竞争,政府建立了新的小以及中等大小的商业银行。在这一阶段,四大国有银行仍处于垄断地位,与其他商业银行之间的竞争并不明显。在1994年又先后建立三家政策性银行(国家开发银行,中国进出口银行,中国农业发展银行)将政策性业务从商业银行中分离开来。在这一阶段还建立了城市商业银行,农村商业银行,农村信用合作社,邮政储蓄银行等,使中国银行业形成了多层次的银行体系。多层次的银行体系使银行业务重复并且交叉混合,而企业与银行的关系也逐渐改变,企业融资向多银行信用关系转变,银行与银行之间的竞争不断加剧。

自从Watts[1]等提出了小世界网络,Barabási[2]等提出了无标度网络,复杂网络理论的应用已经逐渐渗透到自然,工程,生物,物理,社会科学等各个领域。Allen[3]等应用复杂网络方法对金融问题进行分析,发现银行网络结构的不同对风险的传播程度以及传播途径具有一定影响。Souma[4]等将复杂网络方法应用于日本经济系统,构建了包含银行和企业两种类型节点的网络,实证分析发现银行网络具有无标度特性,度分布服从幂率分布。万阳松[5]等对银行网络结构特征进行研究,发现银行间市场网络具有同质性的特征。厉浩[6]等通过应用复杂网络理论对银行间的网络结构进行分析,构建了随机-无标度混合演化网络模型和扩展随机-无标度演化网络模型,研究发现随着银行间市场的择优行为程度的增加,网络会从随机演化网络向BA无标度演化网络演化。

以上大量国内外研究表明,银行网络的确存在典型的复杂网络结构特征,如无标度特征,集聚性特征,层次结构特征等。而采用复杂网络方法对银行竞争关系的研究却比较少,本文通过复杂网络分析方法,以沪深A股上市公司长期贷款数据为研究样本构建银行竞争关系共同网络模型和加权竞争关系网络模型。研究银行网络的拓扑结构属性,分析银行竞争结构,有利于描述银行贷款竞争关系,促进银行业的有效竞争和健康发展,对维护银行系统稳定以及规范银行市场竞争行为有一定意义。

二、银行贷款竞争网络模型的构建

(一)银行贷款竞争关系共同网络模型

银行与企业的信用关系可以构成一个网络,而这个网络中包含企业与银行两个对象,所以称为二分网络(bipartite network),又称为隶属网络。通过网络映射的方式使银行与企业信用关系的二分网络转化为只有银行这一个对象存在的银行竞争关系共同网络。在这个网络中以银行为节点,如果两家银行与相同的公司存在信用关系,则就在这两家银行之间连一条边表示银行之间的竞争关系,从而构建出银行竞争关系共同网络模型。数学表达式为,其中代表银行集合,代表银行,代表银行之间贷款竞争关系的邻接矩阵。

(二)加权竞争关系网络模型

不同的银行具有不同的能力以及影响力,从而形成了在市场上不同的竞争地位。对于一个银行来说,面对地位不同的竞争对手,其感受到的竞争压力也是不同的。因此引入了市场共同度的概念。市场共同度(market commonality)[7]是指目标企业A和竞争对手企业B共享市场的程度。根据市场共同度的概念,采用银行贷款额对银行间的竞争压力进行量化。从而在银行竞争关系共同网络模型的基础上,将银行间的竞争压力作为边权构建加权竞争关系网络模型(weighted competitive relationship network)。市场共同度如下式所示

(1)

其中, 为银行B相对于银行A的市场共同度;k为向银行贷款的公司,k=1,2,3…;PAK为银行A贷款给公司k的金额;PBK为银行B贷款给公司k的金额;PA为银行A的贷款额总和,Pk为公司k的贷款额总和。PAk/PA是k公司在A银行的贷款额占A银行总贷款额的比例,表示k公司的贷款对于A银行的重要程度;PBk/Pk是k公司在B银行的贷款额占k公司的总贷款额,表示B银行的入侵规模。所以银行B相对于银行A的市场共同度为银行B在所有公司贷款业务上给A公司施加的压力,即B银行给A银行带来的竞争压力。

三、样本数据的选择与说明

数据的可获得性是在经济社会方面进行复杂网络建模所面临的困难之一,其原因有两个,首先个人难以获得并收集大规模的经济数据;其次一些涉及营业额,利润,市场份额的数据属于商业机密无法获取,这导致了复杂网络这种需要一定数据量的分析方法无法应用于许多经济商业领域。为了保证数据的权威性,合法性以及代表性,本文研究的银行贷款竞争网络的数据样本是沪深A股上市公司在2012年的银行长期借款。这保证了数据的可获得性,短期借款受客观条件如金融大环境,信贷政策,和主观条件如公司的经营情况的影响较大,而长期借款则减少了这些影响。

根据前述的竞争网络建模规则,利用样本数据,构建了银行贷款竞争网络拓扑结构形态图。其中包括一个最大连通子网络和两个孤立点,两个孤立点分别属于城市商业银行和农村信用合作联社,它们都只向一家公司发放贷款,而相对的公司也只与这一家银行存在信贷关系。

四、银行贷款竞争网络模型特征分析

(一)节点度及节点度分布

节点度,简称为点度(degree)指一个顶点拥有的连线数量,即

(2)

其中N为网络的节点集合。在银行贷款竞争网络中,一个代表银行的节点的点度越高,表示银行的竞争力能直接影响和支配更多的银行,所以这个节点在整个网络中拥有更高的地位以及重要性。在网络中节点最大度为76,为中国银行,最小点度为1,为天津银行,南京银行等,平均值为14。通过软件对节点度分布经行拟合,得到节点度分布的幂率指数为,可决系数。因此节点度符合幂率分布。

(二)节点度与节点强度相关性分析

节点强度(vertex strength),也称为点权,指与节点关联的边权之和,即

(3)

其中,Ni为节点的邻点集合,Wij为连接节点i和j之间边的权重。加权竞争关系网络模型是在银行竞争网络模型基础之上,根据银行间的市场共同度为边权构建起来的,节点的强度表现了不同银行贷款的竞争能力。节点度与节点强度之间的相关系数可以衡量与银行贷款有竞争关系的银行数目和该银行竞争实力之间的相关程度。节点度-节点入度权相关系数为0.878,大于0,表现出强相关,节点度-节点出度权相关系数为-0.230,小于0,表现出弱相关。即指在市场中银行所拥有的竞争对手数量与其施加于对手的竞争压力强正相关,而银行所拥有的竞争对手数量与其所受到的竞争压力弱负相关。这表明银行的竞争实力越强,就有越多的竞争对手,而收到越少的竞争压力;并且,银行的竞争实力越弱,竞争对手越少,而受到的竞争压力却越强。

(三)同配性

为了研究银行贷款竞争网络是否具有同配性,从节点的邻点平均度进行研究。邻点平均度(ANND,Average Nearest-Neighbor Degree)[8]是指与节点i相邻的节点的节点度的平均值,可以用于度量节点的邻接节点在网络中的连接程度。点度大的银行与点度大的银行进行竞争的现象称为同配性;而节点度大的银行与节点度小的银行进行竞争的现象称为异配性。在银行贷款竞争网络中分析邻点平均度与节点度的相关性,ND-ANND相关系数为-0.593,小于0,说明银行贷款竞争网络为异配性网络,存在节点度大的银行与节点度小的银行竞争的现象。这可以在银行贷款竞争网络中存在紧密联系着的并且拥有较大的竞争力和影响力银行云集团,而这些拥有较大竞争力的银行同时也与较小的银行存在竞争关系。

(四)聚类系数

我们发现在许多网络中存在节点的邻点互为邻点的情况,这种性质称为集聚性,网络的集聚性可以用网络聚类系数(Network clustering coefficient)加以描述。网络聚类系数可以通过各个顶点的顶点聚类系数计算出来。顶点聚类系数指在该顶点的邻点中,直接相连的邻点对占所有可能存在的邻点对的比例。即

(4)

其中 表示与节点直接相连的节点数, 表示 在个节点间可能存在的最大边数, 表示实际存在的边数。由此可见,只有一个节点至少拥有两个邻点才能够算出顶点聚类系数。网络聚类系数为所有顶点聚类系数的平均值,即

(5)

C的取值在0到1之间,当C=1时表示在这个网络中所有节点两两之间都直接连接。银行竞争贷款网络的网络聚类系数为0.40349,数值较大。这反映出银行贷款竞争网络的集团化程度较大,一个银行的对手银行之间互相也存在竞争关系,说明银行之间存在较为激烈的竞争,这也说明银行贷款客户的重合性非常高,银行之间的竞争趋向同质化。

(五)平均最短路径长度

网络中两个节点之间经历边数最少的一条简单路径的边数称为两节点之间的距离[9]。网络的直径D定义为所有距离中的最大值。平均最短路径长度L定义为所有节点对之间距离的平均值,即

(6)

其中N为节点数, 为节点i与节点j之间的距离。银行贷款竞争网络的网络直径为4,平均最短距离为1.97875,这表明在银行竞争网络中,一个银行平均只需要通过2个中间银行就能找到有与之有竞争关系的其他银行。其平均最短距离较小,而聚类系数较大,说明银行贷款竞争网络具有小世界特征。

五、结论

本文以沪深A股上市公司2012年的银行长期借款为样本构建了银行贷款竞争关系共同网络模型,并以此为基础将市场共同度构建作为边权构建了加权竞争关系网络模型。实证研究发现银行竞争网络的节点度服从幂率分布;点度-节点入度权为强相关,节点度-节点出度权为弱相关;较大的集聚系数与较小路径长度表明此网络具有小世界特性;通过对银行竞争网络模型进行分析,发现国有大型商业银行在银行系统中仍然拥有较高地位,虽然竞争对手众多但是受到的竞争压力却并不大,全国股份制商业银行内部的竞争非常激烈,受到较大的竞争压力。随着竞争的加剧以及银行竞争的趋向同质性,国有大型银行的影响力将会下降,将有更多的全国股份制商业银行加入网络的核心集团对银行系统产生更大的影响力。

本文只采用复杂网络方法对银行贷款竞争关系进行了初步的探索,仅仅分析了其网络模型的一些拓扑结构属性,还有许多问题有待进一步的研究,比如银行竞争网络模型的演化机制,银行竞争地位的变化对贷款定价的影响,对银行间风险的分担以及对整个银行系统的影响。

参考文献:

[1] Duncan J Watts,Steven H Strogatz .Collective dynamics of‘small-world’networks [J].Nature,1998,393(6684):440-442.

[2] Albert-Laszlo Barabási,R Albert .Emergence of scaling in random networks [J].Science,1999,286(5439) :509-512.

[3] Allen F,D Gale.Financial Contagion [J].Journal of Political Economy,2000(108):1-33.

[4] Souma W,Fujiwara Y,Aoyama H .Complex Networks and Economics [J].Physica A:Statistical Mechanics and its Applications,2003,324(1/2):396-401.

[5] 万阳松,,陈晓荣 .复杂银行网络的宏观结构模型及其分析[J].上海交通大学学报,2007,41(7):l161-1164.

[6] 厉浩,陈庭强,何建敏 .复杂网络理论的银行间市场网络结构演化模型[J].北京理工大学学报,2012,14(2):71-76.

[7] Mcpherson M .An ecology of affiliation [J].American Sociological Review,1983,48(4):519-532

复杂网络分析例4

引言

战略网络是由不同利益成员构成的系统,由于各成员目标可能不同,每个成员都以自身利益最大化为目的参与合作,所以战略网络中存在不可避免的矛盾。目前国内外对于战略网络节点管理的研究角度多偏向于生态学理论、博弈论及系统论,对企业战略网络节点选择、节点数量及节点的进退机制进行研究。复杂网络研究的不同之处在于:从统计的角度出发,考察网络中的大规模节点以及节点之间的连接性质,这些性质的不同意味着网络内部结构的不同,而内部的结构不同将导致网络系统的功能不同。利用复杂网络理论,可以分析网络中各节点的重要程度,反映各个环节的瓶颈问题。还可以用来发现网络中的关键节点,从而对网络进行有针对性的优化,进而达到整体网络的优化。

复杂网络理论在企业网络中的应用

科学家们发现大量的真实网络既不是规则网络, 也不是随机网络,而是具有与前两者都不同的统计特征的网络,这样的一些网络被科学家们叫做复杂网络(Albert R,Albert-Laszlo B,2002;Newman M E J,2003)。复杂网络被发现具有很多与规则网络和随机网络不同的统计特征,其中最突出的是小世界效应和无尺度特性(Drik Helbing,2006;Christian Kuhnert,Dirk Helbing,2006;Marco Laumanns,Erjen Lefeber,2006)。由于现代企业网络越来越具有复杂性和不稳定性特点,复杂网络理论在企业网络方向上的应用也逐渐成为研究热点。

李守伟、钱省三(2006)在对产业网络供应链的复杂性研究中发现,我国的半导体产业的供应链条符合无标度网络的特征。此外,阮平南、李金玉(2010)将复杂网络理论用于战略网络,阐述了战略网络的无标度特征,建立了BA演化模型,解释了无标度网络演化的过程,进而解释了战略网络中核心节点的形成。庞俊亭等(2012)探索了集群创新网络所具有的小世界和无标度结构特性及集群网络在受到攻击时所具有的稳健性和脆弱性。

目前多数研究侧重定性研究网络的复杂网络特性及演化研究,有充分考虑企业网络的动态适应性问题,没有考虑到系统整体运行规律。另外,以网络效率为标准,研究网络中的节点重要性方面的文献还是很缺乏的。本文试图以复杂网络理论为基础,从这一全新视角来研究战略网络中重要节点识别问题。

战略网络的复杂网络特性分析

(一)战略网络拓扑结构

战略网络就是由那些具有战略意义的组织或个人组成的社会网络。它是由消费者、市场中介、供应商、竞争对手、其他产业的企业、利益相关者、其他组织和企业本身等节点构成的(见图1)。

用复杂网络理论研究战略网络,首先应将战略网络抽象成拓扑模型。将战略网络中的企业、科研机构、政府等作为网络中的节点。节点确定以后,根据各节点的实际联系确定是否存在边的关系。作为核心的网络节点企业存在众多的合作关系,这就导致战略网络的节点的边越来越多。为了能比较好地模拟出一个战略网络,根据战略网络的基本结构,描绘出一个简单战略网络拓扑图,如图2所示。

(二)战略网络的复杂特性

1.战略网络的小世界网络的特征。平均路径长度是指在网络中将两点间的距离被定义为连接两点的最短路所包含的边的数目,把所有节点对的距离求平均,就得到了网络的平均距离。网络的平均路径长度L(N)定义为任意两个节点之间的距离的平均值,平均路径长度表示产品的交付时间。为在保持激烈竞争环境中的优势,企业必须采取以下对策:重组整合,减少补给提前期,加快信息的流通速度,减少产品运输距离,提高自身的反应能力和适应变化的能力,建立配送物流中心,以便能够更好地实现准时供货。基于时间的竞争战略对于各节点成员来说是至关重要的,如何以最短的时间将产品交付给客户成为节点企业参与战略网络竞争必须应对的关键战略问题。在战略网络环境中,企业之间的平均最短路径,可以体现为产品或服务从一个环节到另一个环节所需要的平均最少中转数目。整个网络的平均最短路径L的计算公式为:

上述公式中,dij表示产品或服务从环节i到达环节j所需的最少中转次数,N表示战略网络中的企业总数。

聚集系数指与节点相邻的节点之间实际存在的边数与这些节点都互连的最大边数之比,网络中所有节点聚集系数的平均就是网络的聚集系数。对于战略复杂网络而言,平均聚集系数相应于网络节点企业之间相互交流的程度,随着信息高速发展时代的到来,越来越多的企业应用信息技术和互联网的媒介建立彼此之间的连接。通过信息共享的各种途径促使各节点企业之间联系更加紧密,交流更加频繁,这就体现战略网络具有较高的聚集系数。

2.战略网络复杂网络的无标度特征。无标度网络的特点是网络中的大部分节点的度值都很低,但存在着度数非常高的核心节点。各节点企业在企业网络中所处的网络地位不同,战略网络中的核心企业形成占有的知识不均匀,节点间的连接就具有择优性(Boschmma R A,Wal A L J,2007)。战略网络核心节点的形成主要来源于择优连接机制,在战略网络中,组织会倾向于选择连接数目较多的网络节点。通常一些节点企业通过先进的技术、富有竞争力的产品和良好的管理,在非常短的时间内获得大量的关系连接;网络中存在历史较长的企业,有较长的时间来积累与其它组织的关系连接。核心节点的连接数目远远超出了一般的节点,并且网络主要由这些核心节点所支配。

战略网络节点重要性模型构建

在复杂网络中,节点度是单个节点极其重要的属性节,点的度直接反映该节点在网络中与其他节点相联系的广度,定义为邻接矩阵中与该节点连接的其他节点边的数目。传统复杂理论中判断核心节点方法是依据网络中节点度或点强度参数,这个方法是具有很大片面性和局限性的。节点度高的企业只能说明企业与周围企业的联系程度密切,而不能真实地反映出该企业在网络中的作用和地位(朱大智、吴俊,2007)。因此本文将以网络效率为依据,从新的视角出发对战略网络中的节点进行重要性识别。

(一)战略网络的网络效率建模

网络效率指标被用来衡量网络中点与点之间的信息沟通程度。在战略网络中最短路径长度反映了战略网络内各节点企业产品交付时间的效率。路径越长,企业获取资源的时间越长,效率就越低;反之,路径越短,资源获取的时间成本越低,效率越高。为了计算网络效率E,首先要建立这样一个网络模型。假设忽略所有企业内部信息,只考虑企业间的联盟关系;任意两节点间的连接度是等值的。设网络G是一个无重边的无向网络,即网络中的边没有固定的方向,用G=(N,K)来代表,N是网络中节点集合,K是网络中边集合,G的邻接矩阵A=(aij)定义如下:

则A是一个n阶的对称矩阵,如果两个节点之间有联系,aij=1;否则aij=0。

假设节点i与节点j间的连通的效率eij与最短路径成反比,即eij=1/dij。那么,给出如下的战略网络效率计算公式:

(1)

上述公式中,eij表示完全连通情况下两个节点企业之间的效率。在突况下,加入变量wij,即网络效率因子。0≤wij≤1,作为企业连通效率参数。Wij=1表示相关节点企业正常运营。在遭遇突况下,Wij将降低,取0≤wij≤1。这样可以比较真实地模拟出企业在面对不同风险时,网络出现效率变化的情况。随着wij的变化,与该企业有贸易往来的相关企业均会受到一定程度的影响,将导致整个网络的效率会出现非线性的变化。通过评价网络的效率,可以尝试改善网络的构造从而优化网络的效率,网络的效率得以提高,使网络更具稳定性。

(二)战略网络中重要节点的识别建模

网络效率E无疑成为衡量战略网络效率有效的指标,然而它只能表现网络的平均水平,因此需要更深入的研究,识别网络中的关键节点。此方法主要考察的是当从网络中剔除节点i以后,网络的效率变化,根据节点对于网络效率影响能力的大小,可以识别网络中的关键节点。

E=E=E(G)-E(G`) i=1,2,……N (2)

E(G`)表示wij变化时的网络平均效率。根据网络效率变化的大小对网络中节点的重要性指数进行排序,在wij一定的情况下,网络效率变化值较大的节点无疑是网络中重要性相对较高的节点。也就是去除该节点后,网络效率下降越大,说明该企业的重要性越高。针对企业对于网络整体的作用不同,需加强预防工作,做到真正的防患于未然。对于这些重要节点,必须予以重点关注,例如,更加频繁地关注它的运作状况、与其他企业的连通状况,建立完备的预警机制等。

结论

基于网络整体的考虑,本文运用复杂网络理论,侧重从宏观整体的角度去分析单独的点和整体网络之间的关系,通过建立网络拓扑结构、衡量网络效率、识别重要网络节点三个方面,阐述了复杂网络在战略网络管理中的应用前景。建立数学模型比较真实地模拟了网络在正常情况和突况下的网络效率。本文只是从复杂网络理论的角度讨论通过战略网络效率的办法计算节点重要性,而由此识别出来的重要企业也是具有现实意义的。

参考文献:

1.Albert R,Albert-Laszlo B.Statistical mechanics of complex networks[J].Reviews of Modern Physics,2002(74)

2.Newman M E J.The structure and function of complex networks[J].Siam Review,2003(45)

3.Drik Helbing.Information and material flows in complex networks[J].Physica A,2006,363(1)

4.Christian Kuhnert,Dirk Helbing.Scaling laws in urban supply networks[J].Physica A,2006,363(1)

5.Marco Laumanns,Erjen Lefeber.Robust optimal control of material flows in demand-driven supply networks[J].Physica A,2006,363(1)

6.李守伟,钱省三.产业网络的复杂性研究与实证.科学学研究,2006(4)

7.阮平南,李金玉.战略网络中基于无标度网络的核心企业形成研究.科技管理研究,2010(16)

复杂网络分析例5

一、引 言

产业集群指同一产业的企业以及该产业的相关产业和支持产业的企业在地理位置上集中[1]。产业集群中上下游企业之间是一种需求与供应关系。

随着复杂网络理论和方法的不断发展,国内外很多学者开始把产业集群与复杂网络结合起来进行研究。当前基于复杂网络的产业集群研究主要集中在对产业集群网络整体模型及其演化,缺少对其抵御风险能力的分析,本文设计了一个产业集群复杂网络模型,针对不同类型节点退出网络时分析该产业集群网络模型抵御风险能力的变化情况。

二、产业集群复杂网络模型

(一)模型概述

在产业集群复杂网络模型中,首先根据企业在产业链中的位置把产业集群中的企业抽象为上游、中游和下游企业三类。设定三类企业的连接方式为:上游企业和下游企业只能与中游企业连接,中游企业可以与上游和下游连接。节点间的连接用有向边表示。

(二) 产业集群网络模型构建与演化过程

产业集群网络模型以BA网络模型和LC局域世界演化模型为基础,具体构建过程如下:1.在产业集群复杂网络模型中,网络中初始状态为m0个节点,e0条连边。把m0个节点随机分配给三种不同节点,网络中节点间的连边为随机生成。2.每隔一个时间间隔t向网络中引入一个新节点i,如果新节点为分别为上游企业、下游企业和中游企业,则携带边数为m1、m2和m3,局域世界分别为中游企业、中游企业、上游与下游企业。3.当新节点i与网络中的相应节点连接时,其连接概率按照以下公式择优进行:

其中为网络中的节点j获取新节点i连边的概率,为节点j的度。4.根据新节点i的类型不同,在局域世界中选择m(m

三、产业集群网络模型风险衡量指标

产业集群网络中的企业节点退出网络后会使整个产业集群网络的功能受到影响,当退出企业较多时,会使整个网络失效。本文中选取产业集群网络受到节点退出影响后产销链条能否保持完整作为产业集群网络抵御风险能力的度量指标。产业集群网络中的某些企业节点由于政策、经营等风险因素退出后,会形成互不连通的多个子产业集群。其中规模最大的称为最大有效子子产业集群。通过统计由于攻击被去除的企业数占原产业集群网络总企业数的比例与最大有效子产业集群的规模S的关系来衡量产业集群网络的风险抵御能力。

四、产业集群网络节点风险衡量指标

产业集群网络中一个企业的退出,如果严重影响了该网络的产销功能或物流能力,则称该企业节点为高风险节点。本文中我们使用度和介数指标来区分不同的节点,其中产业集群网络中节点企业的度指一个产业集群节点企业所连接的其他节点企业的个数,介数为通过该节点的最短有效路径的条数,度量这两种节点退出网络后产业集群网络抵御风险的能力。

五、 仿真模拟与讨论

图1 产业集群网络最大有效子产业集群的规模变化情况

产业集群网络模型的初始节点企业数均设为30个,上游企业、中游企业和下游企业加入产业集群网络时所带的边数分别设定为6、10、6。网络加入的上游企业、中游企业和下游企业的个数分别为480、800和1280。从图1中可以看出,随机退出和高风险节点退出造成的产业集群网络最大有效子产业集群规模的变化趋势是相同的,均呈现逐渐下降的趋势。随机退出的方式下产业集群网络最大有效子产业集群规模随着去除节点企业比例的增加下降相对比较缓慢,而采用高风险节点退出的方式时,产业集群网络最大有效子产业集群规模随着去除节点企业比例的增加下降非常迅速。

复杂网络分析例6

中图分类号:F407文献标识码: A

Complexity Analysis of Mechanical Equipment Suppliers

Author

Abstract: In order to improve the management level of equipment suppliers, an analysis method of equipment suppliers based on complex network theory. Firstly, the supplier network is constructed, in which the nodes are abstracted from the equipment and suppliers and the edges are abstracted from the relationship between nodes. Then, some characters of network are defined, such as degree and betweenness. Finally, a NC is studied as an example to illustrate feasibility of the method.

Key Words: Equipment supplier; Complex network theory; Complexity analysis

引言

机械设备向着精密化、复杂化的角度发展,因此在设备制造过程中需要多家供应商协同参与,共同完成制造过程。如何充分利用外部资源,通过对供应商的整合来提高供应商管理水平,提升企业的整体效率、降低运行成本,对于企业发展具有重要意义。目前对于设备供应商管理的研究集中在供应商管理模式、管理绩效评价、管理策略和特定行业的应用研究等几个方面[1-4]。以上的研究多是着眼于整体供应链,从整体的角度构建、分析供应链的性能指标。从具体设备的角度出发,构建设备供应商网络,进行复杂性分析,对于精确控制设备供应商网络性能,提高设备设计制造过程可靠性,具有一定的意义。

设备供应商网络的构建

机械设备可以依据功能独立原则分解为多个相对独立的子模块。其中,一个子模块可以由多家供应商进行供应,一家供应商也可以提供多个子模块,因此供应商和设备模块可以形成一个网络,称之为设备供应商网络。

从复杂网络角度,网络可以表示为,其中表示网络内的节点,表示网络内的节点间的边,表示网络内的节点间边的权重[5]。下面将从这几个方面论述设备供应商网络的生成。

节点

网络中的节点有两类,设备节点和供应商节点。设备节点是指在制造过程中,对设备进行合理划分后得到的子单元,一般作为一个独立部分处理,比如机床的床身等。对于设备节点的划分层次有粗有细,取决于制造的实际需要,一般要考虑功能和结构正交的原则。供应商节点是指为设备节点提供设备的节点,是由实际供应商抽象而来的。一个供应商节点可以供应多个设备节点,同理,一个设备节点也可以由多个供应商节点进行供应。

边也有两类,设备节点间的边和设备节点与供应商节点间的边。设备节点间的边表示设备间的装配关系,而设备节点与供应商节点间的边则表示供应关系。目前没有考虑供应商之间的关系。

权重

本文中权重取0-1,即节点间有边的,权重为1,反之为零。

供应商网络构建方法

在获得网络的元素后,网络的构建可以根据如下顺序进行:

Step:1 对选定的设备依据功能独立原则进行分解,得到子模块;

Step:2为每个子模块分配合适的设备供应商;

Step:3 构建网络;

Step:4 检查网络。如果符合要求,则结束。否则转向Step1。

网络分析指标

从抽象网络的角度看,所有的网络都可以用一些特定的指标进行描述,如度、介数、聚集系数、平均聚集系数和鲁棒性等。通过这些指标可以反映网络的某些特性,为我们了解和改进网络性能提供帮助。

典型拓扑特性指标

拓扑指标是指描述网络自身特性的指标,对于复杂网络来说,一些指标是通用的,比如度、介数等。这些指标从不同的 角度描述了网络的特性,可以通过这些指标来发现和控制网络的质量,已达到提高供应商管理的目的。

表 1 复杂网络拓扑指标

指标名称 表达式 意义

度 网络中与该节点相连的节点的数目

介数 节点在网络中的重要性

聚集系数 量化网络中节点聚集成团的趋势

平均聚集系数 网络中所有节点的聚集系数的平均值

鲁棒性 网络中一个或数个节点发生随机故障或者遭受蓄意攻击后,网络仍能保持联通的特性

需要指出的是,上表中的意义是指节点在网络中的抽象意义。结合具体的网络语境,可以对其进行扩展,得到新的物理意义。

下面以节点的度为例,描述拓扑指标的物理意义。节点度的基本意义是指与该节点相连的节点的数目,分为出度和入度。结合供应商网络的具体意义,可以将度的意义拓展。针对设备节点来说,重点考察的是节点的入度,即该节点可以由多少节点供应,表示该设备可以由多少供应商提供;对于供应商节点来说,重点考查的是其出度,即该节点可以为多少节点提供服务,表示该供应商可以提供多少设备。

其余指标的意义在此不再赘述,可参照该方法进行扩展。

算例

为了验证本文提出的方法,下面以某型号的数控加工中心为例,构建了供应商网络,并对其中的指标进行了讨论。

图 1 数控加工中心及供应商网络

该数控中心的三维模型如图1中的(a)所示,可以分解为基础部分、自动换刀装置、主传动系统、伺服进给系统等功能相对独立的子模块。各个子模块的供应商包括西门子、德玛吉、三菱等,如图1中(b)部分所示。因为供应商较多,这里只给出了部分。根据文中提出的建模方法,可以构建出数控加工中心的供应商网络,如图1中的(c)部分所示,一共80个节点,包括21个设备节点,59个供应商节点。

通过计算,可以得到设备节点的入度,如图2所示。从图中可以看出,大部分设备的供应商较为充足,可以满足制造过程需要。节点12,9和15的入度较小,说明所对应的设备模块的供应商较少,存在一定的供应风险,应该提高这些节点的供应商数量,以保证制造过程的顺利进行。

图 2 设备节点入度

供应商节点的出度如图3所示。从图中可以看出,节点29对应的供应商出度最高,说明该供应商的供应能力更强,可以为设备制造过程提供更多的支持。而节点38到节点43,节点61到节点80所对应的供应商的出度较低,说明这些供应商的功能应能力较弱,只能为制造过程提供部分支持。在供应商管理过程中,要注意出度高的节点的管理,适当扩大出度低节点的数量,一方面可以保证设备的供应,另一方面可以扩大选择的范围。

图 3 供应商节点出度

网络节点的介数如图4所示。从图中可以看出,只有少量节点具有较大的介数,大部分节点的介数都非常小。该现象的物理解释就是,该网络是一个严重异质的网络,少数节点起到非常重要的作用,大部分节点起的作用都很小。

图 4 网络节点介数

网络节点的聚集系数如图5所示。聚集系数表征的是网络中节点的交汇和合作程度,从图中可以看出,设备节点的聚集系数较高,供应商节点的聚集系数很低。通过网络的物理意义可以给出相应的解释:所有供应商节点的都指向设备节点,因此设备节点的聚集系数较高;而供应商节点间不存在合作关系,因此聚集系数较低。

图 5 网络节点聚集系数

网络的鲁棒性如图6所示,给出了随机出错和蓄意攻击情况下的网络效率。通过图中可以看出,在随机出错情况下,大约25%的节点出错后,网络的效率会下降至原来的一半。在蓄意攻击情况下(按照节点介数高低进行删除),在15%的节点出错是,效率就会下降为原来的一半,因此该网络具有一定的鲁棒性。

图 6 网络鲁棒性

结论

本文从复杂网络理论出发,提出了机械设备供应商网络的概念,并对网络的生成、常规指标计算等进行了详细讨论,并以某型号数控加工中心为例对本文提出的方法进行了验证。通过以上研究,可以得出如下结论:

1)从产品角度出发,采用复杂网络理论构建供应商网络,可以更好地发现设备供应过程中的薄弱环节,提高供应商管理水平

2)网络的拓扑指标具有特定的物理意义,在不同的语境下可以进行扩展,得到新的物理意义,用来指导网络研究

3)通过某型号数控加工中心的算例,表明了本文方法的可行性。

参考文献

[1] 周梅芳. 中小企业供应商管理指标体系研究[J]. 中小企业管理与科技, 2014,(1):27-28.

[2] 汤传毅, 万融. 论现代企业供应商管理的新模式―生态型供应商管理[J]. 企业经济, 2004,(3):21-22.

复杂网络分析例7

车载自组织网络;复杂网络;抗毁性;随意攻击;蓄意攻击;仿真

中图分类号: TP393.1 文献标志码:A

0引言

移动Ad Hoc网络(Mobile Ad Hoc NETwork, MANET)是一种自组织无线网络,由于它不需要基础设施支持,因此网络部署快速,扩展方便,使得它被广泛应用于军事、救灾、商业等各领域。近年来,城市车辆与日俱增,移动网络技术日益突破,车辆自组织网络(Vehicle Ad Hoc NETwork, VANET)[1]作为一种特殊的MANET网络也快速引起高度重视。在VANET中,在一定的区域内使用无线网络通信技术将车辆与车辆以及车辆与固定基础设施连接在一起,从而一个车辆间多跳通信网络在现有道路上被动态、快速地构建,且具有自组织、分布式控制的特点,因此,VANET在交通方面具有良好的应用前景,如信息预警、行车安全、车辆之间通信及车辆Internet访问等。

VANET既具MANET网络的特点,如拓扑结构动态变化、自组织无中心、低带宽等,又有自己的特点,比如快速移动性、拓扑变化频繁、间歇连通性、网络规模大、充足的能量供应等[2]。在VANET中,由于车辆的高速运动,网络拓扑随之变化,对网络性能造成直接影响,因此如果能够掌握VANET拓扑结构的动态特性,可以设计高效的拓扑控制算法,优化网络连通性,使网络能够持续稳定提供可靠的服务。抗毁性是评价网络拓扑特征的主要指标之一,通过抗毁性的研究可以发现网络中的安全隐患和薄弱环节,从而采取一系列有效的措施来提高网络的抗毁性,优化网络拓扑结构,保证网络的稳定的通信能力,这对拓扑动态变化的VANET协议开发和网络管理有着重要的意义。

目前,国内外对Ad Hoc网络的抗毁性研究较多。比如文献[3]研究了网络抗毁性受节点行为的影响,通过建立节点行为模型及分析三维网络连通性得到了三维MANET网络抗毁性的一种定量分析方法;同时仿真检验了它的有效性和合理性。文献[4]引入自然连通度为抗毁性度量指标,建立了能耗的移动Ad Hoc网络拓扑结构抗毁性综合测度模型,并确定了基于网络拓扑抗毁性的最优发射半径。Azni等[5]根据相关节点的行为建立了k相关抗毁性模型,通过仿真分析了Ad Hoc网络的全局抗毁性。文献[6]中有针对性地分别从失效成因、测度、提升策略与故障检测和修复等4个方面对无线传感器网络抗毁性的研究进行归纳和分类,着重探讨了基于网络重构和拓扑演化及路由控制的无线传感器网络抗毁性优化策略。

目前,对VANET拓扑结构的研究主要是基于复杂网络理论分析其网络的度分布、聚类系数、路径长度等。文献[7]以多Agent微观交通仿真器(Multiagent Microscopic Traffic Simulator, MMTS)为仿真工具,研究了瑞士城市苏黎世交通网络的瞬时特性,研究结果表明网络节点数服从参数幂律分布;通信半径越大,最大集团的值越大,集团的数目越少;VANET不存在小世界特性。文献[8]中利用4000多辆出租车收集的实时数据,分析了城市环境下车辆自组网的度分布、聚类系数、特征路径长度等拓扑特性,建立了一种车辆自组网的网络模型,通过仿真验证了所建模型的有效性。文献[9]以城市道路交通仿真软件(Simulation of Urban Mobility,SUMO)为仿真工具研究了德国科隆的交通网络的瞬时拓扑结构,其主要刻画参数包括最大连通分支、度及介数中心性等,分析结果表明车载自组织网不具有小世界特性。文献[10]应用Barabasi和Albert提出的BA(BarabasiAlbert)无标度网络对VANET拓扑进行建模分析,认为VANET具有小世界特性。文献[11]利用车辆全球定位系统(Global Positioning System, GPS)数据分析了VANET拓扑结构的动态演化特征。据研究所知,对VANET拓扑结构抗毁性的研究甚少,仅有文献[12]对VANET的抗毁性作了初步研究,但是该文认为VANET是无标度网络,然后用无标度网络模型产生VANET,事实上,这样生成的VANET就是一个无标度网络,与现实环境的VANET相差太远,几乎没有考虑VANET的任何特征,比如节点移动性、节点移动受到道路限制等,因此该文本质上是研究了无标度网络的抗毁性,并非VANET的抗毁性。

抗毁性是VANET拓扑结构的重要特性之一,它代表网络在某种极端攻击或错误条件下其服务能力下降的程度。由于真实、公开的VANET的trace比较少,而且能够获得的一些真实trace存在一些问题,比如GPS数据不完整、时间粒度、数据精度不够等,使得用真实VANET移动数据研究抗毁性存在一定困难,因此,本文通过VanetMobiSim车辆仿真软件,深入分析VANET的抗毁性特征,为网络拓扑结构的优化提供指导。

1VANET抗毁性研究方法及测度

1.1抗毁性研究方法

目前,抗毁性的主要研究方法是用不同的方式对网络进行攻击,用相应的测度指标对网络的抗毁性进行分析。网络攻击策略是指采取何种方式删除网络中的节点或边,在现有研究中主要应用Albert等[13]Albert提出的文献,与文献13的作者不匹配,请作相应调整,以便保持一致;要注意论文在正文中的依次引用顺序。提出的随意攻击(Random Attacks or Failure)和蓄意攻击(Intentional Attacks)两种方式。随意攻击通常是指随机选择网络的一个节点或边进行攻击,然后再随意攻击其余节点中的一个节点或边,直至将网络中所有节点全部攻击完为止。蓄意攻击又称为选择性攻击,选择重要的节点或边作为攻击对象,一般用度和介数度量节点和边的重要性。具体攻击过程为:首先选取网络中度或介数最大的节点或边作为第一攻击目标,攻击完以后重新计算网络各节点或边的度量等级,依旧对度量等级最高的节点或边进行攻击,重复该过程,直到网络中所有的节点全部被攻击完为止。

1.2节点重要度评估方法

蓄意攻击选择重要节点或边进行攻击,评估网络中节点或边重要性的方法很多,本质都源于图论及基于图论的数据挖掘。本文用度和介数评估车辆节点的重要性。

定义1节点的度。在网络中,节点vi的邻边数目ki称为该节点vi的度。网络的平均度为:

k=1N∑Ni=1ki(1)

直观上看,一个节点的度越大,该节点越重要。

定义2节点的介数。节点vi的介数Bi就是网络中所有最短路径中经过该节点的数量比例之和,即:

Bi=∑j,k∈V, j≠kNjk(i)Njk(2)

其中:Njk表示节点vj和节点vk之间的最短路径条数;Njk(i)表示节点vj和节点vk之间的最短路径路过节点vi的条数。介数是一个全局特征量,反映节点在整个网络中的作用和影响力。在VANET中,若一个节点的介数越大,则表明它在网络中交换的信息流越大,可视为网络中的核心节点,也意味着它更容易拥塞,成为网络的瓶颈。

1.3VANET抗毁性测度

设G=(V,E)为VANET的拓扑图,其中V={v1,v2,…,vN}是网络节点的集合,E={e1,e2,…,ek}是网络边的集合,节点数定义为N=V。定义子图Ci=G(Vi,Ei)为含节点vi连通分支,设m(G)=max1≤i≤nV(Ci)表示图G的所有连通分支中顶点数最多的那个连通分支的节点数,则节点数最多的连通分支为最大连通分支。

定义3最大连通度S。将网络中的最大连通分支中节点数与网络中总的节点数的比值称为最大连通度,即:

S=m(G)/N(3)

那么0

定义4连通分支平均规模s。当VAENT受到攻击后,网络被分割为若干连通分支,连通分支平均规模定义为去掉最大连通分支后其他连通分支的平均节点数,即:

s=(∑ni=1V(Ci)-m(G))/(n-1)(4)

显然0

定义5临界点移除比例fc。当网络中的节点受到攻击后,网络处于崩溃边缘时,网络中被攻击的节点数占总节点数的比例,称为临界点移除比例,记为fc。

网络在某种攻击模式下,百分比f的节点被移除,当f超过一定阈值,即f≥fc当在“=fc”时,属于哪种情形,需明确。时,网络分割成许多小的非连通分支;当f

设网络中任意两个节点vi与vj之间的距离dij为连接这两个节点的最短路径上的边数。VANET由于车辆的高速移动、拓扑变化频繁,使得网络间歇连通,因此存在dij=∞。而且当网络受到攻击时,网络的连通性也将发生改变,网络被破坏到一定程度时,会产生孤立节点,此时会存在dij=∞,因此,文献[13]提出用网络全局效率来描述非全连通网络的连通性。

定义6全局效率E。定义网络全局效率为:

E=1N(N-1)∑i, j∈V,i≠j1dij(5)

显然,网络全局效率越大,网络连通性越好。

2仿真实验

2.1VANET仿真环境

本文采用VanetMobiSim[14]软件建立VANET环境,移动模型采用带有车道变换的智能驾驶员模型(Intelligent Driver Model with Lane Changes, IDMLC)[15]。该模型是一种微观交通流模型,是在IDM的基础上增加了车辆在十字路口的管理及车辆换道功能的智能移动模型,使得其更加符合真实的交通场景。仿真实验中,网络节点即为运动的车辆,可以获取任意时刻任意车辆的位置、速度、加速度、所处车道等瞬时信息。IDMLC移动模型中车辆长度为5m,加速度a和减速度b分别为0.6m/s2和0.9m/s2,礼貌参数p为0.5,其他参数设置如表1所示。

2.2VANET抗毁性分析

下面分析在不同攻击模式下VANET的抗毁性,为了在图中便于区分不同攻击模型,用符号Failure、RD和RB分别表示随意攻击、基于节点度的蓄意攻击和基于节点介数的蓄意攻击。图1为网络中车辆数为200、不同通信半径时,VANET受到Failure、RD和RB等三种攻击时网络最大连通度的变化趋势。由图1可知,当通信半径r=200m, f=0时,S=0.3630,即初始网络连通性较差。在攻击过程中当最大连通度低于0.1000时,视网络基本瘫痪。在随意攻击下,当S为0.0911时,临界点移除比例fc=53.42%;在RD攻击下,当S为0.0616, fc=28.77%;在RB攻击下,当S为0.0890时, fc=20.55%。当r=400m, f=0时,S=0.9521,初始网络近乎全连通(网络全连通时S=1)。在随意攻击下,当S为0.0747时, fc=82.19%;在RD攻击下,当S为0.0822时, fc=57.53%;在RB攻击下,当S为0.0959时, fc=36.99%。这一方面说明了通信半径越大,VANET连通性越好,临界点移除比例fc越大,抗毁性越强;另一方面,当通信半径相同时,随意攻击的临界点移除比例fc的值均大于蓄意攻击模式的,因此VANET有较强的鲁棒性,且在蓄意攻击下,由于将重要节点移除后网络迅速分割为多个连通分支,S先呈现迅速大幅度下降、然后缓慢下降趋势,即VANET又具有脆弱性。这种既鲁棒又脆弱的抗毁特征是VANET中车辆度分布不均匀所致。

图2为网络中车辆数为200、不同通信半径时,VANET受到Failure、RD和RB三种攻击时的网络连通分支平均规模。由图2可知,当通信半径较小(如r=200m)时,初始网络连通性较差,三种攻击策略下连通分支平均规模s均随移除节点比例的增加而逐渐减小。当通信半径较大时,网络初始连通性较好,则s随去除节点比例的变化趋势都是先变大后变小。当通信半径r=400m时,在遭受随意攻击时,s在阈值f=0.8220处开始缓慢变小,在遭受蓄意(RB、RD)攻击时,s分别在阈值f=0.4521和f=0.2055处开始变小。连通分支平均规模s之所以在阈值之前会变大,是由于随着节点被移除,网络总体连通程度变得越来越松散。在阈值之后会变小,是因为网络在大量节点失效时被分割成互不连通的多个较小的分支,当节点被全部移除时,网络则会消失。通过计算,在r=300m时,VANET在Failure、RD和RB三种攻击下连通分支平均规模s的方差分别为2.0306,2.4913和9.0228,即Failure攻击下s的波动最小,RB的波动最大,当通信半径发生变化时,也有类似的结论。这也说明了VANET既鲁棒又脆弱的特征。

图3分别为网络中车辆数为200、不同通信半径时,VANET受到Failure、RD和RB三种攻击时网络全局效率的变化趋势。由图3可知,通信半径越大,VANET效率越高;同时,随意攻击模式下的网络效率均高于蓄意攻击的。

另外,比较图1~3中最大连通度、临界点移除比例、连通分支平均规模和网络效率等抗毁性测度的值,可知对于蓄意攻击的两种策略,RB模式的攻击效能要强于RD模式。

下面研究车辆密度对VANET抗毁性的影响。图4~6为r=400m时不同车辆密度的VANET采取Failure、RD和RB攻击策略时表现出的抗毁性差异。从图4~6中分析得到:在通信半径一定时,车辆密度越大,VANET连通性越好,抗毁性越强,但是当网络达到全连通时,车辆密度对VANET抗毁性影响不大,因此,在VANET拓扑控制时,可以根据实际道路、地形、路边单元(RoadSide Unit, RSU)的配置等情况,对车辆通信半径和车辆密度进行优化设置,使得网络能够保持良好的连通性。

3结语

在VANET中,抗毁性对于分析整个网络性能来说十分重要,尤其是在增强安全性方面的应用。本文基于IDMLC移动模型对车载自组织网络的抗毁性特征作了研究,仿真结果表明,VANETs既有鲁棒性又有脆弱性;通信半径和车辆密度越大,VANETs抗毁性越好,但当网络全连通时,车辆密度对抗毁性影响很小。由于蓄意攻击(RD、RB)对网络破坏性强,因此,如何在拓扑控制时优化网络通信半径、车辆密度及路边基础设施配置等参数,使得网络中各个车辆节点保持相对均衡地位,从而提高VANETs抗毁性,这将是后续的研究工作。另外,本文只研究了VANET的瞬时拓扑结构及其抗毁性,然而,VANET的重要特征之一是网络拓扑结构的实时变化,其动态抗毁性特征也是接下来工作之一。

参考文献:

[1]

IEEE. IEEE Std.802.11p draft amendment, Wireless LAN Medium Access Control (MAC) and Physical Layer (PHY) specifications: Wireless Access in Vehicular Environments (WAVE) [S]. Piscataway: IEEE, 2005.

[2]

SAIF A S, MOATH M A D, ALI H A B, et al. A comprehensive survey on vehicular Ad Hoc network [J]. Journal of Network and Computer Applications, 2014, 37: 380-392.(无期)

[3]

PENG S, WANG G, HU Z, et al. Survivability modeling and analysis on 3D mobile Ad Hoc networks [J]. Journal of Central South University of Technology, 2011, 18(4): 1144-1152.

[4]

胡兴雨,张学义,吴俊,等.移动Ad Hoc网络拓扑结构抗毁性测度模型[J].计算机工程与应用,2011,47(2):78-80.(HU X Y, ZHANG X Y, WU J, et al. Measure of invulnerability of Ad Hoc network topologies based on natural connectivity [J]. Computer Engineering and Applications, 2011, 47(2): 78-80.)

[5]

AZNI A, AHMAD R, NOH Z. Survivability modeling and analysis of mobile Ad Hoc network with correlated node behavior [J]. Procedia Engineering, 2013, 53: 435-440.

[6]

李文锋,符修文.无线传感器网络抗毁性[J].计算机学报,2015,38(3):625-647.(LI W F, FU X W. Survey on invulnerability of wireless sensor network [J]. Chinese Journal of Computers, 2015, 38(3): 625-647.)

[7]

PALLIS G, KATAROS D, DIKAIAKOS M. D, et al. On the structure and evolution of vehicular networks [C]// Proceedings of 17th Annual Meeting of the International Symposium on Modelling, Analysis and Simulation of Computer and Telecommunication Systems. New York: ACM, 2009: 502-511.

[8]

张丽丽,陈浩,李臣明,等.城市环境下基于拓扑特性的车辆自组网建模[J].软件学报,2013,24(S1):51-61.(ZHANG L L, CHEN H, LI C M, et al. Modeling the vehicular Ad Hoc networks based on topology characteristics in urban scenario [J]. Journal of Software, 2013, 24(S1): 51-61.)

[9]

NABOULSI D, FIORE M. On the instantaneous topology of a largescale urban vehicular network: the Cologne case [C]// Proceedings of the Fourteenth ACM International Symposium on Mobile Ad Hoc Networking and Computing. New York: ACM, 2013: 167-176.

[10]

ZHANG H, LI J. Modeling and dynamical topology properties of VANET based on complex networks theory [J]. AIP Advances, 2015, 5(1): 017150.

[11]

ZHANG L, LI Y, TAN G, et al. Modeling the dynamic evolution of the vehicular Ad Hoc networks under the city scenario [J]. International Journal of Distributed Sensor Networks, 2015, 2015: Article ID 524857. doi:10.1155/2015/524857.

[12]

ZHANG H, LI J, LV Y. Structure performance analysis of vehicular Ad Hoc networks based on complex network theory [J]. Computer Modelling & New Technologies, 2014, 18(2): 46-51.

[13]

LATORA V, MARCHIORI M. Efficient behavior of smallworld networks [J]. Physical Review Letters, 2001, 87(19): 198701.

替换了文献13

ALBERT R, JEONG H, BARABASI A L. Error and attack tolerance of complex networks [J]. Nature, 2000, 406(6794): 378-382.

[14]

复杂网络分析例8

[DOI] 10.13939/ki.zgsc.2015.22.042

1 引 言

股票间的相关性对于风险管理、投资决策具有重要影响。对于股票相关性的研究,现代金融理论主要基于经济基本面进行解释,即认为相关性来源于影响资产现金流和影响资产折现率的基本面因素。已有研究表明,股票间相关程度远超出了经济基本面因素的影响,股票市场作为复杂系统日益受到人们的关注。近年来,经济、数学、社会等领域的学者都开始用复杂网络及其相关概念来研究股票市场,进而研究股票间相关性。

2 股票间的相关性

研究股票间的相关性对股民来说至关重要。现随机选取沪市A股、沪市B股、深市A股、深市B股、创业板这五类市场中各20只股票在2013年1月1日至2013年8月31日的周开盘价、收盘价和周个股回报卒作为量化指标,进行相关性分析。

2.1 单个指标的相关系数

选取周开盘价,周收盘价与考虑现金红利再投资的周个股回报率,并用k=l,2,3表示。

Ai(k)表示股票代码为i,指标为k的时间序列矩阵

设随机变量Ai(k)与Aj(k),则协方差为:

Cov(Ai(k),Aj(k))=E(Ai(k)- EAj(k)) -EAj(k)

相关系数为:

2.2指标权重的设立――变异系数法

其中 为第i项指标的平均值,=是第i项指标值的方差,对vij(k)(k)进行归一化,即得到各项指标的权数:

2.3 综合指标的相关系数

设运用股票i与股票j之间的综合相关系数值为

2.4模型的求解

对原题附件中数据进行处理,依据五类不同的股票市场,依次随机选取20只股票在2013年1月至2013年9月共36周内的周开盘价、收盘价和考虑现金红利再投资的周个股回报率数据。基于模型Ⅱ,运用Matlah编程求解,见表1。

3 股票板块的划分

股票板块的划分存在很多依据,常见的有按地域、按行业、按概念等,但这些都是从定性的角度去考察股票与股票内在联系,而通过相关性构建的股票网络,能依据股票与股票间时间序列数据的相关性,从定量角度去划分股票板块。这样的量化处理使得板块内部的波动性更加一致,更利于我们的投资决策。

3.1 股票相关性网络模型

①相关系数构成。网络的节点代表股票,边代表股票之间的相关性。任意两只股票i和j的综合相关系数为:

Pij(k)= pij(k)w(k)

其中i和j表股票代码,pij的取值范围为[-1,1]。若pij=-1,则表示两只股票完全负先关;若pij=1,则表示两只股票完全正相关。

②阈值的设定。股票代表网络中的点,如果相关系数|pij|≥θ(θ∈[-1,1]),就认为节点i和j之间有连边,这里的θ即阈值点。通过计算对比得知,当θ=0.05时其到达最佳阈值,股票网络的拓扑性质最稳定,更有利于对股票网络的研究。

③社团结构的构建。由模块度评价函数来衡量社团结构划分好坏,将其推广至加权的模块度评价函数Q定义为:

其中wsub>ij为网路中节点i和节点j之间的权重,ssub>i= 为节点i的权重,m=

为网络中所有边的总权重,ci为节点i被划人的社团编号,对于函数δ(ci,c)有:当u=v是,δ(ci,c)=1,当u≠v时,δ(ci,c)=0。

3.2股票板块划分

(1)基本分块情况。依据社团结构理论,结合GN算法和NetDrew绘图软件见图1。

由图1可知,图像在经过重新排列后,明显呈现出四个板块,说明在这四大板块中,板块内的股票在长期的波动趋势与波动幅度具有较高的一致性。图1的股票来源为沪市A股、沪市B股、深市A股、深市B股、创业板这五类市场中各随机选取的20只股票共100只股票,范围覆盖了中国内地全部股票市场,具有较高的准确性。

(2)找寻关键节点。为了更方便寻找最关键节点,运用Ucinet软件对图形进行处理如图2所示。

每个模块的内部相关性程度很高,那么选取每个模块中最重要节点,用它的性质来近似描述该模块的整体性质。通过软件处理后,使得节点的重要程度与图形的大小成反比,这样更易比较,也更易选出最关键的节点。

依据此,分别取900930(沪普天B)、300120(华测检测)、900951(*ST大化B)002630(华西能源)这四只股票代表图2正上方,左方,正下方,右方区域。

(3)关键节点股票单个股分析。图2区域正上方的板块选取股票900930(沪普天B),观察其2013年1月至9月的周开盘价走势,其一直处在0.6元上下波动,说明其已为成熟期股票,特点为股价稳定,波动幅度小,发展前景较弱。依据此,对图2正上方区域股票归类为成熟板块股票。

图2区域左方的板块选取股票300012(华测检测),观测其走势,其2013年1月至9月的周开盘价曲线,其上涨幅度较快,在第17周的骤降是因为上市公司因为过高或想要再融资,进行增资扩股的情况而非下跌。在短短的几个月内,其股价从第18周的10元附近上涨到15元附近,是一只处于上升期的股票,说明其为成长期的股票,特点为股价不稳定,波动幅度大,发展前景较强。依据此,对图2正上方区域股票归类为成长板块股票。

图2区域正下方的板块选取股票900951(*ST大化B),观测其2013年1月至9月的周开盘价曲走势,其波动幅度一般,股票价格持续低位,在第一周到第八周小幅上涨后,连续几十周的持续下跌,且通过查询股票代码发现其中文名称前标记着*ST,意味着此股票有即将下市的风险,警告投资者谨慎投资。所以这是一直处于衰落期的股票,特征为股票价格低,下跌趋势强,波动程度较大。依据此,对图2正下方区域股票归类为衰落板块股票。

图2区域右方的板块选取股票002630(华西能源),观测其2013年1月至9月的周开盘价曲线走势,其整体趋势是上升的,但上升的比例较小,而且不断波动,在一个个涨跌幅中前进,明显是一只处于萌芽期的股票,其特点为股价不稳定,波动幅度大,处于大幅度震荡上涨的趋势。依据此,对图2右方区域股票归类为萌芽板块股票。

4 结论分析与投资建议

现实中的板块划分主要分为两类,一类是地域板块,按照上市公司的所在地划分股票;一类是概念板块,如金融与银行业、化工业等;同时也会有依据股票的表现划分为蓝筹股、垃圾股等。而上述划分是依据时间序列数据的相关性程度划分的,与现实的板块划分有相同也有不同的地方。

相同点:与主流的两类划分的依据相同,其划分主要依据都是因为这类股票有着很强的相关性,在整体系统性风险一定的情况下,局部的系统性风险类似,如银行与金融板块,当央行上调法定存款准备金率时,其板块的股票整体呈下降趋势。

不同点:本文的股票网络模型比较接近与现实生活中的依据股票表现划分的类型,但这不是主流的划分,与按照概念划分和地域划分的板块在度量相关性的指标上有一定的差距。

一是多样化选股。投资股票种类多样化,板块多样化根据社团结构的股票网络图知,当购买股票时,切勿全部购买相同板块的股票,要综合考虑,分散风险。相同板块的股票相关程度高,波动的趋势相同,从一方面来看,若全部购买同一类型股票,将会使板块的非系统性无法避免,提高投资的风险率;从另一方面来看,虽然同一板块股票上涨具有传递效应,但其效应大小远远小于下跌时的连带效应,及时此板块的某些股票暴涨也不一定能带动整个板块所有股票上涨。所以,即使是风险偏好者也应慎重考虑。

二是综合投资与投机,确保利益最大化。作为投资者,在股票市场的最终目的是利益最大化。那么在选股时,不仅要考虑短线低买高卖的投机操作,也要有长期持仓的投资计划。对于投机类股票,结合板块分析可知,应选取处于萌芽期或成长期的股票,这些股票的波动性大,只要能把握好趋势,在短线操作的收益率较高。对于那些风险偏好更高的投资者来说,可以考虑处于衰落期的股票。这类股票,一旦有公司借壳上市,其市值会翻倍的增长;对于投资类股票,可以选取成熟类板块的股票,这类股票波动程度小,股盘大,价格相对稳定,每年会有固定的分红股利,这类股票适合长线持有。

复杂网络分析例9

fuzzy clustering and information mining in complex networks

zhao kun,zhang shao-wu,pan quan

(school of automation, northwestern polytechnical university, xi’an 710072, china)

abstract:there is seldom a method which is capable of both clustering the network and analyzing the resulted overlapping communities. to solve this problem, this paper presented a novel fuzzy metric and a soft clustering algorithm. based on the novel metric, two topological fuzzy metric, which include clique-clique closeness degree and inter-clique connecting contribution degree, were devised and applied in the topological macro analysis and the extraction of key nodes in the overlapping communities. experimental results indicate that, as an attempt of analysis after clustering, the new indicators and mechanics can uncover new topology features hidden in the network.

key words:network fuzzy clustering; clique-node similarity; clique-clique closeness degree; inter-clique connection contribution degree; symmetrical nonnegative matrix factorization(s-nmf); network topology macrostructure

团结构是复杂网络普遍而又重要的拓扑属性之一,具有团内连接紧密、团间连接稀疏的特点。网络团结构提取是复杂网络分析中的一个基本步骤。揭示网络团结构的复杂网络聚类方法[1~5]对分析复杂网络拓扑结构、理解其功能、发现其隐含模式以及预测网络行为都具有十分重要的理论意义和广泛的应用前景。目前,大多数提取方法不考虑重叠网络团结构,但在多数网络应用中,重叠团结构更为普遍,也更具有实际意义。

现有的网络重叠团结构提取方法[6~10]多数只对团间模糊点进行初步分析,如nepusz等人[9,10]的模糊点提取。针对网络交叠团结构的深入拓扑分析,本文介绍一种新的团—点相似度模糊度量。由于含有确定的物理含意和更为丰富的拓扑信息,用这种模糊度量可进一步导出团与团的连接紧密程度,以及模糊节点对两团联系的贡献程度,并设计出新指标和定量关系来深度分析网络宏观拓扑连接模式和提取关键连接节点。本文在三个实际网络上作了实验分析,其结果表明,本方法所挖掘出的网络拓扑特征信息为网络的模糊聚类后分析提供了新的视角。

1 新模糊度量和最优化逼近方法

设a=[aij]n×n(aij≥0)为n点权重无向网络g(v,e)的邻接矩阵,y是由a产生的特征矩阵,表征点—点距离,yij>0。假设图g的n个节点划分到r个交叠团中,用非负r×n维矩阵w=[wki]r×n来表示团—点关系,wki为节点i与第k个团的关系紧密程度或相似度。w称为团—点相似度矩阵。令

mij=?rk=1wkiwkj(1)

若wki能精确反映点i与团k的紧密度,则mij可视为对点i、j间相似度yij的一个近似。所以可用矩阵w来重构y,视为用团—点相似度w对点—点相似度y的估计:

w ?twy(2)

用欧式距离构造如下目标函数:

minw≥0 f?g(y,w)=y-w ?tw?f=?12?ij[(y-w ?tw)。(y-w ?tw)]ij(3)

其中:•?f为欧氏距离;a。b表示矩阵a、b的hadamard 矩阵乘法。由此,模糊度量w的实现问题转换为一个最优化问题,即寻找合适的w使式(3)定义的目标函数达到最小值。

式(3)本质上是一种矩阵分解,被称为对称非负矩阵分解,或s-nmf (symmetrical non-negative matrix factorization)。?s-nmf的求解与非负矩阵分解nmf[11,12]的求解方法非常类似。非负矩阵分解将数据分解为两个非负矩阵的乘积,得到对原数据的简化描述,被广泛应用于各种数据分析领域。类似nmf的求解,s-nmf可视为加入限制条件(h=w)下的nmf。给出s-nmf的迭代式如下:

wk+1=w?k。[w?ky]/[w?kw ?t?kw?k](4)

其中:[a]/[b]为矩阵a和b的hadamard矩阵除法。

由于在nmf中引入了限制条件,s-nmf的解集是nmf的子集,即式(4)的迭代结果必落入nmf的稳定点集合中符合附加条件(h=w)的部分,由此决定s-nmf的收敛性。

在求解w之前还需要确定特征矩阵。本文选扩散核[13]为被逼近的特征矩阵。扩散核有明确的物理含义,它通过计算节点间的路径数给出任意两节点间的相似度,能描述网络节点间的大尺度范围关系,当两点间路径数增加时,其相似度也增大。扩散核矩阵被定义为

k=exp(-βl)(5)

其中:参数β用于控制相似度的扩散程度,本文取β=0.1;l是网络g的拉普拉斯矩阵:

lij=-aiji≠j

?kaiki=j(6)

作为相似度的特征矩阵应该是扩散核矩阵k的归一化?形式:

yij=kij/(kiikjj)??1/2(7)

基于扩散核的物理含义,团—点相似度w也具有了物理含义:团到点的路径数。实际上,w就是聚类结果,对其列归一化即可得模糊隶属度,需要硬聚类结果时,则选取某点所对应列中相似度值最大的团为最终所属团。

2 团—团关系度量

团—点相似度w使得定量刻画网络中的其他拓扑关系成为可能。正如w ?tw可被用来作为点与点的相似度的一个估计,同样可用w来估计团—团关系:

z=ww ?t(8)

其物理含义是团与团间的路径条数。很明显,z的非对角元zjk刻画团j与团k之间的紧密程度,或团间重叠度,对角元zjj则刻画团j的团内密度。?

以图1中的对称网络为例,二分团时算得

z=ww ?t=1.337 60.035 3

0.035 31.337 6

由于图1中的网络是对称网络,两团具有同样的拓扑连接模式,它们有相同的团内密度1.337 6,而团间重叠度为?0.035 3。

3 团间连接贡献度

zjk度量了团j与团k间的重叠程度:

zjk=?na=1wjawka(9)

其中:wjawka是这个总量来自于点a的分量。下面定义一个新指标来量化给定点对团间连接的贡献。假设点i是同时连接j、k两团的团间某点,定义点i对团j和团k的团间连接贡献度为

b?i=[(wjiwki)/(?na=1wjawka)]×100%(10)

显然,那些团间连接贡献大的点应处于网络中连接各团的关键位置,它们对团间连接的稳定性负主要责任。将这种在团与团间起关键连接作用的点称为关键连接点。为了设定合适的阈值来提取团间关键连接点,本文一律取b>10%的点为关键连接点。

4 实验与结果分析

下面将在三个实际网络上展开实验,首先根据指定分团个数计算出团—点相似度w,然后用w计算团—团关系和b值,并提取关键连接点。

4.1 海豚社会网

由lusseau等人[14]给出的瓶鼻海豚社会网来自对一个62个成员的瓶鼻海豚社会网络长达七年的观测,节点表示海豚,连线为对某两只海豚非偶然同时出现的记录。图2(a)中名为sn100 (点36)的海豚在一段时间内消失,导致这个海豚网络分裂为两部分。

使用s-nmf算法聚类,海豚网络分为两团时,除30和39两点外,其他点的分团结果与实际观测相同,如图2(a)所示。计算b值并根据阈值提取出的五个关键连接点:1、7、28、36、40(虚线圈内),它们对两团连接起到至关重要的作用。图2(b)为这五点的b值柱状图。该图显示,节点36(sn100)是五个关键连接点中b值最大者,对连接两团贡献最大。某种程度上,这个结果可以解释为什么海豚sn100的消失导致了整个网络最终分裂的影响。本例说明,s-nmf算法及团间连接贡献程度指标在分析、预测社会网络演化方面有着独具特色的作用。

4.2 santa fe 科学合作网

用本算法对newman等人提供的santa fe科学合作网络[15]加以测试。271个节点表示涵盖四个学术领域的学者,学者合作发表文章产生网络连接,构成了一个加权合作网络。将本算法用于网络中一个包含118个节点的最大孤立团,如图3(a)所示。

图3(a)中,四个学科所对应的主要组成部分都被正确地分离出来,mathematical ecology(灰菱形)和agent-based models(白方块)与文献[15]的结果一致,中间的大模块statistical physics又被细分为四个小块,以不同灰度区分。计算了24个点的团间连接度贡献值b,从中分离出11个b值大于10%的点作为关键连接点:1、2、4、6、11、12、20、47、50、56、57,其标号在横轴下方标出,见图3(b),并在图3(a)中用黑色圆圈标记,这些连接点对应那些具有多种学科兴趣、积极参与交叉研究的学者。除去这11个点时,整个网络的连接布局被完全破坏,见图3(a)下方灰色背景缩小图,可见关键连接点的确起到重要的沟通各模块的作用。

4.3 杂志索引网络

在rosvall等人[16]建立的2004年杂志索引网络上进行测试。网络节点代表杂志,分为物理学(方形)、化学(方形)、生物学(菱形)、生态学(三角形)四个学科领域,每个学科中各选10份影响因子最高的刊物,共40个节点,若某刊物文章引用了另一刊物文章,则两刊间有一条连线,形成189条连接。使用s-nmf对该网4分团时,聚类结果与实际分团情况完全一致,如图4(a)所示。

由本算法得出的团—点相似度w在网络宏观拓扑结构的挖掘方面有非常有趣的应用,如第2章所述,用w计算团—团相似度矩阵z=ww?t,其对角元是团内连接密度,非对角元表征团与团的连接紧密程度,故z可被视为对原网络的一种“压缩表示”。如果将团换成“点”,将团与团之间的连接换成“边”,利用z的非对角元,就能构造出原网络的一个压缩投影网络,如图4(b)所示。这是原网络的一个降维示意图,也是团与团之间关系定量刻画的形象表述,定量地反映了原网络在特定分团数下的“宏观(全局)拓扑轮廓”,图上团间连线色深和粗细表示连接紧密程度。由图4(b)可以看到,physics和chemistry连接最紧密,而chemistry与biology和biology与?ecology次之。由此推测,如果减少分团数,将相邻两团合并,连接最紧密的两团必首先合并为一个团。实际情况正是如此:分团数为3时,biology和ecology各自独立成团,physics 和?chemistry合并为一个大团,这与文献[11]结果一致。

5 讨论

网络模糊聚类能帮助研究者进一步对团间的一些特殊点进行定量分析,如nepusz等人[9]用一种桥值公式来刻画节点在多个团间的共享程度,即节点从属度的模糊程度。而本文的团间连接贡献度b反映出节点在团间连接中所起的作用大小。本质上它们是完全不同的两种概念,同时它们也都是网络模糊分析中所特有的。团间连接贡献度指标的提出,将研究引向对节点在网络宏观拓扑模式中的影响力的关注,是本方法的一个独特贡献。无疑,关键连接点对团间连接的稳定性起到很大作用,如果要迅速切断团间联系,改变网络的宏观拓扑格局,首先攻击关键连接点(如海豚网中的sd100)是最有效的方法。团间连接贡献度这一定义的基础来自于对团与团连接关系(z)的定量刻画,这个定量关系用以往的模糊隶属度概念无法得到。由于w有明确的物理含义,使得由w导出的团—团关系z也具有了物理含义,这对网络的宏观拓扑分析非常?有利。

6 结束语

针对复杂网络交叠团现象,本文给出了一个新的聚类后模糊分析框架。它不仅能对网络进行模糊聚类,而且支持对交叠结构的模糊分析,如关键点的识别和网络宏观拓扑图的提取。使用这些新方法、新指标能够深入挖掘潜藏于网络的拓扑信息。从本文的聚类后分析不难看出,网络模糊聚类的作用不仅在于聚类本身,还在于模糊聚类结果能够为网络拓扑深入分析和信息挖掘提供支持,而硬聚类则不能。今后将致力于对团间连接贡献度指标进行更为深入的统计研究。

参考文献:

[1]

赵凤霞,谢福鼎.基于k-means聚类算法的复杂网络社团发现新方法[j].计算机应用研究,2009,26(6):2041-2043,2049.

[2]汪小帆,刘亚冰.复杂网络中的社团结构算法综述[j].电子科技大学学报,2009,38(5):537-543.

[3]newman m e j.modularity and community structure in networks[j].proceedings of the national academy of sciences of the united states of america,2006,103(23):8577-8582.

[4]white s,smyth p.a spectral clustering approach to finding communities in graphs[c]//proc of siam international conference on data mining.2005.

[5]enright a j,dongen s v,ouzounis c a.an efficient algorithm for large-scale detection of protein families[j].nucleic acids research,2002,30(7):1575-1584.

[6]bezdek j c.pattern recognition with fuzzy objective function algorithms[m].new york:plenum press,1981.

[7]palla g,derenyi i,farkas i,et al.uncovering the overlapping community structures of complex networks in nature and society[j].nature,2005,435(7043):814-818.

?[8]reichardt j,bornholdt s.detecting fuzzy community structures in complex networks with a potts model[j].physical review letters,2004,93(21):218701.

?[9]nepusz t,petroczi a,n?gyessy l,et al.fuzzy communities and the concept of bridgeness in complex networks[j].physical review e,2008,77(1):016107.

[10]zhang shi-hua,wang rui-sheng,zhang xiang-sun.identification of overlapping community structure in complex networks using fuzzy c-means clustering[j].physical review a:statistical mechanics and its applications,2007,374(1):483-490.

[11]paatero p,tapper u.positive matrix factorization:a non-negative factor model with optimal utilization of error estimates of data values[j].environmetrics,1994,5(2):111-126.

[12]anttila p,paatero p,tapper u,et al.source identification of bulk wet deposition in finland by positive matrix factorization[j].atmospheric environment,1995,29(14):1705-1718.

[13]kondor r i,lafferty j.diffusion kernels on graphs and other discrete structures[c]//proc of the 19th international conference on machine learning.san francisco:morgan kaufmann,2002.

复杂网络分析例10

【关键词】脑网络 时间序列 脑网络建模 复杂网络

人的大脑是世界上最复杂的系统,包括有百亿计的神经元。每一个处理信息的神经元通过大量的突触与其它神经元相连,神经元和突触共同组成了无比复杂的脑神经网络。人体自身及其与外界交互的所有信息,都由这个脑复杂网络来处理,它的效率和工作状态直接决定人的精神与健康状态。研究脑网络,首先要连接网络中的每一个节点即神经元之间的连接类型,并通过信息在网络中的传递和处理过程,建立起相应的分析模型,然后结合具体的采样数据,做模拟网络运行,以得到网络特征。

1 脑复杂网络及其常见的连接类型

当我们将脑神经网络当做常规意义上的拓扑网络来研究时,脑神经元即为网络中的节点,神经突触则相当于拓扑网络的边,而大脑做出的各种行为,均可以看作这个复杂的网络对各类信息的传递与处理的过程。这其中,神经元之间连接类型关注的重点,通过对常规拓扑网络的三种连接关系在脑复杂网络中的映射,了解脑网络的基础工作原理。

1.1 功能性脑网络(functional brain networks)

功能性脑网络是以分析神经元、神经集群、功能脑区等不同尺度上的脑功能单元之间的连接关系和统计趋势为主的无向网络,一般基于脑网络的各类功能信号,如电、磁、代谢信号等进行网络建模。在目前的脑网络研究领域,研究人员一般主要依据EEG/MEG/fMRI等方式进行建模并模拟研究脑功能性脑网络的特点。EEG和MEG的优点是时间分辨率较高,可以达到毫秒级,缺点是空间分辨率只能达到厘米级,达不到微观尺度上的分析要求。fMR主要反映生理代谢和血液方面的信息,它的空间分辨率达到了毫米级,但时间分辨率只有秒级。在未来,结合了EEG、MEG和fMRI的综合优点,进行多模态脑网络研究将能够更加全面地展现脑网络的特征。

1.2 结构性脑网络(anatomical brain networks)

结构性脑网络主要反映大脑的生理结构,以神经元之间的化学连接和电连接为主。在不同量级的空间尺度上,可以定义不同的结构性脑网络,如单个神经元之间复杂的联系通路即可视为一个“微网络”,而局部的神经通路单元则相当于一个局部的结构性网络,各个局部网络则又是组成脑网络基础节点,最终形成了一个层级结构十分复杂的结构性网络。大脑包括约100亿个神经元和数千倍的突触。用生理解剖的方法来分析神经元结构性连接网络,是目前研究脑网络最重要的方法之一。

1.3 因效性脑网络(effective brain networks)

因效性脑网络聚焦于脑网络中各节点之间的相互作用以及节点间信息流向。不同于无向连接的功能性脑网络。因效性脑网络重点研究网络中各种连接的方向性,着重分析各网络节点之间的因果关系以及统计趋势,并根据信息在节点之间的传播方向来分析脑网络的工作过程。因效性脑网络和功能性脑网络的差别在于如何量化测度网络节点之间的关系。一般采用因果关系分析来对网络连接强度进行量化。

2 时间序列脑网络构建与研究

构建脑网络可分3步,即定义节点、定义和测定结点之间的连接强度,选取合适的阈值并在连接强度大于闽值的节点之间建立连接边。一般通过稀疏性确定节点之间存在边的比率。例如:稀疏性值为0.2,即代表当前脑功能网络中存在边数占完全网络的边数的百分之二十。权值概率分布差异较大,难以避免网络存在散点或冗余的边,使得网络不满足连通性,并通过脑复杂网络的拓扑结构、递归图、度分布、模体分布等特征来揭示脑网络内在机制。

由测量时间序列构建复杂网络方法描述为,给定一个时间序列:

X(sΔt)(s=1,2,…,N)

其中Δt是单位采样时间,N为采样数据长度。假设此方法得到时间序列的延迟时间和最小嵌入维数均满足网络工作,利用延迟坐标嵌入方法得到一个多维向量:

Y={y1(k),y2(k),…,ym(k)}={z1(n),z2(n),…,zM(n)}={x(kΔt),x(kΔt+τ),…,x(kΔt+(m-1)τ)}

其中:n=1,2,…,m,m为嵌入维数;k=1,2,…,M,M=N-(m-1)τ/Δt为数据长度;τ为最佳时延。

为构建网络,分别计算两个向量点间的欧式距离得到一个M×M维的加权邻接矩阵D,给定两个向量点zi(n)和zj(n),向量点间的欧式距离定义为:

dij=||zi(n)-zj(n)||

其中:dij代表为矩阵中的i行j列元素。 rc为一个合适的阀值,即当dij>rc时,表示网络为无连接,反之则表示节点i与j间有连边存在,邻接矩阵A的元素aij为1。具体描述为:

aij =

由此我们就获得了一个初始的时间序列网络模型,通过对各类脑网络信号的获取和输入,即可以得到不同的脑网络拓扑的特性,受篇幅和环境条件所限,本文未进行更深入的实际分析,仅供参考。

3 结语

在脑复杂网络的研究中,结构性网络是物理基础,功能性网络、因效性网络是研究目标的抽象模型。脑复杂网络的研究不仅在了解人体自身机制、防治神经性疾病方面具有现实意义,同时对复杂计算机网络的研究与建设也有十分重要的指导意义。

参考文献

[1]唐孝威,黄秉宪.脑的四个功能系统学说[J].应用心理学,2003,02:3-5.

[2]郝崇清,王江,邓斌,魏熙乐.基于复杂网络的脑电信号分析[J].计算机应用研究,2012,29(9):3870-3872.

复杂网络分析例11

当我们将脑神经网络当做常规意义上的拓扑网络来研究时,脑神经元即为网络中的节点,神经突触则相当于拓扑网络的边,而大脑做出的各种行为,均可以看作这个复杂的网络对各类信息的传递与处理的过程。这其中,神经元之间连接类型关注的重点,通过对常规拓扑网络的三种连接关系在脑复杂网络中的映射,了解脑网络的基础工作原理。 

1.1 功能性脑网络(functional brain networks) 

功能性脑网络是以分析神经元、神经集群、功能脑区等不同尺度上的脑功能单元之间的连接关系和统计趋势为主的无向网络,一般基于脑网络的各类功能信号,如电、磁、代谢信号等进行网络建模。在目前的脑网络研究领域,研究人员一般主要依据EEG/MEG/fMRI等方式进行建模并模拟研究脑功能性脑网络的特点。EEG和MEG的优点是时间分辨率较高,可以达到毫秒级,缺点是空间分辨率只能达到厘米级,达不到微观尺度上的分析要求。fMR主要反映生理代谢和血液方面的信息,它的空间分辨率达到了毫米级,但时间分辨率只有秒级。在未来,结合了EEG、MEG和fMRI的综合优点,进行多模态脑网络研究将能够更加全面地展现脑网络的特征。 

1.2 结构性脑网络(anatomical brain networks) 

结构性脑网络主要反映大脑的生理结构,以神经元之间的化学连接和电连接为主。在不同量级的空间尺度上,可以定义不同的结构性脑网络,如单个神经元之间复杂的联系通路即可视为一个“微网络”,而局部的神经通路单元则相当于一个局部的结构性网络,各个局部网络则又是组成脑网络基础节点,最终形成了一个层级结构十分复杂的结构性网络。大脑包括约100亿个神经元和数千倍的突触。用生理解剖的方法来分析神经元结构性连接网络,是目前研究脑网络最重要的方法之一。 

1.3 因效性脑网络(effective brain networks) 

因效性脑网络聚焦于脑网络中各节点之间的相互作用以及节点间信息流向。不同于无向连接的功能性脑网络。因效性脑网络重点研究网络中各种连接的方向性,着重分析各网络节点之间的因果关系以及统计趋势,并根据信息在节点之间的传播方向来分析脑网络的工作过程。因效性脑网络和功能性脑网络的差别在于如何量化测度网络节点之间的关系。一般采用因果关系分析来对网络连接强度进行量化。 

2 时间序列脑网络构建与研究 

构建脑网络可分3步,即定义节点、定义和测定结点之间的连接强度,选取合适的阈值并在连接强度大于闽值的节点之间建立连接边。一般通过稀疏性确定节点之间存在边的比率。例如:稀疏性值为0.2,即代表当前脑功能网络中存在边数占完全网络的边数的百分之二十。权值概率分布差异较大,难以避免网络存在散点或冗余的边,使得网络不满足连通性,并通过脑复杂网络的拓扑结构、递归图、度分布、模体分布等特征来揭示脑网络内在机制。 

由测量时间序列构建复杂网络方法描述为,给定一个时间序列: 

X(sΔt)(s=1,2,…,N) 

其中Δt是单位采样时间,N为采样数据长度。假设此方法得到时间序列的延迟时间和最小嵌入维数均满足网络工作,利用延迟坐标嵌入方法得到一个多维向量: 

Y={y1(k),y2(k),…,ym(k)}={z1(n),z2(n),…,zM(n)}={x(kΔt),x(kΔt+τ),…,x(kΔt+(m-1)τ)} 

其中:n=1,2,…,m,m为嵌入维数;k=1,2,…,M,M=N-(m-1)τ/Δt为数据长度;τ为最佳时延。 

为构建网络,分别计算两个向量点间的欧式距离得到一个M×M维的加权邻接矩阵D,给定两个向量点zi(n)和zj(n),向量点间的欧式距离定义为: 

dij=||zi(n)-zj(n)|| 

其中:dij代表为矩阵中的i行j列元素。 rc为一个合适的阀值,即当dij>rc时,表示网络为无连接,反之则表示节点i与j间有连边存在,邻接矩阵A的元素aij为1。具体描述为: 

aij =