首页 > 热点资讯 >新闻内容

如何做好网站优化?

来源:广东优联互通科技有限公司 2021年01月07日 17:52

网站优化对网站来说是很重要的,直接决定和影响着网站所起到的作用,以及在各个地方当中的排名。在进行SEO优化的过程中,我们必须要坚持一定的原则,真正的把这些事情做得更好,才可以确保结果!

1、SEO排名无法保证,受算法,竞争对手,网站布局等因素的影响,但肯定是SEO中重要的其中之一。搜索引擎优化就像生活中的其它许多领域,也不能保证的。不管你做出什么样的奇迹,你都不能保证排名到搜索引擎顶部的位置,特别是随着时间的推移。原因很复杂,比如算法的变化,竞争对手的攻击,或者干脆是因为你网站的内容变老了,结果都是一样的,你永远无法保证您的排名。

2、SEO需要大量的时间和耐心来实现结果,不能像SEM那样马上有排名。SEO不是一个可以快速有结果的项目。除了SEO技能,你还需要大量的时间和耐心,以及大量的时间成本去完成,结果也许永远也不会到来。

3、链接建设以缓慢的速度增长,而不是急匆匆地一下子建立很多反向链接。反向链接可能是搜索引擎优化成功的支柱,你可能会急于要反向链接的建设,这其实并没有什么帮助。正如我前面提到的,在SEO中你需要大量的耐心和时间。在外部链接的建设中也是如此。你需要建立缓慢增长反向链接的计划,固定在一个稳定的增长速度,而不是急匆匆地一下子建立很多反向链接。

4、一个高质量的反向链接的价值超过100个垃圾链接,在谷歌企鹅算法,百度绿萝算法更新后。这又是一个宝贵的教训,从一个有信誉的,相关的,高排名网站的单个质量的反向链接远胜过100个垃圾链接。这是在谷歌企鹅算法,百度绿萝算法更新之后,垃圾链接不仅失去了作用,反而还有可能带来惩罚。

5、不要获得一个不好的产品或服务的排名,不然您会看到负面的宣传。如果你的客户打算做一些不是很好的产品或服务,那么你要学会说NO。不然你会在互联网上看到愤怒的网友带给你想想不到的负面宣传。

6、内容为主,原创内容很重要,随着百度原创保护的出现。简单的来说,如果你没有好的内容,那么你只是在浪费你的时间和费用。

7、不要伤害Meta标签,title标签很重要。十年前当我开始做搜索引擎优化的时候,meta标签是比现在重要得多。然而meta标签任然没有过时,特别是title标签,为了以防万一,你要写好你的标题。

8、研究关键词的成败,正确合理的布局网站关键词。关于SEO优化中关键词的研究在这10年间并没有发生变化,或者更准确地说,选择错误或正确的关键词没有发生改变。这就是为什么关键词的研究是很重要的。如果你这样做的不对,你所有的后续努力都注定是要失败的。对于优化来说你需要选择正确的关键词,而不是为了某些搜索量很大但是却不能产生转化的关键词。

9、你没有正确的工具哪里也去不了。搜索引擎优化需要使用很多的工具,如果你没有合适的SEO工具,你会得到错误的反馈,这可就是是个悲剧了。

10、利基产品/服务的网站。如果你有你想要覆盖10个行业,那么请建立10个单独的网站,而不是把全部内容都放在一个单一的网站上。

11、快或者失败。SEO是动态的。你要快,不然你就注定失败。这一点尤其是当主要的算法更新,因为如果你不能迅速采取行动,你会看到你的排名如何在眨眼间下降。

12、你不能只依靠搜索引擎优化。SEO是强大的流量入口,但你不能靠单打独斗-你需要的PPC,社会化营销等。正是这种结合,可以帮助你实现成功,使您的网站赚钱。

13、老域名或域名中加关键词也救不了你。老域名或者域名中加关键词对于你的优化确实有帮助,但是当你没有良好的内容和高质量的反向链接,那么他们不能拯救你。

14、始终要监测与衡量。当你不知道你的成果是怎么样的,那么你所做的一切都是瞎猜的。这就是为什么你总是需要监测你的成果,并努力摆脱那些表现不佳的网站/项目/关键字。

15、不要担心跳出率太高。跳出率是没有直接关系到搜索引擎优化结果的,但是当用户来到你的网站后不久就离开你的网站,这可是一种不好的症状哦,说明他们没有找到他们想要的东西。这是网站的损失,所以要尽量减低你的跳出率。

16、可以实现多个长尾关键词,因为对他们来说大大的减少了竞争度,而且更高的排名是比较容易实现的。也许你的长尾关键词不会获得那么多的流量,但是他们击败了难以获得好排名的热门关键词。

17、黑帽是需要避免的。搜索引擎并不傻,黑帽的把戏往往很容易就被发现。不要成为一个SEO的罪犯,要用正规的白帽去优化。

18、不单单只有谷歌或百度有搜索引擎。谷歌在全球拥有很大的份额,百度在中国拥有很大的份额。但其他搜索引擎可能带来不错的点击量,比如bing,360,sogou,其他搜索引擎,你可以获得很好的排名。

19、分散你的搜索引擎优化策略,引流的平台不止一种。关键词的排名位置和高质量的反向链接是SEO的核心,但还有许多其它的策略。例如,您可能希望把社会化媒体营销加进来。

20、快速下降失败者。SEO成功需要时间和耐心,但是它从一开始就不是一个显而易见的工作,你能做的是快速下降失败者。这适用于项目以及客户。等待是没有意义的,你失去的会更多,尽快终止一个失败的项目。

21、找一个好的主机托管商,减少网站故障率。这又是一个重要的一课。如今主机托管商越来越便宜,所以没有理由去忍受一个不可靠的供应商。当你的主机是频频出现问题,机器人便无法抓取您的网站,更糟的是,当用户在搜索排名中点击你的结果,他们却无法访问,其结果导致的是钱和形象的损失。

22、SEO的目的是客户转化(ROI),不是只做首页排名。良好的排名可能会让你得到自我满足,但如果你没有得到一个良好的转化,那么这并不是目的,毕竟我们从一个网站中赚到钱才是重要的。

23、只要你活着就要学习,互联网每天都在变,您的步伐是否能跟上。这适用于生活中的许多领域,尤其是在搜索引擎优化中,事情往往变化得很快。如果你想要生存下去,就需要不断学习新的或更好的方法。

24、搜索引擎优化是一个团队游戏。SEO是不是一匹孤独的狼。你需要与编辑,设计师,开发人员,产品经理等紧密合作,或者你也可以自己做到这一切,但是这需要很长很长的时间,你需要聘请一位SEO优化师。

25、不要忘了301重定向和404错误。301重定向和404错误会经常被忘记,但如果误用他们可以对你网站产生很大的伤害。所以请花时间来检查重定向和404错误。

26、你需要自己思考问题。你需要学习,但是这并不意味着你应该盲目的遵循SEO专家的建议。即使他们不是想试图误导你。某个网站的成功是他们的作品,但并不意味着用同样的方式你也会获得成功。

27、你的竞争对手是你的好老师。你的竞争是你的好的老师之一。只要分析他们做了什么,那么你会学到很多。

28、不要沉迷于数据,数据给你指引方向,真实性还需要您去研究。数据给你指引方向,但不要让他们牵着你走完一生。网页排名或者其他排名只是数字而已,沉迷于其中是没有好处的。

29、您不能让不同类型的网站使用相同的搜索引擎优化策略。一个电子商务网站和一个公司的网站是不同的。你需要考虑这些所有的差异,并使用不同的搜索引擎优化策略。

30、在网络上人人都可以很大。即使你是一个小公司,你仍然可以得到比大家伙更好的排名。

31、您的排名不会太好,只有更好的排名。无论你的排名有多好,总是会有改进的余地。举例来说,如果你对于一个给定的关键词有很好的排名,您可以尝试一些你目前不是很擅长的相关关键词,

32、不要成为工作的奴隶,不要为了SEO而去做SEO。搜索引擎优化是会上瘾的,尤其是当你看到了结果。然而,成为工作的奴隶是很不好的。你需要的是生活,知道什么时候该停止,这不仅有益于身体健康,而且会提高你的工作效率,总是要计划几天远离电脑。

33、请务必填写您的alt标签,搜索引擎是通过alt标签看到您的图片。标签有时会被忽视或者留空,但他们也很重要。特别是对图片的站点,如电子商务网站或图像画廊。如果你的对手标签都是留空的,你努力填写这些将是你一个优势。

广东优联互通科技有限公司有丰富的资源优势,成熟的经验优势,强大的技术优势,优质的服务优势;根据客户的实际情况进行开发设计跟SEO优化,从而更快更有效的部署软件产生效益,满足企业的市场需求。需要可加微信13539285443详谈!


相关推荐

开拓教育机构线上发展新渠道,考生网是你最优的选择!

教育培训机构网络招生平台怎么选?由于新冠肺炎疫情的影响,今年全国多地教育部门宣布了延期开学,现阶段下的教育行业处于水深火热之中,尤其是线下教育行业简直是困境重重,今年的教育机构势必要走线上招生、线上授课的道路。对于教育培训机构来说,生源永远是最重要的,怎么获取和扩大生源一直是众多教育培训机构的难题。然而,在互联网和信息高度发达的今天,通过传统的招生方式获取生源显然已经越来越困难,越来越多的教育培训机构不得不选择互联网这种线上招生的方式。目前,网络招生平台随处可见,每一个网络招生平台都有自己的优劣势,找到一个平台的难度其实不大,但是怎么找到一个靠谱的平台却是一件不简单的事情。下面小编就给大家分析介绍一下怎么去选择一个合适的靠谱的网络招生平台?对于怎么选择一个合适的靠谱的网络招生平台,想必大家关注的还是生源问题,说白点就是招生效果哪家好。对此,我们可以从以下两个方面去分析。1、看生源量一个平台的生源量好不好,关键就在于网站的权重高不高。权重高的网站往往排名靠前,有一定程度的流量倾斜,发布的学校信息收录高,而学校信息曝光量一旦高了,学员看到学校的几率也就更高了。2、看报名率好的网络招生平台有着良好的品牌形象和服务意识,注重学员的体验,也只有这样的平台,学员的意向性和匹配度往往会更好,所以招生报名率也才会更高。以上这两点直接决定了招生效果的好坏。由此可见,想要选择一个好的、靠谱的网络招生平台,需要根据生源量、报名率来衡量。小编发现了一个以KAOSHENG的汉语拼音顶级COM域名做为域名的互联网平台考生网非常不错,作为专业的学历教育、课程培训报名咨询的服务门户网站,从其实用的顶级域名就可以看到非常注重品牌,当然更注重体验,有着各种权威的媒体平台资源的合作支持,可以提供多方面的招生方式和推广渠道,从而直接降低推广与招生成本。更重要的是,考生网与租客网等大型门户平台有合作关系,各种生源数量渠道更多元化。同时,考生网有一整套独有的运营矩阵,平台流量转化也非常明显,对受疫情重创的教育培训机构,不妨去试一试。更多详情,可以去考生网的官网查看了解。

2020年05月27日 11:30

Philip S. Yu 团队最新综述!社区发现的深度学习方法:进展、挑战、机遇

本篇文章10140字,读完约26分钟雷锋网AI科技评论按:社区发现(CommunityDetection)是网络科学领域中一个经久不衰的重要问题。随着深度学习的发展,研究者们逐渐从传统的统计推断和谱聚类等方法中解放了出来。那么,深度学习时代的社区发现工作有哪些特点,研究者们遇到了哪些挑战,有哪些前景光明的研究方向呢?近日,IJCAI2020上发表的一篇Survey文章,完整阐释了这一研究方向的方法、挑战和机遇。论文来自数据挖掘领域大牛PhilipS.Yu团队。论文标题:DeepLearningforCommunityDetection:Progress,ChallengesandOpportunities社区发现(CommunityDetection)是网络科学领域中一个经久不衰的重要问题。随着深度学习的发展,研究者们逐渐从传统的统计推断和谱聚类方法中解放了出来。那么,深度学习时代的社区发现工作有哪些特点,研究者们遇到了哪些挑战,有哪些前景光明的研究方向呢?网络中的社区指的是一组由节点以及与其相连的边紧密地形成的实体。社区发现旨在遵循「社区中的节点紧密相连,不同社区间的节点稀疏相连」的规则对实体集合进行聚类。包括谱聚类、统计推断在内的传统社区发现方法在处理高维图数据时存在计算速度的问题。因此,近年来,深度学习方法被广泛地应用。在本文中,作者特别调研了社区发现的深度学习方法这一研究领域中的最新进展,并根据用到的深度神经网络、深度图嵌入、图神经网络对这些方法进行分类。由于目前深度学习的能力仍然不能满足处理复杂网络结构的需求,本文作者指出了当前该领域面临的挑战和研究机遇。一、社区发现网络是有两种基本的实体(即节点和边)形成的。根据图理论,「社区」是一种内部节点紧密相连的子图,它遵循以下特定的规则:(1)社区内的节点紧密相连;(2)不同社区中的节点稀疏相连。人们也将社区看做一种聚类簇,其中相同社区内的节点可以共享共用的特性和/或扮演类似的角色。这里根据Radicchi等人基于网络统计分析给出的定义展开讨论。根据节点在社区内部和外部的度,我们可以将社区分为两类:强社区和弱社区。节点的「内部度」代表将该节点与同一个社区中其它节点连接起来的边数,节点的「外部度」则代表将该节点与属于其它社区的节点连接起来的边数。一个弱社区是其中的节点的内部度之和大于外部度之和的子图。一个强社区是其中每个节点的内部度都大于外部度的子图。针对社区的网络结构,本文采用了强社区的定义。社区发现可以帮助我们理解网络内在的模式和功能。在现实世界的应用中,社区将复杂系统中的信息聚集了起来。举例而言,Chen、Yuan等人发现在「蛋白质-蛋白质」交互(PPI)网络中,被聚合到社区中的蛋白质具有相似的生物学功能;Chen、Redner等人,在论文引用网络中,通过社区发现技术确定通过论文引用连接起来的课题的重要性、相互关联以及演变情况;Zhang等人,在企业网络中,通过研究离线的公司内部数据源以及在线的企业社交关系将雇员分组到不同的社区中;Yang等人指出,在线社交网络中(例如Twitter和Facebook)拥有共同的兴趣或朋友的用户可能来自同一个社区(如图1所示)。图1:社交网络中的社区发现示例。根据个体之间的紧密度,网络被划分为两个社区,即包含三个节点的社区C_1和包含四个节点的社区C_2。传统的社区发现方法大部分都是基于统计推断和机器学习发展出来的。例如,在统计学领域非常具有代表性的社区发现方法「随机分块模型」(SBM)被广泛用于描述社区是如何形成的。然而,在处理当下的复杂数据及和社交场景时,这些传统的方法面临着许多问题。此外,在机器学习领域,发现社区的工作往往被看做一个图上的聚类问题。Ng等人用特征向量(例如邻接矩阵和Laplacian矩阵)实现了将节点划分到社区中的谱聚类方法,然而这种方法在稀疏网络上的性能较差。同时,对于预设的社区数目的要求也特别限制了依赖统计推断的模型的研发。在网络分析领域中,传统的方法并没有考虑到节点的属性,而这些属性描述了特征的丰富信息。此外,由于过高的计算复杂度,动态方法也很难被应用于大规模网络。总而言之,处理由图及其属性、大规模网络和动态环境形成的高维数据需要更强大的技术,从而同时兼顾高性能和计算速度。深度学习使计算模型可以学习到具有多层次抽象的数据表征。许多计算模型和算法都需要对以网络结构形式存在的数据进行表征学习。深度学习技术在学习非线性特征时具有很大的优势。这一点在诸如计算机视觉、自然语言处理等领域中都取得了广泛的成功,在这些领域中数据有着内在的关系。在网络分析领域,深度学习可以有效地通过多层深度神经网络降低数据维度,从而完成社区发现、节点分类、链接预测等任务。这里重点研究深度学习在社区发现任务中的应用的新研究趋势,PhilipS.Yu等人的这篇综述贡献有:(1)分析了将深度学习方法用于社区发现的优势;(2)从技术的视角,总结了目前最先进的研究,并对其进行分类;(3)讨论了仍然存在的挑战,并指出了具有前景的未来工作的机遇。据AI科技评论所知,这篇综述也是首次全面回顾深度学习在社区发现中的应用,对研究人员和技术专家理解深度学习和社交网络领域的发展趋势有着巨大帮助。图2:社区发现之深度学习:进步、挑战和机遇。二、何为社区发现?简单来说,社区发现,即从网络G中发现社区C。这里提到的网络是一种特殊的图,它对现实世界中的系统(例如,互联网、学术合作网络以及社交群组)中的复杂关系进行了抽象。在这里,网络的概念主要强调的是其拓扑结构。定义1(网络G)基于图理论,有权网络可以被表征为G=(V,E,W),而无权网络可以被表征为G=(V,E),其中V和E分别代表节点的集合和边的集合,W代表E相应的权值。每条边通过权值描述连接强度或者容量。我们可以将无权图的W视为1,将其从图G中去除。子图g⊆G是对于图的一种划分,它保持了原始的网络结构。子图的划分遵循预先定义好的规则。根据不同的规则可能得到不同形式的子图。社区是一种表征真实社交现象的子图;也就是说,在群组中存在一组具有紧密关系的对象。这里遵循由Radicchi定义的强社区的概念。定义2(社区C)社区是一组网络中相互联系的子图。社区中的节点具有密集的连接,而不同社区之间的节点具有稀疏的连接。根据一种将节点聚类到不同群组中的网络划分方法给出一个社区C_i,我们得到C={C_1,C_2,...,C_k},其中k代表可以从原始网络中被划分出的社区数。被聚合到社区C_i中的节点v满足:v到社区内每个节点的内部度大于其外部度。三、为什么要使用深度学习进行社区发现?与其他机器学习方法相比,深度学习的明显优势是它能够将高维数据编码到一个新的特征表征中。通过使用以图结构的形式组织的数据表征节点之间的联系,许多深度学习方法都可以学习到节点、邻域以及子图的模式。在多数现实场景中,数据缺乏节点标签信息和关于社区的先验信息,而深度学习在无监督学习的任务中体现出了优势。除了简单地利用网络拓扑来发现社区之外,一些方法还将语义描述作为数据中的节点属性加以研究。在传统社区发现方法中,这类方法主要基于邻接矩阵和节点属性矩阵。然而,深度学习可以构建更有效的节点属性和社区结构表征。因此,深度学习填平了传统社区发现方法中存在的关键短板。为了实现这一目标,近年来的工作指出了一些具有前景的研究方向:将深度学习模型应用于社区发现,以及基于社区的特性修改深度学习模型。将深度学习应用于社区发现的前景可以被表述为:(1)通过深度学习模型提升传统社区发现方法的性能;(2)从对于深度学习至关重要的特征维度上引入更多的信息;(3)从网络实体的拓扑和属性入手,同时提升模型的学习性能和鲁棒性;(4)现在可以更好地从复杂的相关结构中对大规模网络进行检测。四、基于深度学习的社区发现为了对近年来将深度学习用于社区发现的研究进展进行概述,Philip等人从技术的角度总结了现有的方法。具体而言,他们首先对具有影响力的社区发现深度学习方法进行了分类。在每一类中,他们概述了框架、模型以及算法的技术贡献。为了研究近年来被应用于社区发现的深度学习方法,图2描述了相关深度学习方法的详细分类情况,并相应地附上了总结出来的挑战。本章将从基于深度神经网络、基于深度图嵌入、以及基于图神经网络的社区发现方法三个方面展开叙述。4.1基于深度神经网络的社区发现深度神经网络在对复杂的关系进行建模和发现的任务中具有天然的优势。考虑到现有的深度神经网络模型在社区发现领域的流形程度,作者选取了基于卷积神经网络(CNN)、基于自编码器、基于生成对抗网络(GAN)的社区发现方法进行调研。基于CNN的社区发现CNN的关键组件包含卷积操作和对卷积层结果的最大池化操作。卷积操作利用卷积核降低计算开销。随后,最大池化操作被用于特征提取,这保证了CNN的鲁棒性。得益于CNN的发展,Xin等人设计了一种用于社区发现的新型CNN,并提出了一种用于拓扑结构不完整的网络的有监督算法。由于社区发现被广泛看做一种无监督聚类任务,科研人员对基于无监督CNN的社区发现进行了研究。人们研发出了在CNN框架下的系数矩阵卷积,从而专门进行对高度稀疏的邻接矩阵的表征。基于自编码器的社区发现栈式自编码器是一种深度学习模型,它在社区发现任务中表现出了强大的性能,可以表征网络矩阵的非线性特征。研究者们发现自编码器和谱聚类在谱矩阵的低维近似方面有相似的框架,并受此启发将自编码器引入了社区发现领域。此后,Cao等人提出了一种将网络拓扑和节点属性相结合的栈式自编码器,它提升了深度神经网络隐层的泛化能力。为了进一步解决网络拓扑和节点属性之间的匹配问题,Cao等人通过引入一个控制这种匹配的折中的自适应参数,研发了一种带有图正则化的自编码器方法。着眼于网络拓扑,Xie等人提出在深度自编码器中对邻接矩阵进行变换,从而有效地学到节点相似度。同时,Bhatia和Rani提出的自编码器通过对随机游走序列建模学习节点的结构,他们通过优化社区结构的模块度对这种序列进行调优。为了避免预设社团的数量,Bhatia和Rani提出了一种层级栈式自编码器,他们找出种子节点,基于网络结构有效地将其它节点加入到社区中。此后,该领域的研究旨在自适应地学习而不是预定义社区结构。Choong等人提出的方法大大地提升了训练损失验证阶段的计算效率。这种自动选择机制保证了模型基于社区标准分配节点。Xu等人将包含具有正负号连接的网络成为有符号网络(signednetwork)。为了处理边上的有符号信息,Shen和Chung提出了一种半监督的栈式自编码器,它可以重构邻接矩阵,为进一步的深度学习网络嵌入的学习表征有符号网络。基于生成对抗网络(GAN)的社区发现GAN包含两种相互竞争的深度神经网络,因此它可以迅速调整训练精度。典型的GAN是以无监督方式运行的,它们生成与训练集中的数据具有相同统计特征的新数据。对于网络数据来说,GAN模型适用于无标签的数据集和序列化的网络划分。Yang和Leskovec等人基于对抗性机制,提出了社区隶属关系图模型(AGM)。AGM基于「节点-社区」成员隶属关系(nodemembership)的思想对重叠的社区中的节点进行编码。每个社区都有一个单一的概率,使得社区结构可以在GAN中进行。Jia等人通过将这种模型与GAN相结合研发了一种新型的框架,它根据具有中间项(即隶属图中的「节点-社区」成员隶属关系)进行社区发现。4.2基于深度图嵌入的社区发现深度图嵌入是一种将网络中的节点映射到一个低维向量空间中的技术。它将尽可能多的结构信息保存到表征中。通过图嵌入,基于网络分析的机器学习任务(例如链接预测、节点分类和节点聚类)可以利用表征的潜在特征,这样节省了主要由网络搜索引起的计算开销。对于社区发现任务来说,基于节点表征的图嵌入的输出支持聚类的任务(例如通过k-means聚类)。基于深度非负矩阵分解的社区发现非负矩阵分解(NMF)是一类将矩阵分解为两个矩阵的算法,它具有如下性质:三个矩阵都没有负的特征值。NMF自动地对输入数据的列进行聚类,通过训练阶段的误差函数,使原始矩阵和两个分解出的矩阵之间的近似误差最小。Ye等人提出了一种用于社区发现的深度NMF模型,其中深度学习架构可以促进NMF学习原始网络结构和社区结构之间的层次化映射。在某些情况下,社区发现的工作需要与对带有属性的内容的语义理解同时进行。为此,研究人员以一种带属性的图的形式表征网络,这种图同时包含了网络结构和节点的属性。Li等人特别针对带属性图的社区发现任务提出了一种嵌入方法,它将带有属性的社区发现看做一个NMF优化问题。为了使算法收敛,他们设计了一套可计算的迭代更新规则。基于深度稀疏滤波的社区发现邻接矩阵反映出了网络的稀疏性。嵌入对输入的成对关系进行编码,从而避免在稀疏矩阵上进行搜索。稀疏滤波(SF)是一种有效的深度特征学习算法,它只用到了一个超参数,但可以处理高维输入。SF的关键模块是针对L2正则化后的特征的稀疏性设计的简单代价函数。对于网络(尤其是在大型网络中)的社区发现,Xie等人基于深度稀疏滤波提出了一种高效的网络表征方法。他们通过一种无监督的深度学习算法划分网络,从而提取网络特征。基于社区嵌入的社区发现传统意义上,图嵌入重点关注单个的节点。Cavallari等人研究了另一种重要的、但是鲜有人探索过的图嵌入情况,他们重点关注对社区的嵌入。他们认为这种新的重要策略有益于社区发现任务。具体而言,社区嵌入的目标是在低维空间中学习一种社区的节点分布。我们可以通过过渡性(transitional)的图嵌入方法使用这种新的节点分布,从而很好地保留网络结构,这反过来可以提升社区发现的性能。此外,Tu等人提出了一种新的图嵌入模型,它同时探测每个节点的社区分布,并且学习节点和社区的嵌入。网络中的社区实际上反映了同一个社区中相似的观点、行为等高阶近似信息。Zhang等人提出了一种保留社区信息的社交网络嵌入方法来学习网络表征。他们提出的这种方法在社区检测任务中体现出了性能的优越性。4.3基于图神经网络的社区发现近年来,图神经网络(GNN)的迅猛发展表明了图挖掘和深度学习技术融合的趋势。基于GNN的社区发现被用于利用图神经网络对网络上的复杂关系进行建模,并捕获这种关系。例如,Chen等人提出的有监督社区发现GNN引入了一种非回溯的运算符,来定义边的邻接性。这种方法可以提升学习性能。对于GNN来说,运算符的选择非常方便。图卷积网络(GCN)是基于CNN研发的,它继承了快速学习的能力。面对图输入数据,GCN展现出了非常好的性能。GCN带来的巨大提升在于整合了考虑网络中实体概率分布的概率模型。例如,Jin等人通过马尔科夫随机场解决了包含语义信息的带属性网络中的半监督社区发现问题。Shchur和Gunnemann将「伯努利-泊松」概率模型整合到GCN中,用于重叠社区发现问题。通过这种方法,卷积层可以识别复杂的网络模式。五、挑战和机遇近年来(尤其是近5年来),用于社区发现的深度学习技术迅速发展。由于对现实世界具有重大的影响,这一领域持续受到研究人员的关注。尽管取得了令人欣喜的成果,在将深度学习应用于社区发现的领域中,仍然有一些挑战有待被更好地解决。下面,本文将总结这些挑战和机遇。挑战1:社区数未知长久以来,由于社区数未知而引发的挑战始终没有得到很好的解决。在机器学习领域中,社区发现经常被表示为一种无监督聚类任务。总现实世界的网络中提取出的研究数据大多是没有标签的。因此,我们很难获取有关社区数的先验知识。此外,大多数现有的深度学习社区发现方法(尤其是深度图嵌入),通过评估潜在特征空间中的节点相似度获取分类节点。然而,在后续的聚类算法中,聚类的目标数量仍然需要被事先定义。机遇:对于这一挑战,一个直接的解决方案是通过分析网络拓扑确定社区的数量,并将其整合到深度学习模型中。Bhatia和Rani等人遵循这一思想,采用基于随机游走的定制化PageRank算法,通过将图重构到一种线性的形式进行社区发现,并通过模块化的优化方法来应用调优。但是这些方法并不能保证网络中的每个节点可以被分配到特定的社区中。因此,我们需要为社区发现任务涉及新的模型,从而避免在分配社区的过程中漏掉某些节点。挑战2:网络层次网络层次反映了分层的网络结构,它将位于独立的层上的多个群组连接了起来,从而形成一个更加复杂的网络。而每一层都专注于特定的功能。对于多层网络,用于社区发现的深度学习技术必须实现对于两种层次上的表征的提取。而且他们将面临多层网络固有的挑战,这包括不同的关系类型以及不同层中不同的稀疏程度。机遇:为了区分不同种类的连接,Song和Thiagarajan提出了一种具有特殊子图设计的多层DeepWalk模型,从而保存了层次化的结构。但是他们并没有同时优化可以用于所有层的公用表征以及保留了特定层网络结构的局部表征。他们的目的是利用不同层之间的依赖,而实际上这种依赖关系经常被破坏。此外,对于新的设计来说,还应该考虑与层数增加有关的可伸缩性问题。因此,在研发用于具有网络层次的社区发现的深度学习方法的问题上,我们还有很长的路要走。挑战3:网络异质性网络的异质性指的是网络中实体类型的显著差异,而各种各样的节点集合和它们之间复杂的联系形成了异质网络。因此,我们应该通过不同于同质网络的方式研究异质网络中的社区发现。在应用和研发深度学习模型和算法时,应该解决异质网络实体上的概率分布的差异。机遇:大多数之前的深度学习方法并不是基于网络异质性研发的。Change等人设计了一种非线性嵌入函数,它被用于捕获异质组件之间的交互。因此,未来在异质网络上至少存在两个方面的研究机遇:(1)异质网络表征的深度图嵌入学习模型以及相关的支撑算法;(2)采用新型训练过程的特定深度学习模型,旨在学习隐藏层中的异构图属性。挑战4:边上带符号的信息许多现实世界中的网络具有边上的符号信息(即正关系或负关系)。在有符号网络的环境下,用于社区发现的深度学习方法面临的挑战是:通过不同的符号信息表示的节点之间的联系应该以不同的方式对待。机遇:一种可能的解决方案是,通过设计一种随机游走过程引入正关系边和负关系边。Hu等人遵循这一思路,基于词嵌入技术研发了一种稀疏图嵌入模型。但是,他们的方法在一些小型的真实世界中的有符号网络中的性能要差于作为对比基线的谱方法。另一种的可能的解决方案是重建一个有符号网络的邻接矩阵表征。然而,这又面临着另外一个问题:现实世界中的绝大部分邻接连接是正关系。Shen和Chung施加了更大的惩罚,使他们的栈式自编码器模型更加关注重建稀缺的负边而不是丰富的正边。然而,在大多数情况下,我们并不能获取关于大量节点的社区分配信息。因此,在有符号网络中,社区发现的高效的无监督方法仍然有待探索。挑战5:社区嵌入社区嵌入是一个新兴的研究领域,这种方法将对社区而不是每个独立的节点进行嵌入。社区嵌入重点关注对社区进行感知的高阶近似而不是在节点邻居之间的1阶或2阶近似。未来,社区嵌入研究面临的挑战有:(1)高昂的计算开销;(2)节点和社区结构之间的关系评估;(3)应用深度学习模型时发生的其它问题,例如社区之间的分部漂移。机遇:设想有一种智能的方法通过自动选择针对节点和/或社区的表征模块来支撑社区嵌入。为此,Philip等人建议从以下研究目标入手:(1)如何将社区嵌入整合到一个深度学习模型中?(2)如何为了「计算地更快」这样的目标直接嵌入社区结构?(3)如何优化整合好的深度社区发现学习模型中的超参数?挑战6:网络的动态性网络的动态性主要包含两种情况:网络拓扑的变化,以及在固定拓扑上的属性的变化。拓扑的变化会引起社区的演化。例如,添加或删除一个节点会影响全局的网络连接,因此它也会改变社区结构。对于静态网络来说,深度网络社区发现学习模型在面对每个网络的快照时,需要重新训练,这里面包含一些重复的工作。对于静态网络中的时序属性,技术上的挑战在于对于流数据的深度特征提取,这些流数据的概率分布和属性随时都会变化,它们引入图数据作为深度学习模型输入的另一部分。机遇:针对时间和空间维度上的动态特性,人们还没有研发用于社区发现的深度学习模型。未来的研究方向包括:(1)发现并识别社区间的空间变化;(2)学习深度模式,它同时对时序特征和社区结构信息进行嵌入;(3)为社区发现任务研发一种统一的深度学习方法,它可以同时处理空间和时间特征。挑战7:大规模网络大规模网络指的是拥有数以百万计的节点和边、大规模结构化模式以及高度动态性的大型网络。因此,大规模网络有其固有的规模特性(例如,社交网络中与规模无关的特性,节点度的米率分布特性),这些特性会影响社区发现任务中的聚类系数。此外,通过分解后的有关高维邻接关系的近似度度量,研究人员将分布式计算应用于可扩展的学习,同时他们也面临着鲁棒的学习控制和协作计算的问题。不断变化的网络拓扑进一步增加了近似度估计的难度。总而言之,大规模网络中的社区发现设计上述所有提到的挑战,以及可扩展学习方面的挑战。机遇:大规模网络(例如,Facebook和Twitter)不仅提出了挑战,也催生了设计更先进的深度学习方法的机遇。为了充分利用大规模网络中的丰富信息,社区上的聚类任务更需要具有较低的计算复杂度并具有灵活性的新型无监督算法。深度学习中用到的关键数据降维方法(即矩阵低秩近似)并不适用于大规模网络,它在分布式计算场景下的计算开销也是很高昂的。因此,人们急需新型的深度学习框架、模型和算法。研发应用于大规模网络的深度学习方法需要通过精度和速度来评估,这种评估方式可能是最大的挑战。六、结语如今,我们生活在各种各样的网络中。发现这些网络的内在功能和特征有助于我们全面地理解周围的环境(尤其是在社交网络中)。社区还原了描述社会现象的复杂关系。传统的社区发现方法曾经依赖的是统计推断和机器学习(谱聚类)。然而,深度学习的发展极大地提升了社区发现方法的计算性能,用于社区发现的深度学习方法近五年来被广泛地研究。在这篇综述文章中,Philip等人全方位地回顾了模型和算法研发方面相应的技术趋势,并针对基于深度学习领域社区发现进展做了详细的阐述。最为重要的是,这篇综述还指出了将深度学习用于社区发现任务时存在的七个重大挑战,这在一定程度上将为下一代社区发现研究指明方向。雷锋网雷锋网(公众号:雷锋网)雷锋网

2020年05月22日 11:50

央行数字货币将重构金融机构实务

近日,关于“央行数字货币(DC/EP)在内部测试”的消息不断传出,引发了外界对数字货币即将落地的猜想,相关概念股也连续多日上涨。  人民银行数字货币研究所日前回应称,“当前网传DC/EP信息为技术研发过程中的测试内容,并不意味着数字人民币正式落地发行。”  早在2014年,时任央行行长的周小川就已提出研发数字货币的想法,时隔6年至今仍未正式落地,由此可以看出央行在数字货币研发上的谨慎态度。  数字货币对金融业到底会产生有何影响?对反洗钱又有何助益?带着这些问题,《证券日报》记者专访了中国银行法学研究会理事肖飒。  《证券日报》记者:央行数字货币的推出,将对反洗钱领域有何助益?  肖飒:我国刑法第一百九十一条规定,明知是毒品犯罪、黑社会性质的组织犯罪、恐怖活动犯罪、走私犯罪、贪污贿赂犯罪、破坏金融管理秩序犯罪、金融诈骗犯罪的所得及其产生的收益,仍实施掩饰、隐瞒行为的,将涉嫌“洗钱罪”。需要注意的是,这里提到的不是七个罪名,而是七个类别的罪名。  对于这七大类犯罪所获得的钱财及收益,刑法专门规定,打击帮助其“洗白”的行为。对此,我认为,数字货币的普及将对破坏金融管理秩序犯罪、金融诈骗犯罪等案件的侦查及审判起到重要作用,进而会对反洗钱案件的侦查与审判有所助益。  原因不难理解,数字货币体系下,每一分钱都自带从发行之时起的详细交易信息,包括交易时间和交易对手方等。无论如何混同,都可以顺藤摸瓜、追根溯源。因此可以预见,随着数字货币普及率的升高,我国洗钱犯罪的发案率将会逐步下降。  《证券日报》记者:央行数字货币对银行业及金融机构实务会产生何种影响?  肖飒:在我国间接融资体系中,各大银行在社会生活中扮演重要角色。央行数字货币的出现与普及使用,或将改变储户与银行之间的法律关系,重构金融机构实务。  “钱”在法律上被称之为“种类物”,是相对于“特定物”而言的。种类物混同后就分不出彼此。但央行数字货币的发行,如果使用区块链等加密技术,将每一个数字货币进行特殊标示,或可实现数字货币的“特定化”。这样,储户与银行之间的关系就不再是单纯的借贷关系,从学理上分析,特定化的数字货币普及后,持有者与银行之间将成立保管合同关系。此外,数字货币普及后,储户不再需要存款保险,存款利息的调整及支付结算会变得非常方便,央行货币政策的传导效果更容易实现。  当然,也有一些专家学者提出,法币数字化后是否足以颠覆传统金融行业的运行逻辑体系,还需再做考量。现在,普通民众对现有银行及第三方支付体系已非常熟悉,央行发行的数字货币的吸引力尚未可知。对此,我的态度更为积极,也更期待数字货币带来的新变化。  《证券日报》记者:央行数字货币将给金融业法律结构上带来哪些转变?  肖飒:央行数字货币拥有强大的信用背书,符合当下特定行业需求,只要有策略地推广,应该有机会迅速普及。普及后的数字货币,在一定程度上,将深刻影响我国金融行业法律体系。比如,数字货币普及后,银行业与储户之间的法律关系、洗钱罪等罪名的实际意义等或将发生较大变化。  再从证据法的角度来看,央行数字货币本身就是证据,可以证明交易的全部链条,不仅完整,还自带“时间戳”。以后出现金融借款纠纷类案件,预计互联网法院一天就可处理成千上百宗,将大大节约司法成本,提高司法效率。  最后,从信息安全角度看,公民个人信息安全问题日益成为民众关注的焦点。根据2017年5月最高法、最高检《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》规定,公民个人信息是指“以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。”  央行数字货币一旦推出,下载钱包、线上支付、商铺留痕、回溯来源、追踪去处、钱包保密等等,这些具有可识别性的私人消费痕迹当归属于个人信息。数字货币在使用中形成的个人信息是否可以商用?归谁使用?如何使用?这一系列与公民个人信息安全紧密相关的问题也值得提前研究。

2020年04月25日 21:08