原标题:拓扑平衡对生物医学知识图上呈现学习的启示
地址:http://arxiv.org/abs/2112.06567
作者:斯蒂芬·邦纳,尤福克·基里克,奥拉·恩克维斯特,汤集安,伊恩·巴瑞特
摘要:机器学习中最近发展起来的方法已经导致了药物发现的知识地图(KG)的创建,其利用了该领域中的相关性。基于图的数据建模和KGE (KGE)方法的结合是有前途的,因为它们提供了更直观的表示,并且适合于推理任务,例如预测失去的链接。一个常见的应用是生成给定疾病的基因的有序列表,其中排序是基于基因和疾病之间关联的感知可能性。因此,至关重要的是,这些预测不仅相关,而且具有生物学意义。然而,由于集成的基础数据源或图构造中的建模选择,KG可能会直接有所偏差,其后果之一是一些实体可能在拓扑中被过度表示。我们展示了这些内在结构失衡的影响,导致紧密联系的实体在任何情况下都排名很高。我们通过不同的数据集、模型和预测任务为这种观察提供支持。此外,我们提出了各种图形扰动实验,这些实验为KGE模型比关系中编码的任何生物信息更受实体频率影响的观察提供了更多的支持。我们的结果强调了数据建模选择的重要性,并强调了实践者在解释模型输出和KG组合时需要注意这些问题。
COVID-19 大流行中有效再生数的每日活动依赖性:来自 GPS 数据的直接建模原标题:疫情新冠肺炎有效再生数的日常活动依赖性:来自GPS数据的直接模拟
地址:http://arxiv.org/abs/2203.09531
作者:小泽俊一,石田洋平,高安秀树,高安美佐子
摘要:在新冠肺炎疫情期间,政府在实施流动限制措施时面临困难,因为大城市人口流动与感染传播之间的明确定量关系尚不清楚。我们开发了一种模型,可以利用东京首都圈的智能手机GPS数据,定量估算各种场所和活动的感染风险。根据每个地点人口密度的平方定义的传染性社会接触人数,直接计算出有效繁殖数。考虑到日常活动感染率的差异,既不在家也不在工作场所的“外出”活动是其他活动的28倍以上。此外,对感染的贡献很大程度上取决于位置。我们建议,如果具有最高风险的位置或活动受到限制,有效繁殖的数量将被完全抑制。我们还讨论了Delta变异和疫苗接种的影响。
GAC:一种面向未知社会网络中用户激励的深度强化学习模型原标题:GAC:一个深度强化学习模型在未知社交网络中塔用户动机
地址:http://arxiv.org/abs/2203.09578
作者:吴,,
摘要:近年来,为人类用户提供激励以吸引他们的注意和参与已经在许多应用中被广泛使用。为了有效地激励用户,大多数激励机制都是根据用户的个人属性(比如偏好)来确定激励值。当这些信息不可用时,这些方法可能无效。同时,由于预算的限制,能够被激励的用户数量也是有限的。有鉴于此,我们打算利用在用户中的社交影响力来最大化激励。通过直接激励社交网络中有影响力的用户,他们的追随者和朋友可以在很少或没有动机的情况下被间接激励。然而,在社交网络中很难提前识别有影响力的用户,因为每对用户之间的影响力强度通常是未知的。在本文中,我们提出了一个基于端到端强化学习的框架,称为几何行动者-批评家(GAC ),以便在有限的预算下找到有效的激励分配政策。更具体地,所提出的方法可以从高级网络表示中提取信息,以学习有效的激励分配策略。该算法只需要社会网络的拓扑结构,而不依赖于用户属性的任何先验信息。我们使用三个真实世界的社交网络数据集来评估所提出的GAC的性能。实验结果表明了该方法的有效性。
STICC:一种考虑空间连续性的重复地理模式发现的多元空间聚类方法原标题:stic:一种考虑空间结构的重复地理模式发现的多元空间聚类方法
地址:http://arxiv.org/abs/2203.09611
作者:康,,吴,,吴文杰,金梦饶,,,滕飞
摘要:聚类在空之间的数据挖掘和知识发现中得到了广泛的应用。理想的多元空聚类应该考虑空之间的连续性和空之间的属性。现有的空之间的聚类方法可能面临在保持空之间连续性的同时发现重复地理模式的挑战。本文提出了一种基于空之间Toeplitz逆协方差的聚类方法(STICC ),该方法同时考虑了地理对象的属性和空之间的关系,对多元空之间进行聚类。聚类时,以每个地理对象为基本单位创建一个子区域。然后,构造一个马尔可夫随机场来表示子区域的属性依赖关系。使用空之间的一致性策略来鼓励附近的对象属于同一个集群。为了测试所提出的STICC算法的性能,我们将它应用于两个用例。通过与几种基线方法的比较,结果表明STICC在调整后的Rand指数和宏观F1评分上明显优于其他方法。还计算了连接计数的统计信息,表明STICC很好地保持了空之间的连续性。这种空之间的聚类方法可以有益于地理、遥感、交通和城市规划中的各种应用。
同质和异质网络中的回声室和信息传输偏差原标题:同质和异质网络中的回音室和信息传输偏差
地址:http://arxiv.org/abs/2203.09640
作者:费尔南多·迪亚兹-迪亚兹,马克西桑·米格尔,桑德罗·梅洛尼
摘要:我们研究在合成的无标度同/异网络中,网络结构特征和信息动力学之间的相互作用如何导致信息传递偏差。我们提供简单的数学工具来量化这些偏差。简单的感染模型不足以预测重大偏差。相比之下,混合感染模型(其中简单感染和复杂感染同时发生)会产生三种不同的齐次相关偏差:发射率和接受偏差以及回声室。在具有高度同质性的经验网络中的模拟证实了这些偏差的存在。我们的研究结果揭示了导致信息源不平等可见性、信息获取减少以及不同群体之间缺乏沟通的机制。
用电路网络逼近城市地区的人流:势场和波动-耗散关系原标题:用电路网络近似城市地区的人流量:势场和流态化-分流关系
地址:http://arxiv.org/abs/2203.09808
作者:石田洋平,小泽俊一,高安秀树,高安美佐子
摘要:由于大数据,物理定律在非物质领域的扩展取得了许多成功,人类的流动性是科学的前沿课题之一。最近的全球定位系统技术使得跟踪数百万人的详细轨迹成为可能。城市间的人流引力定律等宏观方法和个体始发地分布等微观方法备受关注。然而,要充分利用GPS数据实现大城市交通预测和城市规划,需要一个更通用、更适用的基础模型。这里,基于将运动的人视为带电粒子的新思想,我们引入一种复杂的方法,将宏观的人流量映射到定义在大都市区的假想电路上的电流。发现电导几乎与每个位置的最大电流成正比,电位的时间变化可以很好地描述人在早晚的同步流动。令人惊讶的是,著名的涨落耗散定理成立,即电流的变化与类似普通材料的导电率成正比。特别是在疫情期间,这些工具可能为管理堕胎的决策提供有价值的见解。
网络方法揭示了 COVID-19 下交通对空气污染的时空影响原标题:新冠肺炎下路网回归交通对空气极化的时空影响
地址:http://arxiv.org/abs/2203.09815
作者:,赛尼扬,凯音,赵志丹,,景芳凡
摘要:空空气污染引起了广泛的环境和健康问题,严重影响了城市居民的生活质量。交通对人类生活非常重要,其排放物是主要污染源,加剧了城市空空气污染。然而,城市交通排放和空空气污染之间的复杂相互作用尚未得到揭示。特别是新冠肺炎的蔓延,导致各个城市根据当地疫情情况采取不同的交通限行政策,使得探索城市交通与空气体污染的关系成为可能。这里,我们通过重构一个基于交通指数和空气体质量指数的多层复杂网络,探讨交通对空气体污染的影响。我们发现,疫情爆发后京津冀(BTH)、成渝经济圈(CCS)、华中地区(CC)的空气体质量受周边交通状况影响显著。在不同的抗疫阶段,其他城市的交通对空空气污染的影响在第二阶段(也称病毒遏制初期进展)达到最大。对于BTH和CC地区,交通对空燃气质量的影响在前两个阶段有所增加,之后有所下降,而对于CC地区,区际影响明显出现在第三个阶段。但是,对于其他地区来说,变化并不明显。我们提出的基于网络的框架为交通和环境提供了一个新的视角,并可能有助于指导政府制定空空气污染缓解和交通限制政策。
转推社区揭示仇恨言论的主要来源原标题:转发社区揭示仇恨言论的主要来源
地址:http://arxiv.org/abs/2105.14898
作者:Bojan Evkoski,Andraz Pelicon,Igor Mozetic,Nikola Ljubesic,Petra Kralj Novak
摘要:我们已经解决了识别Twitter上仇恨言论主要来源的挑战性问题。一方面,我们仔细标注了大量仇恨言论推文,并部署了先进的深度学习来生成高质量的仇恨言论分类模型。另一方面,我们创建转发网络,检测社区并监控它们随时间的演变。这种组合方法应用于三年的斯洛文尼亚推特数据。我们报道了一些有趣的结果。仇恨言论主要是与政治和意识形态问题相关的攻击性推文。不可接受的推文的份额随着时间的推移适度增加,从最初的20%到2020年底的30%。不可接受的推文比可接受的推文被转发的频率更高。大约60%不可接受的推文是由温和的右翼社区产生的。推特账号和媒体账号发布的不可接受的推文明显少于个人账号发布的。事实上,不可接受的推文的主要来源是匿名账户,以及在2018年至2020年期间被暂停或关闭的账户。
声明:Arxiv的文章摘要版权归论文原作者所有,机器翻译后自行更正。未经允许,请勿转载。本系列在微信官方账号“netsci”和个人博客同步更新。