Some work

时间:2019-07-05
本文章向大家介绍Some work,主要包括Some work使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

将论文Learning Convolutional Neural Networks for Graphs(空间域的GCN应用在阿里达摩学院图计算的用户相似上),也就是看能不能用空间域GCN来得到用户的向量。
找相似的两个用户,可以通过找这两个用户分别与同一个item建立一个图,看这两个图是不是相似,可以用卷积。

1、数据挖掘联动多级处理的方法,能够挖掘出潜在的区域关联,可以应用在环境,人体等领域。

2、人工智能的防御。现在有人工智能,人工智能的攻击,还没有防御的相关研究。

我们可以总结出数据挖掘的几个比较重要的发展趋势:

• 多模态数据挖掘:随着技术可以更加有效地从多种渠道收集数据,比如音频、视频、文字、图像等,这也是现在越来越被重视的一个方向,而数据本身也更更加有效的以各种方式进行存储。如何进行跨领域的有效建模,比如多任务学习 (multi-task learning),迁移学习 (transfer learning),强化学习(reinforcement learning)等,都是重点的发展模型。

• 全域数据挖掘:该方法涉及从移动设备和 IoT 设备等挖掘数据以获得关于个人的信息。尽管在这种类型中存在诸如复杂性、隐私性、成本等的若干挑战,但是该方法在各种行业中具有很大的机会,特别是在研究人机交互方面。

• 分布式数据挖掘:这种类型的数据挖掘越来越受欢迎,因为它涉及挖掘存储在不同公司位置或不同组织的大量信息,并且任何的算法也已经很难在单机版对全网数据进行训练和推理。此外适应度更高的算法也可以用于从不同位置提取数据,并根据它们提供适当的见解和报告。

• 时空数据挖掘:这是一种新的趋势类型的数据挖掘,其包括从有周期性和季节性趋势的环境,天文和地理数据中提取信息,其中还包括从外太空获取的图像。这种类型的数据挖掘可以揭示诸如距离和拓扑的各个方面,其主要用于动态的地理信息系统和其他导航应用,这种做法也有助于分析在正常系列事件之外发生的随机事件。与我们密切相关的问题也是越来越普及,比如新零售,如何有效结合动态的线上线下数据对访问顾客的购买模式和行为进行建模,就是一个非常有挑战的时空数据模型问题。

• 图计算模型在大数据公司,尤其是 IT 公司是非常流行的一大类模型,因为是很多实际问题的最直接的解决方法。图计算大致可以分为同构图(homogeneous graph)和异构图(heterogeneous graph),后者是在节点或者边的种类大于等于 2 的情况下。此外知识图谱也是异构图中的一种重要应用,即一种基于语义学的图模型(a semantic graphical model)。除了了传统的图计算模型,如大家熟知的 LPA、 Random Walk 及各种变形、CC 等,随着深度学习的大量成功落地,Graph Embedding 也变得越来越流行。简单说来,Graph Embedding 也是通过深度学习模型对节点或者边进行 feature engineering。近几年,随着数据的多样化,数据量的大幅度提升和算力的突破性进展,图计算的发展和应用有井喷之势,各大公司也相应推出图计算平台,例如 Google Pregel, Facebook Giraph,腾讯星图,华为 GES 等。