分布式重复检测系统构思
2017-10-24 16:43
134 查看
在说构思之前,先讲讲元数据的概念。
元数据(MetaData)是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。元数据是一种二进制信息,用以对存储在公共语言运行库可移植可执行文件(PE)或存储在内存中的程序进行描述。将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中,而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。在模块或程序集中定义和引用的每个类型和成员都将在元数据中进行说明。当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类、成员、继承等信息。每个人都会用到的一个东西,上传和下载功能,那么在上传的时候,如果每次都直接上传,那么很有可能会出现重复上传的情况,也就是说会消耗无辜的流量。那么,应该怎么做,应该在每次上传的时候,做的第一件事情,不是直接上传,而是将你要上传文件的相关信息传到服务器端,然后服务器进行判断,此文件是否已经存在了,如果已经存在了,那么就不需要重复上传。这样子,就可以节省一定的通信流量,也能提高效率。
元数据(MetaData)是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。元数据是一种二进制信息,用以对存储在公共语言运行库可移植可执行文件(PE)或存储在内存中的程序进行描述。将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中,而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。在模块或程序集中定义和引用的每个类型和成员都将在元数据中进行说明。当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类、成员、继承等信息。每个人都会用到的一个东西,上传和下载功能,那么在上传的时候,如果每次都直接上传,那么很有可能会出现重复上传的情况,也就是说会消耗无辜的流量。那么,应该怎么做,应该在每次上传的时候,做的第一件事情,不是直接上传,而是将你要上传文件的相关信息传到服务器端,然后服务器进行判断,此文件是否已经存在了,如果已经存在了,那么就不需要重复上传。这样子,就可以节省一定的通信流量,也能提高效率。
相关文章推荐
- 分布式开放消息系统RocketMQ的原理与实践(消息的顺序问题、重复问题、可靠消息/事务消息)
- 保障分布式系统的稳定性(二):心跳检测 容量与水位
- 深度学习之《社交网络问答系统-问题重复检测任务》实现
- 高并发 sql 生成不重复编号 (订单号) & 如何在高并发分布式系统中生成全局唯一Id
- 分布式系统之故障检测及恢复
- 分布式系统的心跳检测机制优化
- 基于移动代理的分布式入侵检测系统
- 高并发 sql 生成不重复编号 (订单号) & 如何在高并发分布式系统中生成全局唯一Id
- [导入]Remoting系统构思及分布式注册
- 高并发 sql 生成不重复编号 (订单号) & 如何在高并发分布式系统中生成全局唯一Id
- 10031---高并发 sql 生成不重复编号 (订单号) & 如何在高并发分布式系统中生成全局唯一Id
- 一个分布式***检测系统的研究与设计
- WEB系统搭建-分布式集群的几种构思
- 分布式系统重复/并发请求解决思路
- MAC地址记录与重复检测系统
- 防火墙的局限与入侵检测系统的特征
- 分布式系统事务一致性解决方案
- 分布式集群运营管理系统-项目简介
- 分布式系统的一致性原理
- 专訪阿里陶辉:大规模分布式系统、高性能server设计经验分享