0%

RDMA(RemoteDirect Memory Access)技术全称远程直接内存访问,就是为了解决网络传输中服务器端数据处理的延迟而产生的。它将数据直接从一台计算机的内存传输到另一台计算机,无需双方操作系统的介入。这允许高吞吐、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。RDMA通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理能力。它消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽和CPU周期用于改进应用系统性能。

本次详解我们从三个方面详细介绍RDMA:RDMA背景、RDMA相关工作、RDMA技术详解。

阅读全文 »

虚拟内存是计算机系统内存管理的一种技术。它使得应用程序认为它拥有连续的可用的内存(一个连续完整的地址空间),而实际上,它通常是被分隔成多个物理内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。目前,大多数操作系统都使用了虚拟内存,如Windows家族的“虚拟内存”;Linux的“交换空间”等。

技术介绍

阅读全文 »

Introduce

Apache Flink 提供了可以恢复数据流应用到一致状态的容错机制。确保在发生故障时,程序的每条记录只会作用于状态一次(exactly-once),当然也可以降级为至少一次(at-least-once)。

阅读全文 »

解决的问题:

upload successful
虽然现有的专用图系统能够实现广泛的系统优化,但也是有代价的。 图只是较大的分析过程的一部分,通常将非结构化的图形和表格式数据组合在一起。 因此,分析流水线(例如图11)被迫组成多个系统,这增加了复杂性并导致不必要的数据移动和重复。 此外,为了追求性能,图形处理系统通常会放弃容错,以支持快照恢复。 最后,作为专门的图处理系统,图处理框架通常不能享受分布式数据流框架的广泛支持。

阅读全文 »

ABSTRACT

场景:社交网络,城市监控和市场馈送处理等应用需要有状态的流式查询,状态流查询不仅要查询流式数据,还要查询存储的数据来及时提取有用的信息。实时流数据提供的有用信息,也需要持续不断地整合到存储的数据中,以便为上述和未来提供查询服务。
然而,先前的流式处理系统或者侧重于流计算,或者不是有状态的,或者不能提供低延迟和高吞吐量来处理快速发展的Linked数据,并且能够支持不断增加的查询并发性。
Wukong + S采用集成设计,将流处理和持久化存储相结合,实现高效的状态共享,避免了传统复合设计(如Storm / Heron + Wukong)中的跨系统成本和次优查询性能。 Wukong + S使用混合存储来区分管理持久的数据和瞬时数据,并提供有效的流索引和本地分区,以便快速访问流数据。 Wukong + S进一步提供分散的矢量时间戳和有界的快照标量化,以节省内存使用量的节点和大量查询。

阅读全文 »

(bigraph)是有两个相互独立的位置图和连接图构成。二分图的概念是由图灵奖获得者Milner提出的,其目的为普适计算提供统一的元模型。

若无向图G = 的结点集V能够划分为两个子集V1,V2,满足V1∩V2 = F(空集),且V1∪V2 = V(全集),使得G中任意一条边的两个端点,一个属于V1,另一个属于V2,则称G为偶图(Bipartite Graph)或二分图(Bigraph)。V1和V2称为互补结点子集,偶图也可记为G =

阅读全文 »

面对高性能计算、大数据分析和浪涌型IO高并发、低时延应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求。这要有体现在处理延时过大,数十微秒;多次内存拷贝、中断处理,上下文切换、复杂的TCP/IP协议处理、网络延时过大、存储转发模式和丢包导致额外延时。接下来我们继续讨论RDMA技术、原理和优势,看完文章你就会找到为什么RDMA可以更好的解决这一系列问题。

upload successful

阅读全文 »