跳到主要内容

TDengine 简介

TDengine 是涛思数据推出的一款开源时序数据库,同时也是一个高效的存储、查询、分析时序数据库的平台,适用于物联网、车联网、工业互联网、运维监测等领域。在使用方面,TDengine 提供了类似于关系型数据库 MySQL 的操作,方便用户快速上手。

项目背景

在上世纪七、八十年代,Oracle 等公司推出了关系数据库,目的是为了解决银行、保险公司的信息化问题,因此设计了结构化的数据库。后来随着互联网的兴起,人们发现互联网数据的特征与银行数据的特征有很大差别,它们有很多非结构化的数据,比如网络爬虫爬到的数据、社交媒体的数据,它们都是非结构化的,于是出现了 NoSQL 数据库(比如 HBase、MongoDB 等),许多互联网应用开始采用 NoSQL 的方式处理。进入二十一世纪,物联网、车联网、工业互联网得到了发展,这些场景的数据特征是“时序的”,并且会高速增长,无论是关系型数据库和 NoSQL 数据库都不太适合处理,因此人们提出了“时序数据库”的新方式,而 TDengine 就是处理物联网场景时序数据的专用工具之一。

如果把 Oracle 的时代称为数据技术 1.0 时代,把互联网技术称为 2.0 时代,那么物联网数据就是 3.0 时代。其发展空间是非常大的,而且是真正的一代技术,是一个千亿级市场。

功能特性

TDengine 的模块之一是时序数据库。同时,为减少研发的复杂度、系统维护的难度,TDengine 还提供缓存、消息队列、订阅、流式计算等功能,为物联网和工业互联网大数据的处理提供全栈的技术方案,是一个高效易用的物联网大数据平台。与 Hadoop 等典型的大数据平台相比,TDengine 具有如下鲜明的特点:

  • 10 倍以上的性能提升:定义了创新的数据存储结构,单核每秒能处理至少 2 万次请求,插入数百万个数据点,读出一千万以上数据点,比现有通用数据库快十倍以上。
  • 硬件或云服务成本降至 1/5:由于超强性能,计算资源不到通用大数据方案的 1/5;通过列式存储和先进的压缩算法,存储占用不到通用数据库的 1/10。
  • 全栈时序数据处理引擎:将数据库、消息队列、缓存、流式计算等功能融为一体,应用无需再集成 Kafka、Redis、HBase、Spark、HDFS 等软件,大幅降低应用开发和维护的复杂度成本。
  • 强大的分析功能:无论是十年前还是一秒钟前的数据,指定时间范围即可查询。数据可在时间轴上或多个设备上进行聚合。即席查询(Ad Hoc)可通过 Shell、Python、R、MATLAB 随时进行。
  • 高可用性和水平扩展:通过分布式架构和一致性算法,通过多复制和集群特性,TDengine 确保了高可用性和水平扩展性以支持关键任务应用程序。
  • 零运维成本、零学习成本:安装集群简单快捷,无需分库分表,实时备份。类似标准 SQL,支持 RESTful,支持 Python、Java、C/C++、C#、Go、Node.js 等操作接口,使用方法与 MySQL 相似。
  • 核心开源:除了一些辅助功能外,TDengine 的核心是开源的。企业再也不会被数据库绑定了。这使生态更加强大,产品更加稳定,开发者社区更加活跃。

应用场景

作为一个物联网(IoT)大数据平台,TDengine 几乎适用于所有的物联网应用场景,同时也适用于物联网以外的一些时序数据场景,如 CRM、ERP 等系统。

下面是一些具体的应用场景:

  • IT 基础设施、服务器、机房、各种应用的监测和分析;
  • 油井开采、石油运输管线、炼化、运输车队、加油站等实时监测;
  • 电梯、锅炉、数控机床、挖掘机、各种大型机械设备实时监测;
  • 智能电表、电网骨干网、配网、各种发电设备实时监测和分析;
  • 水表、气表、城市管线、智慧家庭、智慧楼宇、智慧城市;
  • 自行车、汽车、出租、高铁、飞机、轮船等各种出行工具;
  • 上网记录、通话记录、用户行为、金融、证券交易记录;
  • 天气、空气、湖泊、河流、地质、森林、环境等的监测;
  • 各种物联网、车联网、工业互联网的结构化日志数据处理。

相关链接