Hi~同学! 想和技术大牛一起参与开源吗? 如果你对数据库、PostgreSQL 感兴趣,那么就来参与开源之夏吧!一年一度的开源之夏已经开启,是高校学生参与开源的不二之选,绝对不容错过。 IvorySQL 社区再一次参与其中,发布了 2 个项目。欢迎各位同学来认领哦! 开源之夏简介 开源之夏是由中国 ...
2020年1月COPU(中国开源软件推进联盟)成员开会讨论面向高校的开源示范课程,由联盟副秘书长北京大学荆琦老师牵头筹备,并首先在北大软微学院试点。本次是中国PostgreSQL分会联合会员企业应邀第五次参与授课,课程吸引了国内头部开源大厂积极加入,包括众多开源项目。课程面向北大研一学生(研一第二学 ...
1. 质量可观测性服务 1.1. 数据用户需要确保峰值实际上反映了真实情况,而不是有数据质量问题的结果 1.2. 导致质量问题的情况 1.2.1. 不正确的源模式更改 1.2.2. 数据元素属性的更改 1.2.3. 接入问题 1.2.4. 源系统和目标系统的数据不同步 1.2.5. 处理失败 1.2 ...
[20250506]drop table的恢复2.txt--//尝试drop table的恢复,前提没有备份的情况不得已为之的方法,前面测试提到drop table时清除段头里面的Extent Map以及--//Auxillary Map的信息。这样通过建立新表的方式也只能像truncate tab ...
【IoTDB 视频小课】第十五期,双模型科普继续,这次是大家最关心的选择问题! 关于 IoTDB,关于物联网,关于时序数据库,关于开源... 一个问题重点,3-5 分钟,我们讲给你听: 不再迷茫,我们告诉你如何选择! 上期视频我们详细解读了为什么 IoTDB 要推出树表双模型, 那么树模型和表模型的 ...
2025 年 5 月 13 日至 16 日(蒙特利尔时间),一年一度的 PostgreSQL 开发者大会 PGConf.dev(原 PGCON 会议)将在加拿大蒙特利尔盛大举行。同去年一样,在本次大会开幕的前一天同样会举办另外一个专场活动——Postgres Extensions Day,此活动会聚 ...
1. 模型部署服务 1.1. 编写一次性脚本来部署模型并不困难 1.2. 针对模型训练类型(在线与离线)、模型推理类型(在线与离线)、模型格式(PAML、PFA、ONNX等)、终端类型(Web服务、IoT、嵌入式浏览器等)以及性能要求(由预测/秒和延迟定义)的不同组合,管理这些脚本非常困难 1 ...
本文深入解析了Redis的六大核心数据结构,涵盖动态字符串(SDS)如何解决C字符串的性能瓶颈、整数集合(IntSet)的类型升级机制、字典(Dict)的渐进式rehash策略、压缩列表(ZipList)的连锁更新挑战,以及快速列表(QuickList)和... ...
1. 管道编排服务 1.1. 查询或程序的运行时实例称为作业 1.1.1. 作业调度需要考虑到正确的依赖项 1.2. 作业管道需要按照特定的顺序进行编排,从数据接入到数据准备再到数据处理 1.3. 痛点 1.3.1. 定义和管理作业之间的依赖项是即席的,容易出错 1.3.1.1. 数据用户需要在管道 ...
实践环境 openGauss 6.0.0 LTS 企业版 下载地址:https://opengauss.org/zh/download/archive/ openEuler-22.03-LTS-SP4-x86_64-dvd.iso 下载地址:https://www.openeuler.org/zh/ ...
本文介绍在Windows电脑中,下载、安装、部署并运行PostgreSQL与PostGIS数据库服务的方法。 PostgreSQL是一种功能强大的开源关系型数据库管理系统(RDBMS),以其稳定性、可靠性和丰富的功能而闻名;其支持多种高级特性,包括事务完整性、多版本并发控制、复杂查询、外键、触发器、 ...
本文介绍了大数据的核心特征与技术演进,并深入剖析了Apache Flink作为实时计算引擎的三大核心优势:时间管理(Watermark机制)、状态管理(算子状态与键控状态)以及容错机制(精确一次语义)。通过对比批处理与流处理架构,展示了Flink如何在电商、金融、推荐系统等实际场景中实现毫秒级的数据... ...
1. 查询优化服务 1.1. 好查询和坏查询之间的差别非常明显 1.2. 重复且长时间运行的查询是需要调优的 1.3. 痛点 1.3.1. 像Hadoop、Spark和Presto这样的查询引擎有太多的旋钮 1.3.1.1. 对于大多数数据用户来说,理解这些旋钮的功能和影响需要深入了解查询引擎的内部 ...
[20250501]truncate table恢复实战.txt--//别人数据库不小心truncate table,需要恢复,本以为3-4个小时可以完成,结果几乎使用1倍的工作时间。--//往往是节前最容易出错的时候。--//这类事情虽然以前做过练习,实战的情况几乎没有,在测试环境重新模拟整个的恢 ...
这是一道我改编的 SQL 题目,不仅需要你输出连续的空座,还需要你去计算观影的最优位置。经过改编后,我相信是蛮有趣味的一道题。 ...
1. A/B测试服务 1.1. 部署多个模型并将其呈现给不同的客户集 1.2. 基于客户使用的行为数据来选出更好的模型 1.3. A/B测试(也称为桶式测试、拆分测试或受控实验)是一个从产品变化、新特性或与产品增长相关的假设等方面来评估用户满意度的标准方法,并被广泛用于制定数据驱动的决策 1.4. ...
Kafka是什么? Kafka是Apache基金所维护的一个中间件项目,它是一个开源的分布式事件流平台,广泛用于构建高性能的数据管道、流式分析、数据集成以及关键业务应用。 这里面有几个点需要说明一下,开源自然不用讲 分布式简单的理解为通过网络通信实现多台服务器部署,联动提供服务,保证容错和提高效率。 ...
1. 持续集成服务 1.1. 通常,机器学习模型管道随着源模式的变化、特征逻辑、依赖数据集、数据处理配置、模型算法、模型特征和配置而不断演进 1.2. 在传统的软件工程中,代码是不断更新的,各团队每天都要进行多次修改 1.3. 机器学习管道的持续集成存在多个痛点 1.3.1. 需要全面跟踪涉及数据、 ...
1. 模型训练服务 1.1. 如果洞察是机器学习模型,则需要进行模型训练 1.2. 典型的数据科学家在训练过程中会探索数百个模型组合,以找到最准确的模型 1.3. 探索包括尝试机器学习算法、超参数值和数据特征的不同排列组合 1.4. 挑战 1.4.1. 随着数据集大小不断扩大和复杂的深度学习模型数量 ...
概述 本文主要是写Ubuntu22.04搭建MySQL8.0.26版本 环境信息 IP 系统 规格 10.0.0.10 Ubuntu22.04 2c4g 数据库服务安装步骤 下载前置依赖 # 下载libtinfo5、libnuma1依赖 [root@lb ~]# apt update -y && a ...