索引
符號
- 3FS(分散式檔案系統), 分散式檔案系統
A
- 中止(事務), 事務, 原子性
- 級聯, 沒有髒讀
- 在兩階段提交中, 兩階段提交(2PC)
- 樂觀併發控制的效能, 可序列化快照隔離的效能
- 重試已中止的事務, 處理錯誤和中止
- 抽象, 雲服務的分層, 簡單性:管理複雜度, 資料模型與查詢語言, 事務, 總結
- 意外複雜性, 簡單性:管理複雜度
- 問責制, 責任與問責
- 會計(財務資料), 總結, 不可變事件的優點
- Accumulo(資料庫)
- ACID 屬性(事務), ACID 的含義
- 確認(訊息), 確認與重新傳遞
- active/active replication(見 multi-leader replication)
- active/passive replication(見 基於領導者的複製)
- ActiveMQ(訊息系統), 訊息代理, 訊息代理與資料庫的對比
- 分散式事務支援, XA 事務
- ActiveRecord(物件關係對映器), 物件關係對映(ORM), 處理錯誤和中止
- activity (workflows)(見 workflow engines)
- Actor 模型, 分散式 actor 框架
- (另見 event-driven architecture)
- 與流處理的比較, 事件驅動架構與 RPC
- 自適應容量, 偏斜的工作負載與緩解熱點
- Advanced Message Queuing Protocol(見 AMQP)
- 航空航天系統, 拜占庭故障
- Aerospike(資料庫)
- 強一致性模式, 單物件寫入
- AGE(圖資料庫), Cypher 查詢語言
- 彙總
- 資料立方體和已實現檢視, 物化檢視與資料立方體
- 分批處理, 排序與記憶體聚合
- 流程中, 流分析
- 聚合管道(MongoDB), 正規化、反正規化與連線, 文件的查詢語言
- 敏捷, 可演化性:讓變化更容易
- 最小化不可逆性, 批處理, 應用演化後重新處理資料
- 充滿自信地快速前進, 端到端原則重現
- 一致意見, 單值共識, 原子提交作為共識
- (另見 共識)
- AI (artificial intelligence)(見 machine learning)
- AI Act (European Union), 資料系統、法律與社會
- Airbyte, 資料倉庫
- Airflow(工作流排程器), 持久化執行與工作流, 批處理, 工作流排程
- 雲資料倉整合, 查詢語言
- 用於 ETL, 提取-轉換-載入(ETL)
- 阿卡邁
- 響應時間研究, 平均值、中位數與百分位點
- 演算法
- 演算法正確性, 定義演算法的正確性
- B樹, B 樹-B 樹變體
- 分散式系統, 系統模型與現實
- 歸併排序, 構建和合並 SSTable, 混洗資料
- 排程, 資源分配
- SSTable 與 LSM 樹, SSTable 檔案格式-壓實策略
- 全互聯複製拓撲, 多主複製拓撲
- AllegroGraph(資料庫), 圖資料模型
- SPARQL 查詢語言, SPARQL 查詢語言
- ALTER TABLE 語句(SQL), 文件模型中的模式靈活性, 編碼與演化
- 亞馬遜
- Dynamo(見 Dynamo(資料庫))
- 響應時間研究, 平均值、中位數與百分位點
- Amazon Web Services (AWS)
- Aurora(見 Aurora(雲資料庫))
- ClockBound(見 ClockBound(時間同步))
- 正確性測試, 形式化方法和隨機測試
- DynamoDB(見 DynamoDB(資料庫))
- EBS(見 EBS(虛擬塊裝置))
- Kinesis(見 Kinesis(訊息系統))
- Neptune(見 Neptune(圖資料庫))
- 網路可靠性, 實踐中的網路故障
- S3(見 S3(物件儲存))
- 放大
- AMQP(高階訊息佇列協議), 訊息代理與資料庫的對比
- (另見 messaging systems)
- 比較基於日誌的郵件, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 訊息順序, 確認與重新傳遞
- 分析系統, 分析型與事務型系統
- 分析, 分析型與事務型系統-記錄系統與派生資料
- 與事務處理的比較, 事務處理與分析的特徵
- 資料正常化, 正規化的權衡
- data warehousing(見 data warehousing)
- predictive(見 predictive analytics)
- 與批次處理的關係, 分析(Analytics)-分析(Analytics)
- 計劃, 星型與雪花型:分析模式-星型與雪花型:分析模式
- 快速隔離查詢, 快照隔離與可重複讀
- 流式分析, 流分析
- 分析工程, 分析型與事務型系統
- 反熵, 追趕錯過的寫入
- Antithesis(確定性模擬測試), 確定性模擬測試
- Apache Accumulo(見 Accumulo)
- Apache ActiveMQ(見 ActiveMQ)
- Apache AGE(見 AGE)
- Apache Arrow(見 Arrow(資料格式))
- Apache Avro(見 Avro)
- Apache Beam(見 Beam)
- Apache BookKeeper(見 BookKeeper)
- Apache Cassandra(見 Cassandra)
- Apache Curator(見 Curator)
- Apache DataFusion(見 DataFusion(查詢引擎))
- Apache Druid(見 Druid(資料庫))
- Apache Flink(見 Flink(處理框架))
- Apache HBase(見 HBase)
- Apache Iceberg(見 Iceberg(表格式))
- Apache Jena(見 Jena)
- Apache Kafka(見 Kafka)
- Apache Lucene(見 Lucene)
- Apache Oozie(見 Oozie(工作流排程器))
- Apache ORC(見 ORC(資料格式))
- Apache Parquet(見 Parquet(資料格式))
- Apache Pig(查詢語言), 查詢語言
- Apache Pinot(見 Pinot(資料庫))
- Apache Pulsar(見 Pulsar)
- Apache Qpid(見 Qpid)
- Apache Samza(見 Samza)
- Apache Solr(見 Solr)
- Apache Spark(見 Spark;見 Spark(處理框架))
- Apache Storm(見 Storm)
- Apache Superset(見 Superset(資料視覺化軟體))
- Apache Thrift(見 Thrift)
- Apache ZooKeeper(見 ZooKeeper)
- Apama (流式分析), 複合事件處理
- append-only files(見 logs)
- Application Programming Interfaces (APIs), 資料模型與查詢語言
- 用於改變流, 變更流的 API 支援
- 分散式事務, XA 事務
- 服務費用, 流經服務的資料流:REST 與 RPC-RPC 的資料編碼與演化
- (另見 services)
- 可演化性, RPC 的資料編碼與演化
- RESTful, Web 服務
- application state(見 國家)
- approximate search(見 similarity search)
- 檔案儲存、資料庫資料, 歸檔儲存
- arcs(見 edges)
- ArcticDB(資料庫), 資料框、矩陣與陣列
- 算術平均值, 平均值、中位數與百分位點
- 陣列
- Arrow(資料格式), 列式儲存, DataFrames
- artificial intelligence(見 machine learning)
- ASCII text, Protocol Buffers
- ASN.1 (schema language), 模式的優點
- 關聯表格, 多對一與多對多關係, 屬性圖
- 同步網路, 不可靠的網路, 術語表
- 同步複製, 同步複製與非同步複製, 術語表
- 故障資料損失, 領導者故障:故障轉移
- 從同步跟蹤器讀取, 複製延遲的問題
- 有多個領導, 多主複製
- 非同步傳輸模式, 我們不能簡單地使網路延遲可預測嗎?
- 原子廣播, 共享日誌作為共識
- 原子鐘, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
- (另見 clocks)
- 原子性, 術語表
- 原子自增, 單物件寫入
- 比較和設定, 條件寫入(比較並設定), 什麼使系統具有線性一致性?
- (另見 比較和設定)
- 異常資料, 正規化的權衡
- 獲取和新增/遞增, ID 生成器和邏輯時鐘, 共識, 獲取並增加作為共識
- 寫入操作, 原子寫操作
- 原子性, 原子性, 單物件與多物件操作, 術語表
- 可審計性, 信任但驗證-用於可審計資料系統的工具
- 設計, 為可審計性而設計
- 自動審計系統, 不要盲目信任承諾
- 透過不可改變性, 不可變事件的優點
- 可審計資料系統工具, 用於可審計資料系統的工具
- Aurora(雲資料庫), 雲原生系統架構
- Aurora DSQL(資料庫)
- 快速隔離支援, 快照隔離與可重複讀
- 自動縮放, 運維:自動/手動再平衡
- Automerge (CRDT library), 同步引擎的利弊
- 可用性, 可靠性與容錯
- 可用區, 透過冗餘容忍硬體故障, 讀己之寫
- Avro(資料格式), Avro-動態生成的模式
- 動態生成的計劃, 動態生成的模式
- 物件容器檔案, 但什麼是寫入者模式?, 歸檔儲存
- 讀者決定作家的計劃, 但什麼是寫入者模式?
- 計劃演變, 寫入者模式與讀取者模式
- 批次處理中的用途, MapReduce
- awk (Unix 工具) (英語)., 簡單日誌分析, 簡單日誌分析, 分散式作業編排
- Axon Framework, 事件溯源與 CQRS
- Azkaban(工作流排程器), 批處理
- Azure Blob Storage(物件儲存), 雲服務的分層, 設定新的副本
- 有條件的標題, 隔離殭屍程序和延遲請求
- Azure managed disks, 儲存與計算的分離
- Azure SQL DB(資料庫), 雲原生系統架構
- Azure Storage, 物件儲存
- Azure Synapse Analytics(資料庫), 雲原生系統架構
- Azure Virtual Machines
- 現場虛擬機器, 故障處理
B
- B樹(指數), B 樹-B 樹變體
- B+ trees, B 樹變體
- 分支因子, B 樹
- comparison to LSM-trees, 比較 B 樹與 LSM 樹-磁碟空間使用
- 崩潰恢復, 使 B 樹可靠
- 透過分割頁面增長, B 樹
- 不可變變種, B 樹變體, 索引與快照隔離
- 與硬分裂相似, 重新平衡鍵範圍分片資料
- 變體, B 樹變體
- B2(物件儲存), 分散式檔案系統
- Backblaze B2(見 B2(物件儲存))
- 後端, 資料系統架構中的權衡
- 返回, 指數, 描述效能, 處理錯誤和中止
- 背壓, 描述效能, 讀取效能, 訊息傳遞系統, 術語表
- 備份
- 向後相容, 編碼與演化
- BadgerDB(資料庫)
- 可序列事務, 可序列化快照隔離(SSI)
- BASE, contrast to ACID, ACID 的含義
- 擊打彈殼(Unix), OLTP 系統的儲存與索引
- 批處理, 批處理-本章小結, 術語表
- 方案規劃和職能規劃, MapReduce
- 惠益, 批處理
- 結合流處理, 統一批處理和流處理
- 與流處理的比較, 流處理
- 資料流引擎, 資料流引擎-資料流引擎
- 過失容忍, 故障處理, 訊息傳遞系統
- 資料整合, 批處理與流處理-統一批處理和流處理
- 圖表和迭代處理, 機器學習
- high-level APIs and languages, 查詢語言-查詢語言
- 雲資料倉庫中, 查詢語言
- 在分散式系統中, 分散式系統中的批處理
- 加入和分組, JOIN 與 GROUP BY-JOIN 與 GROUP BY
- 限制, 批處理
- 基於日誌的資訊和, 重播舊訊息
- 保持衍生狀態, 維護派生狀態
- 衡量業績, 批處理
- 模式, 批處理模型
- 資源分配, 資源分配-資源分配
- 資源管理員, 分散式作業編排
- 排程器, 分散式作業編排
- 服務衍生資料, 對外提供派生資料-對外提供派生資料
- 移動資料, 混洗資料-混洗資料
- 任務執行, 分散式作業編排
- 使用大小寫, 批處理用例-對外提供派生資料
- 使用 Unix 工具(例如), 使用 Unix 工具的批處理-排序與記憶體聚合
- 批處理框架
- 與作業系統的比較, 分散式系統中的批處理
- Beam (資料流庫), 統一批處理和流處理
- BERT (language model), 向量嵌入
- 偏向, 偏見與歧視
- bidirectional replication(見 multi-leader replication)
- 泥漿大球, 簡單性:管理複雜度
- 大資料
- 對資料最小化, 資料系統、法律與社會, 立法與自律
- BigQuery(資料庫), 雲原生系統架構, 雲資料倉庫, 批處理
- Bigtable(資料庫)
- 硬化計劃, 按鍵的範圍分片
- 儲存佈局, 構建和合並 SSTable
- 平板(硬化), 分片
- 寬柱資料模型, 讀寫的資料區域性, 列壓縮
- 二進位制資料編碼, 二進位制編碼-模式的優點
- 二進位制編碼
- binary strings, lack of support in JSON and XML, JSON、XML 及其二進位制變體
- 比特幣(催眠幣), 用於可審計資料系統的工具
- 點陣圖索引, 列壓縮
- BitTorrent uTP protocol, TCP 的侷限性
- Bkd-樹木(指數), 多維索引與全文索引
- 無咎死後, 人類與可靠性
- Blazegraph(資料庫), 圖資料模型
- SPARQL 查詢語言, SPARQL 查詢語言
- blob storage(見 object storage)
- 塊, 分散式檔案系統
- 塊裝置(磁碟), 儲存與計算的分離
- 塊鏈, 總結
- 拜占庭斷層承受力, 拜占庭故障, 共識, 用於可審計資料系統的工具
- 阻止原子承諾, 三階段提交
- Bloom 過濾器(演算法), 布隆過濾器, 讀取效能, 流分析
- BookKeeper (replicated log), 將工作分配給節點
- 邊框資料集, 流處理, 術語表
- (另見 batch processing)
- 受限延遲, 術語表
- 廣播
- 全序廣播(見 shared logs)
- 無中介訊息, 直接從生產者傳遞給消費者
- 粗糙(計量聚合器), 直接從生產者傳遞給消費者
- BTM (transaction coordinator), 兩階段提交(2PC)
- 緩衝
- Bufstream(訊息系統), 設定新的副本
- Bufstream(訊息系統), 磁碟空間使用
- 新建或購買, 雲服務與自託管
- 快速網路交通模式, 我們不能簡單地使網路延遲可預測嗎?
- 商業分析員, 分析型與事務型系統, 從資料倉庫到資料湖
- 商業資料處理, 事務處理與分析的特徵
- 商業情報, 分析型與事務型系統-資料倉庫
- Business Process Execution Language (BPEL), 持久化執行與工作流
- Business Process Model and Notation (BPMN), 持久化執行與工作流
- 例項, 持久化執行與工作流
- 位元組序列,編碼資料, 編碼資料的格式
- 拜占庭斷層, 拜占庭故障-弱形式的謊言, 系統模型與現實, 術語表
- 拜占庭容錯系統, 拜占庭故障
- Byzantine Generals Problem, 拜占庭故障
- 協商一致演算法和, 共識, 用於可審計資料系統的工具
C
- 快取, 全記憶體儲存, 術語表
- 意見, 物化檢視與資料立方體
- 作為衍生資料, 記錄系統與派生資料, 組合使用資料儲存技術-分拆系統與整合系統
- in CPUs, 查詢執行:編譯與向量化, 線性一致性與網路延遲
- 無效和贍養費, 保持系統同步, 維護物化檢視
- 線性一致性, 線性一致性
- 雲中的本地磁碟, 儲存與計算的分離
- 日曆同步, 同步引擎與本地優先軟體, 同步引擎的利弊
- California Consumer Privacy Act (CCPA), 資料系統、法律與社會
- Camunda(工作流程引擎), 持久化執行與工作流
- (資料), 記錄系統與派生資料
- CAP定理, CAP 定理-CAP 定理, 術語表
- 能力規劃, 雲時代的運維
- Cap’n Proto(資料格式), 編碼資料的格式
- 碳排放, 分散式與單節點系統
- 級聯中止, 沒有髒讀
- 連鎖失敗, 軟體故障, 運維:自動/手動再平衡, 超時和無界延遲
- Cassandra(資料庫)
- 資料變更捕獲, 資料變更捕獲的實現, 變更流的 API 支援
- 壓縮戰略, 壓實策略
- consistency level ANY, 單主與無主複製的效能
- 雜湊變硬, 按鍵的雜湊分片, 按雜湊範圍分片
- 最後寫成的解決衝突, 檢測併發寫入
- 無領導複製, 無主複製
- 輕量事務, 單物件寫入
- 線性,缺少, 實現線性一致性系統
- 日誌結構儲存, 構建和合並 SSTable
- 多區域支助, 多地區操作
- 二級指數, 本地二級索引
- 使用時鐘, 仲裁一致性的侷限, 用於事件排序的時間戳
- 節點(硬化), 分片
- 貓(Unix 工具), 簡單日誌分析
- 目錄, 雲資料倉庫
- 因果關係, 版本向量
- (另見 causal dependencies)
- 因果關係, “先發生"關係與併發-版本向量
- 捕獲, 版本向量, 排序事件以捕獲因果關係, 讀也是事件
- 按總訂單, 全序的限制
- 事務中, 基於過時前提的決策
- 向朋友傳送訊息(例如), 排序事件以捕獲因果關係
- 捕獲, 版本向量, 排序事件以捕獲因果關係, 讀也是事件
- 因果關係, 術語表
- 因果順序
- 與, 邏輯時鐘
- 與, 邏輯時鐘-使用邏輯時鐘強制約束
- 發生關係前, “先發生"關係與併發
- 在可序列事務中, 基於過時前提的決策-檢測影響先前讀取的寫入
- 與時鐘不符, 用於事件排序的時間戳
- 命令要抓取的事件, 排序事件以捕獲因果關係
- 違反《公約》的行為, 一致字首讀, 不同拓撲的問題, 用於事件排序的時間戳
- 帶有同步時鐘, 用於全域性快照的同步時鐘
- 因果順序
- 基於單元格的架構, 面向多租戶的分片
- 複合事件處理(見 複合事件處理)
- CephFS(分散式檔案系統), 批處理, 物件儲存
- 證書透明性, 用於可審計資料系統的工具
- c組, 分散式作業編排
- 資料變更捕獲, 邏輯(基於行)日誌複製, 資料變更捕獲
- 變更流的 API 支援, 變更流的 API 支援
- 比較事件來源, 資料變更捕獲與事件溯源
- 執行, 資料變更捕獲的實現
- 初始快照, 初始快照
- 日誌壓縮, 日誌壓縮
- 更改日誌, 狀態、流和不變性
- 混亂工程, 容錯, 故障注入
- 檢查站
- 斷路器(限制重試), 描述效能
- 電路交換網路, 同步與非同步網路
- 迴圈緩衝器, 磁碟空間使用
- 迴圈複製地形, 多主複製拓撲
- Citus(資料庫)
- 雜湊變硬, 固定數量的分片
- ClickHouse(資料庫), 事務處理與分析的特徵, 雲原生系統架構
- 增量檢視維護, 維護物化檢視
- 點選流資料,分析, JOIN 與 GROUP BY
- 客戶
- 電話服務, 流經服務的資料流:REST 與 RPC
- 離線, 同步引擎與本地優先軟體, 有狀態、可離線的客戶端
- 推動狀態更改到, 將狀態變更推送給客戶端
- 請求路由, 請求路由
- ClockBound(時間同步), 帶置信區間的時鐘讀數
- use in YugabyteDB, 用於全域性快照的同步時鐘
- 時鐘, 不可靠的時鐘-限制垃圾回收的影響
- 原子鐘, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
- 信任間隔, 帶置信區間的時鐘讀數-用於全域性快照的同步時鐘
- 全球快照, 用於全域性快照的同步時鐘
- 混合邏輯時鐘, 混合邏輯時鐘
- logical(見 logical clocks)
- 偏斜, 最後寫入勝利(丟棄併發寫入), 仲裁一致性的侷限, 對同步時鐘的依賴-帶置信區間的時鐘讀數, 實現線性一致性系統
- 殺人, 單調時鐘
- 同步和準確性, 時鐘同步和準確性-時鐘同步和準確性
- synchronization using GPS, 不可靠的時鐘, 時鐘同步和準確性, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
- 時間與單調時鐘, 單調時鐘與日曆時鐘
- 時間標記事件, 你用的是誰的時鐘?
- 雲服務, 雲服務與自託管-雲計算與超級計算
- 雲內, 雲原生系統架構-雲時代的運維
- 雲飛
- R2(見 R2(物件儲存))
- 組合索引, 在索引中儲存值
- 分組(記錄順序), 按雜湊範圍分片
- CockroachDB(資料庫)
- 基於共識的複製, 單主複製
- 一致性模式, 什麼使系統具有線性一致性?
- 鍵程硬化, 分片, 按鍵的範圍分片
- 可序列事務, 可序列化快照隔離(SSI)
- 硬化二級指數, 全域性二級索引
- 事務, 事務到底是什麼?, 資料庫內部的分散式事務
- 使用模型檢查, 模型檢查與規範語言
- 程式碼生成
- 用於查詢執行, 查詢執行:編譯與向量化
- 帶有協議緩衝, Protocol Buffers
- 協作編輯, 即時協作、離線優先和本地優先應用
- 列家庭(大表), 讀寫的資料區域性, 列壓縮
- 面向列的儲存, 列式儲存-查詢執行:編譯與向量化
- comma-separated values(見 CSV)
- 命令查詢責任分離, 事件溯源與 CQRS-事件溯源與 CQRS, 從同一事件日誌中派生多個檢視
- 命令(活動來源), 事件溯源與 CQRS
- 執行(事務), 事務
- 原子提交, 分散式事務-再談恰好一次訊息處理
- (另見 原子性)
- 讀作承諾隔離, 讀已提交
- three-phase commit (3PC), 三階段提交
- 兩階段提交, 兩階段提交(2PC)-協調器故障
- 原子提交, 分散式事務-再談恰好一次訊息處理
- 通用業務, 衝突解決與複製
- 壓實(Compaction)
- 比較和設定, 條件寫入(比較並設定), 什麼使系統具有線性一致性?
- 相容性, 編碼與演化, 資料流的模式
- 電話服務, RPC 的資料編碼與演化
- 編碼格式的屬性, 總結
- 使用資料庫, 流經資料庫的資料流-歸檔儲存
- 補償事務, 不可變事件的優點, 寬鬆地解釋約束
- 彙編, 查詢執行:編譯與向量化
- 複合事件處理, 複合事件處理
- 複雜度
- 理論模型中的蒸餾, 將系統模型對映到現實世界
- 重要和意外事項, 簡單性:管理複雜度
- 使用抽象來隱藏, 資料模型與查詢語言
- 管理, 簡單性:管理複雜度
- composing data systems(見 unbundling databases)
- 壓縮
- in SSTables, SSTable 檔案格式
- 計算密集型應用程式, 資料系統架構中的權衡
- 電腦遊戲, 同步引擎的利弊
- 縮寫索引, 多維索引與全文索引
- 在雜湊硬化系統中, 按雜湊範圍分片
- 併發
- 演員程式設計模式, 分散式 actor 框架, 事件驅動架構與 RPC
- (另見 event-driven architecture)
- 事務隔離薄弱時出現的錯誤, 弱隔離級別
- 解決衝突, 處理寫入衝突-處理寫入衝突
- 定義, 處理寫入衝突
- 檢測並行寫作, 檢測併發寫入-版本向量
- 雙寫、 問題, 保持系統同步
- 發生關係前, “先發生"關係與併發
- 在複製系統中, 複製延遲的問題-版本向量, 線性一致性-線性一致性與網路延遲
- 丟失更新, 防止丟失更新
- 多版本併發控制, 多版本併發控制(MVCC), 用於全域性快照的同步時鐘
- 樂觀併發控制, 悲觀併發控制與樂觀併發控制
- 行動命令, 什麼使系統具有線性一致性?
- 透過事件日誌減少, 併發控制, 資料流:應用程式碼與狀態變化的互動
- 時間和相對性, “先發生"關係與併發
- 事務隔離, 隔離性
- 寫偏差, 寫偏差與幻讀-物化衝突
- 演員程式設計模式, 分散式 actor 框架, 事件驅動架構與 RPC
- 有條件寫入, 條件寫入(比較並設定)
- 會議管理系統(例如), 事件溯源與 CQRS
- conflict-free replicated datatypes (CRDTs), CRDT 與操作變換
- 衝突
- 撤銷, 衝突避免
- 因果關係, “先發生"關係與併發
- 衝突檢測
- 分散式事務, XA 事務的問題
- 在基於日誌的系統中, 唯一性約束需要達成共識
- in serializable snapshot isolation (SSI), 檢測影響先前讀取的寫入
- 在兩階段提交中, 系統性的承諾
- 解決衝突
- 透過中止事務, 悲觀併發控制與樂觀併發控制
- 透過道歉, 寬鬆地解釋約束
- 最後寫入勝利, 用於事件排序的時間戳
- 使用原子操作, 衝突解決與複製
- 確定什麼是衝突, 處理寫入衝突, 基於日誌訊息傳遞中的唯一性
- 無領導複製, 檢測併發寫入
- 丟失更新, 防止丟失更新-衝突解決與複製
- 實現, 物化衝突
- 決議, 處理寫入衝突-處理寫入衝突
- 自動, 自動衝突解決
- 無頭系統, 檢測併發寫入
- 最後寫入勝利, 最後寫入勝利(丟棄併發寫入)
- 使用自定義邏輯, 手動衝突解決, 捕獲先發生關係
- 兄弟, 手動衝突解決, 捕獲先發生關係
- 合併, 捕獲先發生關係
- 寫偏差, 寫偏差與幻讀-物化衝突
- 調和
- Freight(訊息系統), 設定新的副本, 磁碟空間使用
- 計劃登記, JSON 模式, 但什麼是寫入者模式?
- 擁堵(網路)
- 撤銷, TCP 的侷限性
- 限制時鐘的準確性, 帶置信區間的時鐘讀數
- 排隊延遲, 網路擁塞和排隊
- 共識, 共識-總結, 術語表
- consent (GDPR), 同意與選擇自由
- 一致性, 一致性, 及時性與完整性
- 跨越不同資料庫, 領導者故障:故障轉移, 保持系統同步, 從同一事件日誌中派生多個檢視, 派生資料與分散式事務
- 因果關係, 一致字首讀, 不同拓撲的問題, 排序事件以捕獲因果關係
- 一致字首讀, 一致字首讀-一致字首讀
- 一致的快照, 設定新的副本, 快照隔離與可重複讀-快照隔離、可重複讀和命名混淆, 用於全域性快照的同步時鐘, 初始快照, 建立索引
- (另見 snapshots)
- 崩潰恢復, 使 B 樹可靠
- enforcing constraints(見 constraints)
- 最終, 複製延遲的問題
- (另見 最終一致性)
- in ACID transactions, 一致性, 維護完整性,儘管軟體有Bug
- 在 CAP 定理中, CAP 定理
- 領袖選舉, 共識的微妙之處
- 微服務, 分散式系統的問題
- 線性一致性, 複製延遲的解決方案, 線性一致性-線性一致性與網路延遲
- 含義, 一致性
- 單調讀, 單調讀-單調讀
- 二級指數, 多物件事務的需求, 索引與快照隔離, 理解資料流, 建立索引
- 讀後寫, 讀己之寫-讀己之寫
- 在衍生資料系統中, 派生資料與分散式事務
- strong(見 線性一致性)
- 及時性和完整性, 及時性與完整性
- 使用法定人數, 仲裁一致性的侷限, 線性一致性與仲裁
- 連續的雜湊, 一致性雜湊
- 一致字首讀, 一致字首讀
- 限制(資料庫), 一致性, 寫偏差的特徵
- 領事(協調處), 協調服務
- 用於服務發現, 服務發現
- 消費者(資訊流), 訊息代理, 傳遞事件流
- content models (JSON Schema), JSON 模式
- 引數
- 事務之間, 處理錯誤和中止
- 遮蔽執行緒, 程序暫停
- 樂觀併發控制的效能, 悲觀併發控制與樂觀併發控制
- 雙相鎖定, 兩階段鎖定的效能
- 上下文開關, 延遲與響應時間, 程序暫停
- 收斂, 自動衝突解決-CRDT 與操作變換
- 協調
- 協調者, 兩階段提交(2PC)
- 複製寫(B- 樹), B 樹變體, 索引與快照隔離
- 公共物件請求代理體系結構, 遠端過程呼叫(RPC)的問題
- coronal mass ejection(見 solar storm)
- 正確性
- 資料腐敗
- 餘弦相似性(語義搜尋), 向量嵌入
- Couchbase(資料庫)
- 文件資料模型, 關係模型與文件模型
- 永續性, 全記憶體儲存
- 雜湊變硬, 固定數量的分片
- 加入支援, 文件和關係資料庫的融合
- 再平衡, 運維:自動/手動再平衡
- vBuckets(硬化), 分片
- CouchDB(資料庫)
- 耦合(鬆緊), 可演化性:讓變化更容易
- 覆蓋索引, 在索引中儲存值
- CozoDB(資料庫), Datalog:遞迴關係查詢
- CPUs
- 快取一致性和記憶體障礙, 線性一致性與網路延遲
- 緩衝和管道, 查詢執行:編譯與向量化
- 計算錯誤的結果, 硬體與軟體故障
- SIMD instructions, 查詢執行:編譯與向量化
- 斷層和斷層, 系統模型與現實
- CRDTs(見 conflict-free replicated datatypes)
- CREATE INDEX statement (SQL), 多列索引與二級索引, 建立索引
- 信用評級機構, 責任與問責
- 加密重新整理, 事件溯源與 CQRS, 不變性的侷限性
- 密碼, 總結
- 密碼學
- CSV (comma-separated values), OLTP 系統的儲存與索引, JSON、XML 及其二進位制變體
- Curator (ZooKeeper recipes), 鎖定與領導者選舉, 將工作分配給節點
- Cypher(查詢語言), Cypher 查詢語言
- comparison to SPARQL, SPARQL 查詢語言
D
- Daft(處理框架)
- DataFrames, DataFrames
- 移動資料, 混洗資料
- Dagster(工作流排程器), 持久化執行與工作流, 批處理, 工作流排程
- 雲資料倉整合, 查詢語言
- 儀表板(業務情報), 事務處理與分析的特徵
- Dask(處理框架), 資料框、矩陣與陣列
- 資料目錄, 雲資料倉庫
- 資料聯結器, 資料倉庫
- 資料合同, 提取-轉換-載入(ETL)
- 資料變更捕獲, 資料變更捕獲與事件溯源
- data corruption(見 corruption of data)
- 資料方塊, 物化檢視與資料立方體
- 資料工程, 分析型與事務型系統
- 資料結構, 提取-轉換-載入(ETL)
- data formats(見 編碼)
- 資料基礎設施, 資料系統架構中的權衡
- 資料整合, 資料整合-統一批處理和流處理, 本章小結
- 批次和流處理, 批處理與流處理-統一批處理和流處理
- 保持衍生狀態, 維護派生狀態
- 後處理資料, 應用演化後重新處理資料
- 統一, 統一批處理和流處理
- 透過解開資料庫, 分拆資料庫-多分割槽資料處理
- 與聯邦資料庫的比較, 一切的元資料庫
- 透過生成資料合併工具, 組合使用派生資料的工具-排序事件以捕獲因果關係
- 衍生資料與分散式事務, 派生資料與分散式事務
- 總訂單的限制, 全序的限制
- 命令事件捕獲因果關係, 排序事件以捕獲因果關係
- 關於資料流的推理, 理解資料流
- 需求, 記錄系統與派生資料
- 使用批次處理, 批處理, 提取-轉換-載入(ETL)
- 批次和流處理, 批處理與流處理-統一批處理和流處理
- 資料湖, 從資料倉庫到資料湖
- 資料湖區, 雲資料倉庫, 分析(Analytics)
- data locality(見 區域性)
- 資料網格, 提取-轉換-載入(ETL)
- 資料最小化, 資料系統、法律與社會, 立法與自律
- 資料模型, 資料模型與查詢語言-總結
- DataFrames and arrays, 資料框、矩陣與陣列
- 類似圖表的模型, 圖資料模型-GraphQL
- 資料日誌語言, Datalog:遞迴關係查詢-Datalog:遞迴關係查詢
- 屬性圖, 屬性圖
- RDF and triple-stores, 三元組儲存與 SPARQL-SPARQL 查詢語言
- 關係模型對文件模型, 關係模型與文件模型-文件和關係資料庫的融合
- 支援多個, 事件溯源與 CQRS
- 資料管道, 從資料倉庫到資料湖, 記錄系統與派生資料, 提取-轉換-載入(ETL)
- 資料產品, 超越資料湖
- data protection regulations(見 GDPR)
- 資料居住法, 分散式與單節點系統, 面向多租戶的分片
- 資料科學, 分析型與事務型系統, 從資料倉庫到資料湖
- 資料倉, 資料倉庫
- 資料系統
- 資料儲存, 資料倉庫, 術語表
- 資料密集型應用, 資料系統架構中的權衡
- 資料庫管理員, 雲時代的運維
- 內部分散式事務, 跨不同系統的分散式事務, 資料庫內部的分散式事務, 原子提交再現
- 資料庫
- 歸檔儲存, 歸檔儲存
- 信件經紀人的比較, 訊息代理與資料庫的對比
- 資料流, 流經資料庫的資料流
- 端到端引數, 端到端原則-在資料系統中應用端到端思考
- 檢查完整性, 端到端原則重現
- 與事件流的關係, 資料庫與流-不變性的侷限性
- (另見 changelogs)
- 變更流的 API 支援, 變更流的 API 支援, 應用程式碼和狀態的分離
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- 事件溯源, 資料變更捕獲與事件溯源
- 保持系統同步, 保持系統同步-保持系統同步
- 不可改變事件哲學, 狀態、流和不變性-不變性的侷限性
- 分拆, 分拆資料庫-多分割槽資料處理
- 資料中心
- 資料流動, 資料流的模式-分散式 actor 框架, 圍繞資料流設計應用-流處理器和服務
- 資料流系統的正確性, 資料流系統的正確性
- 資料流引擎, 資料流引擎
- 與流處理的比較, 流處理
- DataFrames, DataFrames
- 批次處理框架中的支援, 批處理
- 事件驅動, 事件驅動的架構-分散式 actor 框架
- 關於, 理解資料流
- 透過資料庫, 流經資料庫的資料流
- 透過服務, 流經服務的資料流:REST 與 RPC-RPC 的資料編碼與演化
- workflow engines(見 workflow engines)
- DataFrames, 資料框、矩陣與陣列
- 執行, DataFrames
- 分批處理, DataFrames
- 在筆記本中, 機器學習
- 批次處理框架中的支援, 批處理
- DataFusion(查詢引擎), 雲資料倉庫
- Datalog(查詢語言), Datalog:遞迴關係查詢-Datalog:遞迴關係查詢
- 資料流(變化資料捕獲), 變更流的 API 支援
- 資料型別
- binary strings in XML and JSON, JSON、XML 及其二進位制變體
- 無衝突, CRDT 與操作變換
- 在 Avro 編碼中, Avro
- 在協議緩衝中, 欄位標籤與模式演化
- numbers in XML and JSON, JSON、XML 及其二進位制變體
- 日期和日期, 資料系統、法律與社會
- Datomic(資料庫)
- B-樹木儲存, 索引與快照隔離
- 資料模型, 圖資料模型, 三元組儲存與 SPARQL
- 資料日誌查詢語言, Datalog:遞迴關係查詢
- 切除, 不變性的侷限性
- 事務語言, 儲存過程的利弊
- 事務的序列執行, 實際序列執行
- Daylight Saving Time (DST), 日曆時鐘
- Db2(資料庫)
- 資料變更捕獲, 資料變更捕獲的實現
- DBA (database administrator), 雲時代的運維
- 僵局, 顯式鎖定
- Debezium(變化資料捕獲), 資料變更捕獲的實現
- 卡桑德拉島, 變更流的 API 支援
- 資料整合, 分拆系統與整合系統
- 宣告語言, 資料模型與查詢語言, 術語表
- 並同步引擎, 同步引擎的利弊
- 資料日誌, Datalog:遞迴關係查詢
- 文件資料庫中, 文件和關係資料庫的融合
- recursive SQL queries, SQL 中的圖查詢
- SPARQL, SPARQL 查詢語言
- DeepSeek
- 3FS(見 3FS)
- 延遲
- 刪除資料, 不變性的侷限性
- in LSM storage, 磁碟空間使用
- 法律依據, 資料系統、法律與社會
- Delta Lake(表格式), 構建和合並 SSTable, 雲資料倉庫
- 硬化和叢集, 按雜湊範圍分片
- 非軍事區(聯網), 對外提供派生資料
- 非正常化(資料表示), 正規化、反正規化與連線-多對一與多對多關係, 術語表
- 在衍生資料系統中, 記錄系統與派生資料
- in event sourcing/CQRS, 事件溯源與 CQRS
- 社會網路案例研究, 社交網路案例研究中的反正規化
- 實際意見, 物化檢視與資料立方體
- 更新衍生資料, 單物件與多物件操作, 多物件事務的需求, 組合使用派生資料的工具
- 相對於正常化, 從同一事件日誌中派生多個檢視
- 衍生資料, 記錄系統與派生資料, 流處理, 術語表
- 批處理, 批處理
- 事件溯源與 CQRS, 事件溯源與 CQRS
- 從變化資料抓取, 資料變更捕獲的實現
- 透過日誌維護匯出狀態, 資料庫與流-變更流的 API 支援, 狀態、流和不變性-併發控制
- 透過對流的訂閱來觀察, 端到端的事件流
- 批次和流處理的產出, 批處理與流處理
- 透過應用程式程式碼, 應用程式碼作為派生函式
- 相對於已分配事務, 派生資料與分散式事務
- 設計模式, 簡單性:管理複雜度
- 決定性行動, 儲存過程的利弊, 故障與部分失效, 術語表
- 確定性模擬測試(DST), 確定性模擬測試
- DevOps, 雲時代的運維
- 維度表, 星型與雪花型:分析模式
- dimensional modeling(見 star schemas)
- directed acyclic graphs (DAG)
- 工作流程, 工作流排程
- (另見 workflow engines)
- 工作流程, 工作流排程
- 髒讀, 沒有髒讀
- 髒字(事務隔離), 沒有髒寫
- 分類
- 儲存和計算, 儲存與計算的分離
- discord(分組聊天)
- GraphQL example, GraphQL
- 歧視, 偏見與歧視
- disks(見 hard disks)
- 分散式行為者框架, 分散式 actor 框架
- 分散式檔案系統, 分散式檔案系統-分散式檔案系統
- 已分發分類賬, 總結
- 分散式系統, 分散式系統的麻煩-總結, 術語表
- distributed transactions(見 transactions)
- Django(網路框架), 處理錯誤和中止
- DMZ (demilitarized zone), 對外提供派生資料
- DNS (Domain Name System), 請求路由, 服務發現
- 用於負載平衡, 負載均衡器、服務發現和服務網格
- Docker (集裝箱管理器), 應用程式碼和狀態的分離
- 文件資料模型, 關係模型與文件模型-文件和關係資料庫的融合
- 比較關係模式, 何時使用哪種模型-文件和關係資料庫的融合
- 多物件事務, 需要, 多物件事務的需求
- 硬化二級指數, 分片與二級索引
- 相對關係模式
- 模式的趨同, 文件和關係資料庫的融合
- 資料位置, 讀寫的資料區域性
- document-partitioned indexes(見 local secondary indexes)
- 領域驅動設計, 簡單性:管理複雜度, 事件溯源與 CQRS
- 點版向量, 版本向量
- 雙重登入簿記, 總結
- DRBD (Distributed Replicated Block Device), 單主複製
- 漂移(小時), 時鐘同步和準確性
- Druid(資料庫), 事務處理與分析的特徵, 列式儲存, 從同一事件日誌中派生多個檢視
- 處理寫入, 寫入列式儲存
- 預彙總, 分析(Analytics)
- 服務衍生資料, 對外提供派生資料
- Dryad(資料流引擎), 資料流引擎
- 雙寫、 問題, 保持系統同步
- DuckDB(資料庫), 分散式系統的問題, 壓實策略
- 面向列的儲存, 列式儲存
- 用於 ETL, 提取-轉換-載入(ETL)
- 減少重複,消除, 抑制重複
- 永續性, 使 B 樹可靠, 永續性, 術語表
- 持久執行, 持久化執行與工作流
- 依賴決定性因素, 確定性模擬測試
- Restate(見 Restate (workflow engine))
- Temporal(見 Temporal (workflow engine))
- durable functions(見 workflow engines)
- 時間(時間), 不可靠的時鐘
- 用單音鍾測量, 單調時鐘
- 動態輸入語言
- 類比於閱讀時的圖案, 文件模型中的模式靈活性
- Dynamo(資料庫), 無主複製
- Dynamo-style databases(見 leaderless replication)
- DynamoDB(資料庫)
- 自動縮放, 運維:自動/手動再平衡
- 雜湊變硬, 按雜湊範圍分片
- 基於領導者的複製, 單主複製
- 硬化二級指數, 全域性二級索引
E
- EBS(虛擬塊裝置), 儲存與計算的分離
- 比較物件儲存, 設定新的副本
- ECC(見 error-correcting codes)
- EDB Postgres Distributed(資料庫), 跨地域執行
- 邊緣(圖), 圖資料模型
- 屬性圖模型, 屬性圖
- 編輯距離(全文搜尋), 全文檢索
- 有效即時語義, 容錯, 恰好執行一次操作
- (另見 恰好一次語義)
- 維護完整性, 資料流系統的正確性
- Elastic Compute Cloud (EC2)
- 現場例項, 故障處理
- 彈性, 分散式與單節點系統
- 彈性搜尋(搜尋伺服器)
- 精靈(程式語言), 端到端的事件流
- ELT (extract-load-transform), 資料倉庫
- 與批次處理的關係, 提取-轉換-載入(ETL)
- 嚴重平行(演算法)
- 提取-轉換-載入(ETL)(見 ETL)
- MapReduce, MapReduce
- (另見 MapReduce)
- 嵌入式儲存引擎, 壓實策略
- 嵌入(顯示器), 向量嵌入
- 編碼(資料格式), 編碼與演化-模式的優點
- Avro, Avro-動態生成的模式
- binary variants of JSON and XML, 二進位制編碼
- 相容性, 編碼與演化
- 電話服務, RPC 的資料編碼與演化
- 使用資料庫, 流經資料庫的資料流-歸檔儲存
- 定義, 編碼資料的格式
- JSON, XML, and CSV, JSON、XML 及其二進位制變體
- 語言特定格式, 特定語言的格式
- 計劃的價值, 模式的優點
- Protocol Buffers, Protocol Buffers-欄位標籤與模式演化
- 資料說明, 編碼資料的格式
- 端到端原則, 端到端原則-在資料系統中應用端到端思考
- 濃縮(流), 流表連線(流擴充)
- Enterprise JavaBeans (EJB), 遠端過程呼叫(RPC)的問題
- 企業軟體, 資料系統架構中的權衡
- entities(見 vertices)
- 電子儲存, 儲存與計算的分離
- 時代(協商一致演算法), 從單主複製到共識
- 時代(Unix 時間戳), 日曆時鐘
- 清除編碼(錯誤校正), 分散式檔案系統
- 錯誤處理
- 錯誤更正程式碼, 硬體與軟體故障, 分散式檔案系統
- Esper (CEP engine), 複合事件處理
- 基本複雜性, 簡單性:管理複雜度
- 協調事務, 協調服務-服務發現
- 生成柵欄標誌, 隔離殭屍程序和延遲請求, 協調服務
- 線性操作, 實現線性一致性系統, 共識的微妙之處
- 鎖和領袖選舉, 鎖定與領導者選舉
- 用於服務發現, 負載均衡器、服務發現和服務網格, 服務發現
- 用於硬性轉讓, 請求路由
- 使用 Raft 演算法, 單主複製
- 伊特魯姆(塊鏈), 用於可審計資料系統的工具
- 乙太網(網路), 雲計算與超級計算, 不可靠的網路, 我們不能簡單地使網路延遲可預測嗎?
- 道德操守, 將事情做正確-立法與自律
- ETL, 資料倉庫, 保持系統同步, 術語表
- 與批次處理的關係, 提取-轉換-載入(ETL)-提取-轉換-載入(ETL)
- 使用批次處理, 批處理
- 歐幾利得距離(語義搜尋), 向量嵌入
- European Union
- AI Act(見 AI Act)
- GDPR(見 GDPR)
- 事件溯源, 事件溯源與 CQRS-事件溯源與 CQRS
- 並更改資料捕獲, 資料變更捕獲與事件溯源
- 與變化資料捕獲的比較, 資料變更捕獲與事件溯源
- 不可更改性和可審計性, 狀態、流和不變性, 為可審計性而設計
- 大型可靠資料系統, 操作識別符號, 資料流系統的正確性
- 依賴決定性因素, 確定性模擬測試
- event streams(見 streams)
- 事件驅動的架構, 事件驅動的架構-分散式 actor 框架
- 分散式行為者框架, 分散式 actor 框架
- 事件, 傳遞事件流
- EventSource (browser API), 將狀態變更推送給客戶端
- EventStoreDB(資料庫), 事件溯源與 CQRS
- 最終一致性, 複製, 複製延遲的問題, 安全性與活性
- 證據
- 資料用作, 人類與可靠性
- 可演化性, 可演化性:讓變化更容易, 編碼與演化
- 電話服務, RPC 的資料編碼與演化
- 事件溯源, 事件溯源與 CQRS
- 圖表結構資料, 屬性圖
- 資料庫, 文件模型中的模式靈活性, 流經資料庫的資料流-歸檔儲存, 從同一事件日誌中派生多個檢視, 應用演化後重新處理資料
- 後處理資料, 應用演化後重新處理資料, 統一批處理和流處理
- Avro 的策略進化, 寫入者模式與讀取者模式
- 協議緩衝的策略演變, 欄位標籤與模式演化
- 閱讀時的圖謀, 文件模型中的模式靈活性, 編碼與演化, 模式的優點
- 恰好一次語義, 恰好一次訊息處理, 再談恰好一次訊息處理, 容錯, 恰好執行一次操作
- 獨佔模式, 兩階段鎖定的實現
- 指數備份, 描述效能, 處理錯誤和中止
- ext4 (file system), 分散式檔案系統
- eXtended Architecture transactions(見 XA 事務)
- ETL(見 提取-轉換-載入(ETL))
F
- 臉書
- 事實
- 事實表(星圖), 星型與雪花型:分析模式
- 在資料日誌中, Datalog:遞迴關係查詢
- 如果來源, 事件溯源與 CQRS
- 慢故障, 系統模型與現實
- 失敗停止模式, 系統模型與現實
- 故障切換, 領導者故障:故障轉移, 術語表
- (另見 基於領導者的複製)
- 無領導複製,沒有, 當節點故障時寫入資料庫
- 領袖選舉, 分散式鎖和租約, 共識, 從單主複製到共識
- 潛在問題, 領導者故障:故障轉移
- 失敗
- 費斯(媒介指數), 向量嵌入
- 假陽性(Bloom 過濾器), 布隆過濾器
- 扇出, 時間線的物化與更新, 多個消費者
- 斷層注射, 容錯, 實踐中的網路故障, 故障注入
- 斷層隔離, 面向多租戶的分片
- 過失容忍, 可靠性與容錯-人類與可靠性, 術語表
- 錯誤
- 特性工程(機器學習), 從資料倉庫到資料湖
- 聯邦資料庫, 一切的元資料庫
- Feldera(資料庫)
- 增量檢視維護, 維護物化檢視
- 圍欄, 線性一致性與網路延遲
- 屏障, 領導者故障:故障轉移, 隔離殭屍程序和延遲請求-多副本隔離
- 獲取和新增
- 與協商一致的關係, 獲取並增加作為共識
- 纖維通道(網路), 分散式檔案系統
- 欄位標記(協議緩衝), Protocol Buffers-欄位標籤與模式演化
- Figma (圖形軟體), 即時協作、離線優先和本地優先應用
- filesystem in userspace (FUSE), 設定新的副本, 分散式檔案系統
- 在物件儲存中, 物件儲存
- 財務資料
- 五特蘭, 資料倉庫
- FizzBee (specification language), 模型檢查與規範語言
- 平面指數(媒介指數), 向量嵌入
- FlatBuffers(資料格式), 編碼資料的格式
- Flink(處理框架), 批處理, 資料流引擎
- 流量控制, TCP 的侷限性, 訊息傳遞系統, 術語表
- FLP result (on consensus), 共識
- Flyte(工作流排程器), 機器學習
- 追隨者, 單主複製, 術語表
- (另見 基於領導者的複製)
- 正式方法, 形式化方法和隨機測試-確定性模擬測試
- 轉發相容性, 編碼與演化
- 前進衰變(演算法), 響應時間指標的應用
- 化石(版本控制系統), 併發控制
- 避免, 不變性的侷限性
- FoundationDB(資料庫)
- 一致性模式, 什麼使系統具有線性一致性?
- 確定性模擬測試, 確定性模擬測試
- 鍵程硬化, 按鍵的範圍分片
- 程序/核心模式, 分片的利與弊
- 可序列事務, 可序列化快照隔離(SSI), 可序列化快照隔離的效能
- 事務, 事務到底是什麼?, 資料庫內部的分散式事務
- 分數索引, 何時使用哪種模型
- 碎裂(B樹), 磁碟空間使用
- 框架(計算機圖形), 同步引擎的利弊
- 前端 (網頁開發), 資料系統架構中的權衡
- FrostDB(資料庫)
- 確定性模擬測試(DST), 確定性模擬測試
- fsync (系統呼叫), 使 B 樹可靠, 永續性
- 全文檢索, 全文檢索, 術語表
- Function as a Service (FaaS), 微服務與無伺服器
- 職能方案擬訂
- inspiration for MapReduce, MapReduce
- 職能要求, 定義非功能性需求
- FUSE(見 filesystem in userspace (FUSE))
- 模糊, 形式化方法和隨機測試
- fuzzy search(見 similarity search)
G
- Gallina(特寫語言), 模型檢查與規範語言
- 遊戲開發, 同步引擎的利弊
- 垃圾收集
- 加油站演算法定價, 反饋迴路
- GDPR (regulation), 資料系統、法律與社會, 不變性的侷限性
- GenBank (genome database), 總結
- General Data Protection Regulation(見 GDPR (regulation))
- 基因組分析, 總結
- geographic distribution(見 regions (geographic distribution))
- 地理空間指數, 多維索引與全文索引
- Git(版本控制系統), 併發控制
- 本地第一軟體, 即時協作、離線優先和本地優先應用
- 合併衝突, 手動衝突解決
- GitHub, postmortems, 領導者故障:故障轉移, 領導者故障:故障轉移, 將系統模型對映到現實世界
- 全球二級指數, 全域性二級索引, 總結
- globally unique identifiers(見 UUIDs)
- GlusterFS(分散式檔案系統), 批處理, 分散式檔案系統, 物件儲存
- GNU Coreutils (Linux), 排序與記憶體聚合
- Go(程式語言)
- 垃圾收集, 限制垃圾回收的影響
- GoldenGate (change data capture), 資料變更捕獲的實現
- (另見 Oracle)
- 谷歌
- BigQuery(見 BigQuery(資料庫))
- Bigtable(見 Bigtable(資料庫))
- Chubby(鎖服務), 協調服務
- Cloud Storage(物件儲存), 設定新的副本, 物件儲存
- 請求先決條件, 隔離殭屍程序和延遲請求
- Compute Engine
- 預設例項, 故障處理
- 資料流(流程處理)
- 資料流(流處理器), 流分析, 原子提交再現, 統一批處理和流處理
- (另見 Beam)
- 資料流(變化資料捕獲), 變更流的 API 支援
- Docs(協作編輯), 即時協作、離線優先和本地優先應用, CRDT 與操作變換
- 操作轉換, CRDT 與操作變換
- Dremel(查詢引擎), 列式儲存
- Firestore(資料庫), 同步引擎的利弊
- MapReduce (batch processing), 批處理
- (另見 MapReduce)
- Percolator(事務系統), 實現線性一致的 ID 生成器
- 永續性磁碟(雲服務), 儲存與計算的分離
- Pub/Sub(訊息系統), 訊息代理, 訊息代理與資料庫的對比, 使用日誌進行訊息儲存
- 響應時間研究, 平均值、中位數與百分位點
- 工作表(協作電子表格), 即時協作、離線優先和本地優先應用, CRDT 與操作變換
- Spanner(見 Spanner(資料庫))
- TrueTime (clock API), 帶置信區間的時鐘讀數
- 流言協議, 請求路由
- 治理, 超越資料湖
- 政府對資料的使用, 資料作為資產與權力
- GPS (Global Positioning System)
- 用於時鐘同步, 不可靠的時鐘, 時鐘同步和準確性, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
- GPT (language model), 向量嵌入
- GPU (graphics processing unit), 雲服務的分層, 分散式與單節點系統
- gradual rollout(見 rolling upgrades)
- GraphQL(查詢語言), GraphQL
- 驗證, 儲存過程的利弊
- 圖表, 術語表
- 作為資料模型, 圖資料模型-GraphQL
- 屬性圖, 屬性圖
- RDF and triple-stores, 三元組儲存與 SPARQL-SPARQL 查詢語言
- DAGs(見 directed acyclic graphs)
- 處理和分析, 機器學習
- 查詢語言
- 密碼, Cypher 查詢語言
- 資料日誌, Datalog:遞迴關係查詢-Datalog:遞迴關係查詢
- GraphQL, GraphQL
- 格倫林, 圖資料模型
- recursive SQL queries, SQL 中的圖查詢
- SPARQL, SPARQL 查詢語言-SPARQL 查詢語言
- 轉彎, 屬性圖
- 作為資料模型, 圖資料模型-GraphQL
- 灰色失敗, 系統模型與現實
- 無領導複製, 單主與無主複製的效能
- 格勒姆林(圖形查詢語言), 圖資料模型
- grep (Unix 工具) (英語)., 簡單日誌分析
- gRPC (service calls), 微服務與無伺服器, Web 服務
- 前向和後向相容性, RPC 的資料編碼與演化
- GUIDs(見 UUIDs)
H
- Hadoop(資料基礎設施)
- HANA(見 SAP HANA(資料庫))
- 發生關係前, “先發生"關係與併發
- 硬碟
- 硬體故障, 硬體與軟體故障
- 雜湊函式
- 在 Bloom 過濾器中, 布隆過濾器
- 加入雜湊
- 在溪流處理中, 流表連線(流擴充)
- 雜湊變硬, 按鍵的雜湊分片-一致性雜湊, 總結
- 散列表格, 日誌結構儲存
- Hazelcast(模擬資料網)
- FencedLock, 隔離殭屍程序和延遲請求
- Flake ID Generator, ID 生成器和邏輯時鐘
- HBase(資料庫)
- HDFS (Hadoop Distributed File System), 批處理, 分散式檔案系統
- HdrHistogram (numerical library), 響應時間指標的應用
- 頭 (Unix 工具), 簡單日誌分析, 分散式作業編排
- 頭頂(財產圖), 屬性圖
- 頭部阻塞, 延遲與響應時間
- 堆積檔案(資料庫), 在索引中儲存值
- 多轉換併發控制, 多版本併發控制(MVCC)
- 熱量管理, 偏斜的工作負載與緩解熱點
- 被套期請求, 單主與無主複製的效能
- 分散事務, 跨不同系統的分散式事務, XA 事務的問題
- 啟發式決策, 從協調器故障中恢復
- 十六進位制(註解本), 機器學習
- 六邊形
- 地理空間索引, 多維索引與全文索引
- Hibernate(物件關係對映器), 物件關係對映(ORM)
- 層次模型, 關係模型與文件模型
- 可導航的小世界(媒介指數), 向量嵌入
- hierarchical queries(見 recursive common table expressions)
- high availability(見 fault tolerance)
- 高頻事務, 時鐘同步和準確性
- high-performance computing (HPC), 雲計算與超級計算
- 提示移交, 追趕錯過的寫入
- 直方圖, 響應時間指標的應用
- 蜂窩(資料倉), 雲資料倉庫
- 查詢最佳化器, 查詢語言
- HNSW (vector index), 向量嵌入
- 購物視窗(流程處理), 視窗的型別
- (另見 windows)
- Hoptimator(查詢引擎), 一切的元資料庫
- 地平線醜聞, 人類與可靠性
- 缺乏事務, 事務
- horizontal scaling(見 scaling out)
- 透過磨損, 分片的利與弊
- HornetQ(訊息系統), 訊息代理, 訊息代理與資料庫的對比
- 分散式事務支援, XA 事務
- 熱鍵, 鍵值資料的分片
- 熱點, 鍵值資料的分片
- 由於名人, 偏斜的工作負載與緩解熱點
- 時間序列資料, 按鍵的範圍分片
- 解除武裝, 偏斜的工作負載與緩解熱點
- hot standbys(見 基於領導者的複製)
- HTAP(見 hybrid transactional/analytic processing)
- HTTP, use in APIs(見 services)
- 人類錯誤, 人類與可靠性, 實踐中的網路故障, 批處理
- 混合邏輯時鐘, 混合邏輯時鐘
- 混合事務/分析處理, 資料倉庫, 分析型資料儲存
- hydrating IDs (join), 社交網路案例研究中的反正規化
- 高頻圖, 屬性圖
- HyperLogLog (algorithm), 流分析
I
- I/O operations, waiting for, 程序暫停
- IaaS(見 infrastructure as a service (IaaS))
- IBM
- Db2(資料庫)
- 分散式事務支援, XA 事務
- 可序列隔離, 快照隔離、可重複讀和命名混淆, 兩階段鎖定的實現
- MQ(訊息系統), 訊息代理與資料庫的對比
- 分散式事務支援, XA 事務
- System R(資料庫), 事務到底是什麼?
- WebSphere(訊息系統), 訊息代理
- Db2(資料庫)
- Iceberg(表格式), 雲資料倉庫
- 冪等性, 遠端過程呼叫(RPC)的問題, 冪等性, 術語表
- by giving operations unique IDs, 多分割槽請求處理
- by giving requests unique IDs, 操作識別符號
- 對於完全的語義, 再談恰好一次訊息處理
- 一元業務, 恰好執行一次操作
- 工作流程引擎中, 持久化執行
- 不可改變性
- 好處, 不可變事件的優點, 為可審計性而設計
- 和清除的權利, 資料系統、法律與社會, 磁碟空間使用
- 刪除加密, 事件溯源與 CQRS, 不變性的侷限性
- 從事件日誌中獲取狀態, 狀態、流和不變性-不變性的侷限性
- 事故恢復, 構建和合並 SSTable
- 在B樹上, B 樹變體, 索引與快照隔離
- 如果來源, 事件溯源與 CQRS, 資料變更捕獲與事件溯源
- 限制, 併發控制
- 阻抗不匹配, 物件關係不匹配
- 存疑, 協調器故障
- 模擬資料庫, 全記憶體儲存
- 事件
- 導致錯誤定罪的會計軟體錯誤, 人類與可靠性
- 無咎死後, 人類與可靠性
- 跳躍秒墜機, 時鐘同步和準確性
- 資料腐敗和貨幣錯誤造成的經濟損失, 弱隔離級別
- 硬碟上的資料腐敗, 永續性
- 資料損失,因最後寫成, 用於事件排序的時間戳
- 磁碟上無法讀取的資料, 將系統模型對映到現實世界
- 由於重用主鑰匙而披露敏感資料, 領導者故障:故障轉移
- 事務序列性中的錯誤, 維護完整性,儘管軟體有Bug
- gigabit network interface with 1 Kb/s throughput, 系統模型與現實
- 跳躍第二次崩潰, 軟體故障
- 網路斷層, 實踐中的網路故障
- 網路介面只放下入境包, 實踐中的網路故障
- 網路分割槽和全資料中心故障, 故障與部分失效
- 網路故障處理不當, 實踐中的網路故障
- 向前合夥人傳送訊息, 排序事件以捕獲因果關係
- 咬海底電纜的鯊魚, 實踐中的網路故障
- split brain due to 1-minute packet delay, 領導者故障:故障轉移, 實踐中的網路故障
- SSD failure after 32,768 hours, 軟體故障
- 執行緒爭吵導致服務下降, 程序暫停
- 伺服器架中的振動, 延遲與響應時間
- 違反獨特性限制, 維護完整性,儘管軟體有Bug
- incremental view maintenance (IVM), 維護物化檢視
- 資料整合, 分拆系統與整合系統
- 索引, OLTP 系統的儲存與索引, 術語表
- 並快照隔離, 索引與快照隔離
- 作為衍生資料, 記錄系統與派生資料, 組合使用資料儲存技術-分拆系統與整合系統
- B樹, B 樹-B 樹變體
- 分組, 在索引中儲存值
- comparison of B-trees and LSM-trees, 比較 B 樹與 LSM 樹-磁碟空間使用
- 覆蓋(包括各欄), 在索引中儲存值
- 建立, 建立索引
- 全文檢索, 全文檢索
- 地理空間, 多維索引與全文索引
- 索引範圍鎖定, 索引範圍鎖
- 多列(壓縮), 多維索引與全文索引
- 中學, 多列索引與二級索引
- 硬化指數和二級指數, 分片與二級索引-全域性二級索引, 總結
- 人煙稀少, SSTable 檔案格式
- SSTable 與 LSM 樹, SSTable 檔案格式-壓實策略
- 資料變化時更新, 保持系統同步, 維護物化檢視
- Industrial Revolution, 回顧工業革命
- InfiniBand (networks), 我們不能簡單地使網路延遲可預測嗎?
- InfluxDB IOx (storage engine), 列式儲存
- information retrieval(見 全文檢索)
- infrastructure as a service (IaaS), 雲服務與自託管, 雲服務的分層
- InnoDB (storage engine)
- 例項(雲計算), 雲服務的分層
- integrating different data systems(見 資料整合)
- 誠信, 及時性與完整性
- Interface Definition Language (IDL), Protocol Buffers, Avro, Web 服務
- 不變式, 一致性
- (另見 constraints)
- 反向檔案索引(向量索引), 向量嵌入
- 倒轉索引, 全文檢索
- 不可逆轉,儘量減少, 可演化性:讓變化更容易, 事件溯源與 CQRS, 批處理
- ISDN (Integrated Services Digital Network), 同步與非同步網路
- 隔離性
- cgroups(見 cgroups)
- 隔離性, 隔離性, 單物件與多物件操作, 術語表
- 正確性和, 追求正確性
- 用於單物件寫入, 單物件寫入
- 可序列化, 可序列化-可序列化快照隔離的效能
- 實際執行, 實際序列執行-序列執行總結
- 可序列化快照隔離, 可序列化快照隔離(SSI)-可序列化快照隔離的效能
- 兩階段鎖定, 兩階段鎖定(2PL)-索引範圍鎖
- 違反, 單物件與多物件操作
- 薄弱的隔離水平, 弱隔離級別-物化衝突
- IVF (vector index), 向量嵌入
J
- 資料庫連線
- Java Enterprise Edition (EE), 遠端過程呼叫(RPC)的問題, 兩階段提交(2PC), XA 事務
- Java Message Service (JMS), 訊息代理與資料庫的對比
- (另見 messaging systems)
- 比較基於日誌的郵件, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 分散式事務支援, XA 事務
- 訊息順序, 確認與重新傳遞
- Java Transaction API (JTA), 兩階段提交(2PC), XA 事務
- Java Virtual Machine (JVM)
- 垃圾收集, 程序暫停, 限制垃圾回收的影響
- JIT compilation, 查詢執行:編譯與向量化
- 批次處理器中的工藝再利用, 資料流引擎
- Jena (RDF framework), RDF 資料模型
- SPARQL 查詢語言, SPARQL 查詢語言
- Jepsen(過失容忍度測試), 故障注入, 追求正確性
- jitter (網路延遲), 平均值、中位數與百分位點, 網路擁塞和排隊
- JMESPath(查詢語言), 查詢語言
- 合併表格, 多對一與多對多關係, 屬性圖
- 加入, 術語表
- 作為關係運算符表示, 查詢語言
- handling GraphQL query, GraphQL
- 應用程式程式碼, 正規化、反正規化與連線, 社交網路案例研究中的反正規化
- in DataFrames, 資料框、矩陣與陣列
- 關係資料庫和文件資料庫, 正規化、反正規化與連線
- 二級指數和, 多列索引與二級索引
- 排序合併, JOIN 與 GROUP BY
- 串流連線, 流連線-連線的時間依賴性
- 串流流連線, 流流連線(視窗連線)
- 序列表連線, 流表連線(流擴充)
- 表格連線, 表表連線(維護物化檢視)
- 時間的依賴性, 連線的時間依賴性
- 文件資料庫中的支援, 文件和關係資料庫的融合
- JOTM (transaction coordinator), 兩階段提交(2PC)
- 日記(檔案系統), 使 B 樹可靠
- JSON
- 管道彙總(用克里語), 文件的查詢語言
- Avro 方案說明, Avro
- 二進位制變體, 二進位制編碼
- 資料位置, 讀寫的資料區域性
- 文件資料模型, 關係模型與文件模型
- 應用資料的問題, JSON、XML 及其二進位制變體
- GraphQL response, GraphQL
- 關係資料庫, 文件模型中的模式靈活性
- 代表簡歷(例), 用於一對多關係的文件資料模型
- 模式, JSON 模式
- JSON-LD, 三元組儲存與 SPARQL
- JsonPath(查詢語言), 查詢語言
- JuiceFS(分散式檔案系統), 分散式檔案系統, 物件儲存
- 朱皮特(註解本), 機器學習
- just-in-time (JIT) compilation, 查詢執行:編譯與向量化
K
- Kafka(訊息系統), 訊息代理, 使用日誌進行訊息儲存
- 消費者群體, 多個消費者
- 資料整合, 分拆系統與整合系統
- 用於事件原始碼, 事件溯源與 CQRS
- Kafka 連線(資料庫整合), 資料變更捕獲的實現, 變更流的 API 支援, 從同一事件日誌中派生多個檢視
- 卡夫卡流(流處理器), 流分析, 維護物化檢視
- 恰好一次語義, 再談恰好一次訊息處理
- 過失容忍, 失敗後重建狀態
- ksqlDB (stream database), 維護物化檢視
- 基於領導者的複製, 單主複製
- 日誌壓縮, 日誌壓縮, 維護物化檢視
- 頁:1, 使用日誌進行訊息儲存, 冪等性
- 分割槽, 分片
- 請求路由, 請求路由
- 計劃登記, 但什麼是寫入者模式?
- 服務衍生資料, 對外提供派生資料
- 分層儲存, 磁碟空間使用
- 事務, 資料庫內部的分散式事務, 原子提交再現
- 不潔領袖選舉, 共識的微妙之處
- 使用模型檢查, 模型檢查與規範語言
- kappa 架構, 統一批處理和流處理
- 關鍵價值儲存, OLTP 系統的儲存與索引
- Kinesis(訊息系統), 訊息代理, 使用日誌進行訊息儲存
- 資料倉整合, 雲資料倉庫
- Kryo (Java), 特定語言的格式
- ksqlDB (stream database), 維護物化檢視
- Kubernetes(叢集經理), 雲服務與自託管, 微服務與無伺服器, 分散式作業編排, 應用程式碼和狀態的分離
- KùzuDB (database), 分散式系統的問題, 圖資料模型
- 作為嵌入式儲存引擎, 壓實策略
- Cypher 查詢語言, Cypher 查詢語言
L
- labeled property graphs(見 property graphs)
- 羊肉達建築, 統一批處理和流處理
- Lamport 時間戳, Lamport 時間戳
- Lance(資料格式), 雲資料倉庫, 列式儲存
- (另見 column-oriented storage)
- large language models (LLMs)
- 預處理培訓資料, 機器學習
- 最後寫入勝利, 最後寫入勝利(丟棄併發寫入), 檢測併發寫入, 實現線性一致性系統
- 問題, 用於事件排序的時間戳
- 容易丟失更新, 衝突解決與複製
- 延遲, 延遲與響應時間
- (另見 響應時間)
- 跨區域, 分散式與單節點系統
- 在兩階段鎖定下的不穩定, 兩階段鎖定的效能
- 網路延遲和資源利用, 我們不能簡單地使網路延遲可預測嗎?
- 根據請求減少套期保值, 單主與無主複製的效能
- 響應時間對比, 延遲與響應時間
- 尾延遲, 平均值、中位數與百分位點, 響應時間指標的應用, 本地二級索引
- law(見 legal matters)
- (雲服務), 雲服務的分層
- 基於領導者的複製, 單主複製-邏輯(基於行)日誌複製
- (另見 複製)
- 故障切換, 領導者故障:故障轉移, 分散式鎖和租約
- 處理節點斷電, 處理節點故障
- 實施複製日誌
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- (另見 changelogs)
- 基於語句的, 基於語句的複製
- 預寫日誌(WAL)傳輸, 預寫日誌(WAL)傳輸
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- 操作的可線性, 實現線性一致性系統
- 鎖定和領導者選舉, 鎖定與領導者選舉
- 日誌序列號, 設定新的副本, 消費者偏移量
- 讀縮放架構, 複製延遲的問題, 單主與無主複製的效能
- 與協商一致的關係, 共識, 從單主複製到共識, 共識的利弊
- 設立新的追隨者, 設定新的副本
- 同步對同步, 同步複製與非同步複製-同步複製與非同步複製
- 無領導複製, 無主複製-版本向量
- 跳躍秒, 軟體故障, 時鐘同步和準確性
- 時鐘, 日曆時鐘
- 租賃, 程序暫停
- 分類賬(會計), 總結
- 不可改變性, 不可變事件的優點
- 遺留系統,維護, 可運維性
- 法律事項, 資料系統、法律與社會-資料系統、法律與社會
- 資料刪除, 資料系統、法律與社會, 磁碟空間使用
- 資料儲存, 分散式與單節點系統, 面向多租戶的分片
- 隱私監管, 資料系統、法律與社會, 立法與自律
- legitimate interest (GDPR), 同意與選擇自由
- 平面壓縮, 壓實策略, 磁碟空間使用
- Levenshtein 自動地圖, 全文檢索
- 跛腳(部分失敗), 系統模型與現實
- 線性(專案管理軟體), 即時協作、離線優先和本地優先應用
- 線性代數, 資料框、矩陣與陣列
- 線性可縮放性, 描述負載
- 線性一致性, 複製延遲的解決方案, 線性一致性-線性一致性與網路延遲, 術語表
- 和共識, 共識
- 費用, 線性一致性的代價-線性一致性與網路延遲
- CAP定理, CAP 定理
- memory on multi-core CPUs, 線性一致性與網路延遲
- 定義, 什麼使系統具有線性一致性?-什麼使系統具有線性一致性?
- ID generation, 線性一致的 ID 生成器
- 協調事務, 協調服務
- 資料系統
- 避免協調, 無協調資料系統
- 不同複製方法, 實現線性一致性系統-線性一致性與仲裁
- 使用法定人數, 線性一致性與仲裁
- 在協商一致的制度中讀取, 共識的微妙之處
- 依賴, 依賴線性一致性-跨通道時序依賴
- 可序列性, 什麼使系統具有線性一致性?
- 連結資料, 三元組儲存與 SPARQL
- LinkedIn
- Espresso(資料庫), 但什麼是寫入者模式?
- LIquid(資料庫), Datalog:遞迴關係查詢
- 配置檔案(例), 用於一對多關係的文件資料模型
- Linux 跳過第二個錯誤, 軟體故障, 時鐘同步和準確性
- Litestream (備份工具), 設定新的副本
- 生活屬性, 安全性與活性
- LLVM (compiler), 查詢執行:編譯與向量化
- LMDB (storage engine), 壓實策略, B 樹變體, 索引與快照隔離
- 負載
- 負載平衡, 描述效能, 負載均衡器、服務發現和服務網格
- 硬體, 負載均衡器、服務發現和服務網格
- 軟體, 負載均衡器、服務發現和服務網格
- 使用信件經紀人, 多個消費者
- 裝彈, 描述效能
- 本地二級指數, 本地二級索引, 總結
- 本地第一軟體, 即時協作、離線優先和本地優先應用
- 區域性, 用於一對多關係的文件資料模型, 讀寫的資料區域性, 術語表
- 分批處理, 資料流引擎
- 在狀態客戶端, 同步引擎與本地優先軟體, 有狀態、可離線的客戶端
- 在溪流處理中, 流表連線(流擴充), 失敗後重建狀態, 流處理器和服務, 基於日誌訊息傳遞中的唯一性
- 地點透明度, 遠端過程呼叫(RPC)的問題
- 在演員模式中, 分散式 actor 框架
- 鎖定, 雲服務的利弊
- 鎖, 術語表
- 死鎖, 顯式鎖定, 兩階段鎖定的實現
- 分散式鎖定, 分散式鎖和租約-多副本隔離, 鎖定與領導者選舉
- 柵欄標誌, 隔離殭屍程序和延遲請求
- 與協調處合作執行, 協調服務
- 與協商一致的關係, 單值共識
- 用於事務隔離
- 在快照隔離中, 多版本併發控制(MVCC)
- in two-phase locking (2PL), 兩階段鎖定(2PL)-索引範圍鎖
- 使操作原子化, 原子寫操作
- 效能, 兩階段鎖定的效能
- 防止骯髒的寫作, 實現讀已提交
- 防止帶有索引範圍鎖的幽靈, 索引範圍鎖, 檢測影響先前讀取的寫入
- 讀取鎖(共享模式), 實現讀已提交, 兩階段鎖定的實現
- 共享模式和專屬模式, 兩階段鎖定的實現
- 分散式事務
- 實現衝突, 物化衝突
- 透過明確鎖定防止丟失更新, 顯式鎖定
- 日誌序列號, 設定新的副本, 消費者偏移量
- 邏輯時鐘, 用於事件排序的時間戳, ID 生成器和邏輯時鐘-使用邏輯時鐘強制約束, 排序事件以捕獲因果關係
- 最後寫成的, 最後寫入勝利(丟棄併發寫入)
- 讀後寫入一致性, 讀己之寫
- 混合邏輯時鐘, 混合邏輯時鐘
- 執行制約因素不足, 使用邏輯時鐘強制約束
- Lamport 時間戳, Lamport 時間戳
- 邏輯複製, 邏輯(基於行)日誌複製
- 用於獲取變化資料, 資料變更捕獲的實現
- LogicBlox(資料庫), Datalog:遞迴關係查詢
- 日誌(資料結構), OLTP 系統的儲存與索引, 共享日誌作為共識, 術語表
- (另見 shared logs)
- 不可改變性的好處, 不可變事件的優點
- 和清除的權利, 資料系統、法律與社會, 磁碟空間使用
- 壓實(Compaction), 構建和合並 SSTable, 壓實策略, 日誌壓縮, 狀態、流和不變性
- 流運算子狀態, 失敗後重建狀態
- 執行獨特性限制, 基於日誌訊息傳遞中的唯一性
- 基於日誌的資訊, 基於日誌的訊息代理-重播舊訊息
- 比較傳統訊息, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 減 減, 消費者偏移量
- 磁碟空間使用情況, 磁碟空間使用
- 重播舊信件, 重播舊訊息, 應用演化後重新處理資料, 統一批處理和流處理
- 緩慢的消費者, 當消費者跟不上生產者時
- 使用日誌儲存信件, 使用日誌進行訊息儲存
- 日誌結構儲存, OLTP 系統的儲存與索引-壓實策略
- log-structured merge tree(見 LSM-trees)
- 與協商一致的關係, 共享日誌作為共識
- 複製, 單主複製, 複製日誌的實現-邏輯(基於行)日誌複製
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- (另見 changelogs)
- 與快照協調, 設定新的副本
- 邏輯(基於row) 複製, 邏輯(基於行)日誌複製
- 基於語句的複製, 基於語句的複製
- 預寫日誌(WAL)傳輸, 預寫日誌(WAL)傳輸
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- 伸縮性限制, 全序的限制
- 瀏覽器(商業情報軟體), 事務處理與分析的特徵, 分析(Analytics)
- 松耦合, 開展分拆工作
- lost updates(見 updates)
- 蓮花筆記(同步引擎), 同步引擎的利弊
- LSM-trees (indexes), SSTable 檔案格式-壓實策略
- 與B樹的比較, 比較 B 樹與 LSM 樹-磁碟空間使用
- Lucene(儲存引擎), 全文檢索
- 相似性搜尋, 全文檢索
- 最後寫入勝利(見 最後寫入勝利)
M
- 機器學習
- 瘋狂(決定性模擬測試), 確定性模擬測試
- 萬金油, 可伸縮性原則
- 可維護性, 可運維性-可演化性:讓變化更容易, 流式系統的哲學
- 可演化性(見 可演化性)
- 可操作性, 可運維性:讓運維更輕鬆
- 簡化和管理複雜性, 簡單性:管理複雜度
- 多種關係, 多對一與多對多關係
- 模擬為圖表, 圖資料模型
- 多對一關係, 多對一與多對多關係
- 在恆星計時, 星型與雪花型:分析模式
- MapReduce (batch processing), 批處理, MapReduce-MapReduce
- 使用者活動活動分析(例項), JOIN 與 GROUP BY
- 與流處理的比較, 流處理
- 不利條件和限制, MapReduce
- 過失容忍, 故障處理
- 高階工具, 查詢語言
- 對映和縮小函式, MapReduce
- 移動資料, 混洗資料
- 排序合併, JOIN 與 GROUP BY
- 工作流程, 工作流排程
- (另見 workflow engines)
- 編組(見 編碼)
- MartenDB(資料庫), 事件溯源與 CQRS
- 主奴隸複製(過時術語), 單主複製
- 物化, 術語表
- 總價值, 物化檢視與資料立方體
- 衝突, 物化衝突
- 實際意見, 物化檢視與資料立方體
- 作為衍生資料, 記錄系統與派生資料, 組合使用資料儲存技術-分拆系統與整合系統
- 如果來源, 事件溯源與 CQRS
- 增量檢視維護, 維護物化檢視
- (另見 incremental view maintenance (IVM))
- 維護,使用流處理, 維護物化檢視, 表表連線(維護物化檢視)
- 社會網路時間表例項, 時間線的物化與更新
- 物化, 物化檢視與資料立方體
- 增量檢視維護, 維護物化檢視
- 矩陣, 資料框、矩陣與陣列
- 人煙稀少, 資料框、矩陣與陣列
- Maxwell(變化資料捕獲), 資料變更捕獲的實現
- 說, 平均值、中位數與百分位點
- 媒體監測, 在流上搜索
- 中位數, 平均值、中位數與百分位點
- 會議室預訂(例), 寫偏差的更多例子, 謂詞鎖, 強制約束
- 除錯(除錯伺服器), 全記憶體儲存
- Memgraph(資料庫), 圖資料模型
- Cypher 查詢語言, Cypher 查詢語言
- 記憶體
- 壁障, 線性一致性與網路延遲
- 腐敗, 硬體與軟體故障
- 模擬資料庫, 全記憶體儲存
- 資料模擬表示, 編碼資料的格式
- 記憶體表, 構建和合並 SSTable
- 隨機位元- flips in, 信任但驗證
- 索引的使用, 日誌結構儲存
- 記憶體表, 構建和合並 SSTable
- 商品(版本控制系統), 併發控制
- 合併, 資料框、矩陣與陣列
- 合併排序的檔案, 構建和合並 SSTable, 混洗資料
- 默克爾樹, 用於可審計資料系統的工具
- Mesos(分組管理器), 應用程式碼和狀態的分離
- message brokers(見 messaging systems)
- message-passing(見 event-driven architecture)
- MessagePack (encoding format), 二進位制編碼
- 通訊系統, 流處理-重播舊訊息
- (另見 streams)
- 後壓、緩衝或丟棄信件, 訊息傳遞系統
- 無中介訊息, 直接從生產者傳遞給消費者
- 事件日誌, 基於日誌的訊息代理-重播舊訊息
- 作為資料模型, 事件溯源與 CQRS
- 比較傳統訊息, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 減 減, 消費者偏移量
- 重播舊信件, 重播舊訊息, 應用演化後重新處理資料, 統一批處理和流處理
- 緩慢的消費者, 當消費者跟不上生產者時
- 恰好一次語義, 恰好一次訊息處理, 再談恰好一次訊息處理, 容錯
- 信件經紀人, 訊息代理-確認與重新傳遞
- 承認和重新交付, 確認與重新傳遞
- 比較事件日誌, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 同一主題的多個消費者, 多個消費者
- versus RPC, 事件驅動的架構
- 訊息丟失, 訊息傳遞系統
- 可靠性, 訊息傳遞系統
- 以日誌為基礎的信件中的獨特性, 基於日誌訊息傳遞中的唯一性
- 可調味的失敗, 描述效能
- 計票
- 微批次, 微批次與存檔點
- 微服務, 微服務與無伺服器
- 微軟
- Azure Blob Storage(見 Azure Blob Storage)
- Azure managed disks, 儲存與計算的分離
- Azure Service Bus(訊息系統), 訊息代理, 訊息代理與資料庫的對比
- Azure SQL DB(資料庫), 雲原生系統架構
- Azure Storage, 物件儲存
- Azure Stream Analytics, 流分析
- Azure Synapse Analytics(資料庫), 雲原生系統架構
- 分散式元件物件模型, 遠端過程呼叫(RPC)的問題
- MSDTC (transaction coordinator), 兩階段提交(2PC)
- SQL Server(見 SQL Server)
- Microsoft Power BI(見 Power BI (business intelligence software))
- 遷移(重寫)資料, 文件模型中的模式靈活性, 不同時間寫入的不同值, 從同一事件日誌中派生多個檢視, 應用演化後重新處理資料
- MinIO(物件儲存), 分散式檔案系統
- 移動應用程式, 資料系統架構中的權衡
- 嵌入式資料庫, 壓實策略
- 模式檢查, 模型檢查與規範語言
- 模組操作員(%), 雜湊取模節點數
- Mojo(程式語言)
- 記憶體管理, 限制垃圾回收的影響
- MongoDB(資料庫)
- 管道合計, 文件的查詢語言
- 原子操作, 原子寫操作
- BSON, 讀寫的資料區域性
- 文件資料模型, 關係模型與文件模型
- 雜湊變硬, 按鍵的雜湊分片, 按雜湊範圍分片
- 在雲層中, 雲原生系統架構
- 加入支援, 文件和關係資料庫的融合
- 加入($$ookup 運算子), 正規化、反正規化與連線
- JSON Schema validation, JSON 模式
- 基於領導者的複製, 單主複製
- ObjectIds, ID 生成器和邏輯時鐘
- 基於範圍的硬化, 按鍵的範圍分片
- 請求路由, 請求路由
- 二級指數, 本地二級索引
- 硬分裂, 重新平衡鍵範圍分片資料
- 儲存程式, 儲存過程的利弊
- 監測, 雲時代的運維, 人類與可靠性, 可運維性:讓運維更輕鬆
- 單音鍾, 單調時鐘
- 單調讀, 單調讀
- Morel(查詢語言), 查詢語言
- MSMQ(訊息系統), XA 事務
- 多列索引, 多維索引與全文索引
- 多領導複製, 多主複製-處理寫入衝突
- (另見 複製)
- 協作編輯, 即時協作、離線優先和本地優先應用
- 衝突檢測, 處理寫入衝突
- 解決衝突, 處理寫入衝突
- 供多區域複製, 跨地域執行, 線性一致性的代價
- 線性,缺少, 實現線性一致性系統
- 可離線客戶端, 同步引擎與本地優先軟體
- 複製地形, 多主複製拓撲-不同拓撲的問題
- 多物件事務, 單物件與多物件操作
- 需求, 多物件事務的需求
- Multi-Paxos (consensus algorithm), 共識的實踐
- 多讀單寫鎖定, 兩階段鎖定的實現
- 多表索引叢集表, 讀寫的資料區域性
- 多版本併發控制, 多版本併發控制(MVCC), 總結
- detecting stale MVCC reads, 檢測陳舊的 MVCC 讀取
- 索引和快照隔離, 索引與快照隔離
- 使用同步時鐘, 用於全域性快照的同步時鐘
- 多層面陣列, 資料框、矩陣與陣列
- 多重租賃, 儲存與計算的分離, 網路擁塞和排隊
- 相互排斥, 悲觀併發控制與樂觀併發控制
- (另見 locks)
- MySQL(資料庫)
- archiving WAL to object stores, 設定新的副本
- 二進位制日誌座標, 設定新的副本
- 資料變更捕獲, 資料變更捕獲的實現, 變更流的 API 支援
- 迴圈複製地形, 多主複製拓撲
- 一致的快照, 設定新的副本
- 分散式事務支援, XA 事務
- global transaction identifiers (GTIDs), 設定新的副本
- 在雲層中, 雲原生系統架構
- InnoDB storage engine(見 InnoDB)
- 基於領導者的複製, 單主複製
- 多領導複製, 跨地域執行
- 基於行的複製, 邏輯(基於行)日誌複製
- 分片(見 Vitess(資料庫))
- 快速隔離支援, 快照隔離、可重複讀和命名混淆
- (另見 InnoDB)
- 基於語句的複製, 基於語句的複製
N
- N+1 query problem, 物件關係對映(ORM)
- 奈米msg(資訊庫), 直接從生產者傳遞給消費者
- Narayana(事務協調員), 兩階段提交(2PC)
- NATS(訊息系統), 訊息代理
- 自然語言處理, 從資料倉庫到資料湖
- Neo4j(資料庫)
- Cypher 查詢語言, Cypher 查詢語言
- 圖表資料模型, 圖資料模型
- Neon(資料庫), 設定新的副本
- 侄子(資料流引擎), 資料流引擎
- Neptune(圖資料庫), 圖資料模型
- Cypher 查詢語言, Cypher 查詢語言
- SPARQL 查詢語言, SPARQL 查詢語言
- 網碼(遊戲開發), 同步引擎的利弊
- Network Attached Storage (NAS), 共享記憶體、共享磁碟與無共享架構, 分散式檔案系統
- 網路模型(資料表示), 關係模型與文件模型
- Network Time Protocol(見 網路時間協議)
- 網路
- NewSQL, 關係模型與文件模型, 複製延遲的解決方案
- 事務和, 事務到底是什麼?, 資料庫內部的分散式事務
- 下鍵鎖定, 索引範圍鎖
- NFS (network file system), 分散式檔案系統
- 在物件儲存中, 物件儲存
- Nimble(資料格式), 雲資料倉庫, 列式儲存
- (另見 column-oriented storage)
- node (in graphs)(見 vertices)
- 節點(程序), 分散式與單節點系統, 術語表
- 吵鬧的鄰居, 網路擁塞和排隊
- 原子承諾, 三階段提交
- 非決定性操作, 基於語句的複製
- 不起作用的要求, 定義非功能性需求, 總結
- 不可重複讀作, 快照隔離與可重複讀
- (另見 讀取偏差)
- 正規化, 正規化、反正規化與連線-多對一與多對多關係, 術語表
- 外國關鍵參考文獻, 多物件事務的需求
- 社會網路案例研究, 社交網路案例研究中的反正規化
- 在記錄系統中, 記錄系統與派生資料
- 相對於非正常化, 從同一事件日誌中派生多個檢視
- NoSQL, 關係模型與文件模型, 複製延遲的解決方案, 分拆資料庫
- 事務和, 事務到底是什麼?
- Notation3 (N3), 三元組儲存與 SPARQL
- 網路時間協議, 不可靠的時鐘
- 準確性, 時鐘同步和準確性, 用於事件排序的時間戳
- 對單音鐘的調整, 單調時鐘
- 多個伺服器地址, 弱形式的謊言
- XML 與 JSON 編碼中的數字, JSON、XML 及其二進位制變體
- NumPy (Python library), 資料框、矩陣與陣列, 列式儲存
- NVMe (Non-Volatile Memory Express)(見 solid state drives (SSDs))
O
- 物件資料庫, 關係模型與文件模型
- 物件儲存, 雲服務的分層, 物件儲存-物件儲存
- 物件關係對映(ORM)框架, 物件關係對映(ORM)
- 物件關係不匹配, 物件關係不匹配
- 可觀察性, 分散式系統的問題, 人類與可靠性, 可運維性:讓運維更輕鬆
- 觀察員模式, 應用程式碼和狀態的分離
- OBT (one big table), 星型與雪花型:分析模式, 星型與雪花型:分析模式
- 離線系統, 批處理
- (另見 batch processing)
- 離線第一應用程式, 即時協作、離線優先和本地優先應用, 有狀態、可離線的客戶端
- 頁:1
- 加工過的原木中的消費者抵消額, 消費者偏移量
- 已磨損日誌中的訊息, 使用日誌進行訊息儲存
- OLAP, 事務處理與分析的特徵, 術語表
- 資料方塊, 物化檢視與資料立方體
- OLTP, 事務處理與分析的特徵, 術語表
- 分析查詢與, 分析(Analytics)
- 資料正常化, 正規化的權衡
- 工作量特點, 實際序列執行
- 現場部署, 雲服務與自託管
- 資料倉庫, 雲資料倉庫
- 一個大表格(資料倉計劃), 星型與雪花型:分析模式, 星型與雪花型:分析模式
- 單熱編碼, 資料框、矩陣與陣列
- 一對夫婦關係, 用於一對多關係的文件資料模型
- 一對多種關係, 用於一對多關係的文件資料模型
- JSON representation, 用於一對多關係的文件資料模型
- 線上系統, 批處理
- (另見 services)
- 相對於科學計算, 雲計算與超級計算
- 腫瘤, 三元組儲存與 SPARQL
- Oozie(工作流排程器), 批處理
- OpenAPI (service definition format), 微服務與無伺服器, Web 服務, Web 服務
- use of JSON Schema, JSON 模式
- openCypher(見 Cypher(查詢語言))
- OpenLink Virtuoso(見 Virtuoso(資料庫))
- OpenStack
- Swift(物件儲存), 物件儲存
- 可操作性, 可運維性:讓運維更輕鬆
- 作業系統與資料庫, 分拆資料庫
- 業務系統, 分析型與事務型系統
- 操作轉換, CRDT 與操作變換
- 行動組, 雲時代的運維
- 運算元, 查詢執行:編譯與向量化
- 在溪流處理中, 流處理
- 樂觀併發控制, 悲觀併發控制與樂觀併發控制
- 樂觀鎖定, 條件寫入(比較並設定)
- Oracle(資料庫)
- 分散式事務支援, XA 事務
- GoldenGate (change data capture), 資料變更捕獲的實現
- 等級查詢, SQL 中的圖查詢, SQL 中的圖查詢
- 缺乏序列性, 隔離性
- 基於領導者的複製, 單主複製
- 多領導複製, 跨地域執行
- 多表索引叢集表, 讀寫的資料區域性
- 無法阻止寫入 skew, 寫偏差的特徵
- PL/SQL language, 儲存過程的利弊
- 防止丟失更新, 自動檢測丟失的更新
- 讀作承諾隔離, 實現讀已提交
- Real Application Clusters (RAC), 鎖定與領導者選舉
- 快速隔離支援, 快照隔離與可重複讀, 快照隔離、可重複讀和命名混淆
- TimesTen (in-memory database), 全記憶體儲存
- WAL-based replication, 預寫日誌(WAL)傳輸
- ORC(資料格式), 雲資料倉庫, 列式儲存
- (另見 column-oriented storage)
- 協調(服務部署), 雲服務與自託管, 微服務與無伺服器
- 順序
- 事件日誌, 事件溯源與 CQRS
- 總訂單的限制, 全序的限制
- 邏輯時間戳, 邏輯時鐘
- of auto-incrementing IDs, ID 生成器和邏輯時鐘
- 共享日誌, 共識的實踐-共識的利弊
- Orkes(工作流程引擎), 持久化執行與工作流
- 孤兒頁面(B- 樹), 使 B 樹可靠
- 發件箱圖案, 資料變更捕獲與事件溯源
- 異常值(響應時間), 平均值、中位數與百分位點
- 外包, 雲服務與自託管
- 超載, 描述效能, 處理錯誤和中止
P
- PACELC principle, CAP 定理
- 軟體包管理器, 應用程式碼和狀態的分離
- 包切換, 我們不能簡單地使網路延遲可預測嗎?
- 資料包
- 腐敗, 弱形式的謊言
- sending via UDP, 直接從生產者傳遞給消費者
- PageRank (algorithm), 圖資料模型, 查詢語言, 機器學習
- paging(見 virtual memory)
- 大熊貓(蟒蛇圖書館), 從資料倉庫到資料湖, 資料框、矩陣與陣列, 列式儲存, DataFrames
- Parquet(資料格式), 雲資料倉庫, 列式儲存, 歸檔儲存, 查詢語言
- 部分失敗, 故障與部分失效, 總結
- 跛腳, 系統模型與現實
- 部分同步(系統模型), 系統模型與現實
- 分割槽鍵, 分片的利與弊, 鍵值資料的分片
- 分割槽(見 分片)
- Paxos(協商一致演算法), 共識, 共識的實踐
- payment card industry (PCI), 資料系統、法律與社會
- PCI (payment card industry) compliance, 資料系統、法律與社會
- 百分位點, 平均值、中位數與百分位點, 術語表
- Percolator (Google), 實現線性一致的 ID 生成器
- Percona XtraBackup (MySQL tool), 設定新的副本
- 效能
- 作為過失的降解, 系統模型與現實
- 描述, 描述效能
- 分散式事務, 跨不同系統的分散式事務
- 記憶體資料庫, 全記憶體儲存
- 線性, 線性一致性與網路延遲
- 多領導者複製, 跨地域執行
- 許可權隔離, 面向多租戶的分片
- 永久不一致, 及時性與完整性
- 悲觀併發控制, 悲觀併發控制與樂觀併發控制
- pglogical (PostgreSQL extension), 跨地域執行
- pgvector (向量指數), 向量嵌入
- 幻讀, 導致寫偏差的幻讀
- physical clocks(見 clocks)
- pick菜(蟒魚), 特定語言的格式
- Pinot(資料庫), 事務處理與分析的特徵, 列式儲存
- 處理寫入, 寫入列式儲存
- 預彙總, 分析(Analytics)
- 服務衍生資料, 對外提供派生資料, 對外提供派生資料
- 編審中的執行
- 資料倉查詢, 查詢執行:編譯與向量化
- 樞軸表, 資料框、矩陣與陣列
- 時間點, 不可靠的時鐘
- 點查詢, 事務處理與分析的特徵
- 極地(資料目錄), 雲資料倉庫
- 投票, 表示使用者、帖子與關注關係
- 多邊儲存器, 一切的元資料庫
- POSIX (portable operating system interface)
- 郵政局地平線醜聞, 人類與可靠性
- 缺乏事務, 事務
- PostgreSQL(資料庫)
- archiving WAL to object stores, 設定新的副本
- 資料變更捕獲, 資料變更捕獲的實現, 變更流的 API 支援
- 分散式事務支援, XA 事務
- 外國資料包, 一切的元資料庫
- 全文搜尋支援, 組合使用派生資料的工具
- 在雲層中, 雲原生系統架構
- JSON Schema validation, JSON 模式
- 基於領導者的複製, 單主複製
- 日誌序列號, 設定新的副本
- 邏輯解碼, 邏輯(基於行)日誌複製
- 實現檢視維護, 維護物化檢視
- 多領導複製, 跨地域執行
- MVCC implementation, 多版本併發控制(MVCC), 索引與快照隔離
- 分割對硬化, 分片
- pgvector (向量指數), 向量嵌入
- PL/pgSQL language, 儲存過程的利弊
- PostGIS geospatial indexes, 多維索引與全文索引
- 防止丟失更新, 自動檢測丟失的更新
- 防止寫入skew, 寫偏差的特徵, 可序列化快照隔離(SSI)
- 讀作承諾隔離, 實現讀已提交
- 表示圖表, 屬性圖
- 可序列化快照隔離, 可序列化快照隔離(SSI)
- 分片(見 Citus(資料庫))
- 快速隔離支援, 快照隔離與可重複讀, 快照隔離、可重複讀和命名混淆
- WAL-based replication, 預寫日誌(WAL)傳輸
- 倒排列表, 全文檢索
- 在硬化指數中, 本地二級索引
- 死後無咎, 人類與可靠性
- PouchDB(資料庫), 同步引擎的利弊
- Power BI (business intelligence software), 事務處理與分析的特徵, 分析(Analytics)
- 預彙總, 分析(Analytics)
- 服務衍生資料, 對外提供派生資料
- 分享前, 重新平衡鍵範圍分片資料
- Precision Time Protocol (PTP), 時鐘同步和準確性
- 上游鎖定, 謂詞鎖
- 預測分析, 分析型與事務型系統, 預測分析-反饋迴路
- 預設, 資源分配
- Prefect(工作流排程器), 持久化執行與工作流, 批處理, 工作流排程
- 雲資料倉整合, 查詢語言
- Presto(查詢引擎), 雲資料倉庫
- 主金鑰, 多列索引與二級索引, 術語表
- 自動遞增, ID 生成器和邏輯時鐘
- 對分割槽鍵, 按雜湊範圍分片
- primary-backup replication(見 基於領導者的複製)
- 隱私, 隱私與追蹤-立法與自律
- 機率演算法, 響應時間指標的應用, 流分析
- 程序暫停, 程序暫停-限制垃圾回收的影響
- 處理時間(事件), 時間推理
- 生產者(資訊流), 傳遞事件流
- 產品分析, 事務處理與分析的特徵
- 面向列的儲存, 列式儲存
- 程式語言
- 用於儲存程式, 儲存過程的利弊
- 預測(活動來源), 事件溯源與 CQRS
- Prolog(語言), Datalog:遞迴關係查詢
- (另見 Datalog)
- 屬性圖, 屬性圖
- Cypher 查詢語言, Cypher 查詢語言
- Property Graph Query Language (PGQL), SQL 中的圖查詢
- 基於屬性的測試, 人類與可靠性, 形式化方法和隨機測試
- Protocol Buffers(資料格式), Protocol Buffers-欄位標籤與模式演化, Protocol Buffers
- 欄位標記和計劃演變, 欄位標籤與模式演化
- 資料來源, 為可審計性而設計
- 釋出/訂閱模式, 訊息傳遞系統
- 出版社(資訊流), 傳遞事件流
- Pulsar (流線平臺), 確認與重新傳遞
- PyTorch (machine learning library), 機器學習
Q
- Qpid(訊息系統), 訊息代理與資料庫的對比
- quality of service (QoS), 我們不能簡單地使網路延遲可預測嗎?
- Quantcast File System(分散式檔案系統), 物件儲存
- 查詢引擎
- 彙編和向量化, 查詢執行:編譯與向量化
- 在雲資料倉庫中, 雲資料倉庫
- 運算元, 查詢執行:編譯與向量化
- 最佳化申報查詢, 資料模型與查詢語言
- 查詢語言
- 密碼, Cypher 查詢語言
- 資料日誌, Datalog:遞迴關係查詢
- GraphQL, GraphQL
- MongoDB aggregation pipeline, 正規化、反正規化與連線, 文件的查詢語言
- recursive SQL queries, SQL 中的圖查詢
- SPARQL, SPARQL 查詢語言
- SQL, 正規化、反正規化與連線
- 查詢最佳化器, 查詢語言
- 查詢計劃, 查詢執行:編譯與向量化
- 排隊延遲, 網路擁塞和排隊
- 佇列(訊息), 訊息代理
- QUIC (protocol), TCP 的侷限性
- 法定人數, 讀寫仲裁-多地區操作, 術語表
- 配額, 雲時代的運維
R
- R(語言), 從資料倉庫到資料湖, 資料框、矩陣與陣列, DataFrames
- R樹(指數), 多維索引與全文索引
- R2(物件儲存), 雲服務的分層, 分散式檔案系統
- RabbitMQ(訊息系統), 訊息代理, 訊息代理與資料庫的對比
- 法定人數佇列(複製), 單主複製
- 種族條件, 隔離性
- Raft(協商一致演算法), 共識, 共識的實踐
- RAID (Redundant Array of Independent Disks), 儲存與計算的分離, 透過冗餘容忍硬體故障, 分散式檔案系統
- 鐵路,計劃遷移, 應用演化後重新處理資料
- RAM(見 memory)
- RAMCloud (in-memory storage), 全記憶體儲存
- 隨機寫入(訪問模式), 順序與隨機寫入
- 區域查詢
- 排名演算法, 機器學習
- Ray(工作流排程器), 機器學習
- RDF (Resource Description Framework), RDF 資料模型
- querying with SPARQL, SPARQL 查詢語言
- 遠端直接記憶體訪問, 雲服務的分層, 雲計算與超級計算
- 反應(使用者介面庫), 端到端的事件流
- 被動方案擬訂, 同步引擎的利弊
- 讀取承諾隔離級別, 讀已提交-實現讀已提交
- 執行, 實現讀已提交
- 多版本併發控制, 多版本併發控制(MVCC)
- 沒有髒讀, 沒有髒讀
- 沒有汙穢的文字, 沒有髒寫
- 讀取模型(活動來源), 事件溯源與 CQRS
- 讀路徑, 觀察派生資料狀態
- (無鉛複製), 追趕錯過的寫入
- 線性, 線性一致性與仲裁
- 只讀副本(見 基於領導者的複製)
- 讀取偏差, 快照隔離與可重複讀, 總結
- 讀取未承諾的隔離級別, 實現讀已提交
- 寫後讀一致性, 讀己之寫, 及時性與完整性
- 交叉裝置, 讀己之寫
- 在衍生資料系統中, 派生資料與分散式事務
- 讀 - 修改 - 寫入週期, 防止丟失更新
- 讀縮放架構, 複製延遲的問題, 單主與無主複製的效能
- 與磨損, 分片的利與弊
- 讀作事件, 讀也是事件
- 即時
- analytics(見 product analytics)
- 協作編輯, 即時協作、離線優先和本地優先應用
- 釋出/訂閱資料流, 端到端的事件流
- 響應時間保障, 響應時間保證
- 每日時鐘, 日曆時鐘
- Realm(資料庫), 同步引擎的利弊
- 重新平衡困難, 重新平衡鍵範圍分片資料-運維:自動/手動再平衡, 術語表
- (另見 分片)
- 自動或人工重新平衡, 運維:自動/手動再平衡
- 固定塊數, 固定數量的分片
- 每個節點的固定硬度數, 按雜湊範圍分片
- Hash mod N的問題, 雜湊取模節點數
- 新鮮度保證, 線性一致性
- 建議引擎, 分析型與事務型系統
- 重組(協商一致), 共識的微妙之處
- 記錄, MapReduce
- 流處理中的事件, 傳遞事件流
- 遞迴查詢
- 在金鑰中, Cypher 查詢語言
- 在資料日誌中, Datalog:遞迴關係查詢
- in SPARQL, SPARQL 查詢語言
- lack of, in GraphQL, GraphQL
- SQL common table expressions, SQL 中的圖查詢
- Red Hat
- Apicurio Registry, JSON 模式
- 紅黑樹, 構建和合並 SSTable
- 重新交付(通訊), 確認與重新傳遞
- Redis(資料庫)
- redo log(見 write-ahead log)
- Redpanda(訊息系統), 訊息代理, 設定新的副本
- 分層儲存, 磁碟空間使用
- Redshift(資料庫), 雲資料倉庫
- 冗餘
- 硬體元件, 透過冗餘容忍硬體故障
- 生成資料, 記錄系統與派生資料
- (另見 衍生資料)
- Reed–Solomon codes (error correction), 分散式檔案系統
- 重構, 可演化性:讓變化更容易
- (另見 可演化性)
- (地理分佈), 讀己之寫
- 區域(硬化), 分片
- 暫存器, 什麼使系統具有線性一致性?
- regulation(見 legal matters)
- 關係資料模型, 從資料倉庫到資料湖, 關係模型與文件模型-文件和關係資料庫的融合
- 與檔案模型的比較, 何時使用哪種模型-文件和關係資料庫的融合
- graph queries in SQL, SQL 中的圖查詢
- 模擬資料庫, 全記憶體儲存
- 多對多對多的關係, 多對一與多對多關係
- 多物件事務, 需要, 多物件事務的需求
- 物件關係不匹配, 物件關係不匹配
- 代表可重排列表, 何時使用哪種模型
- 對文件模式
- 模式的趨同, 文件和關係資料庫的融合
- 資料位置, 讀寫的資料區域性
- 關係資料庫
- 最終一致性, 複製延遲的問題
- 歷史, 關係模型與文件模型
- 基於領導者的複製, 單主複製
- 邏輯日誌, 邏輯(基於行)日誌複製
- 哲學比Unix, 分拆資料庫, 一切的元資料庫
- 方案變化, 文件模型中的模式靈活性, 編碼與演化, 不同時間寫入的不同值
- 硬化二級指數, 分片與二級索引
- 基於語句的複製, 基於語句的複製
- B樹指數的使用, B 樹
- relationships(見 edges)
- 可靠性, 可靠性與容錯-人類與可靠性, 流式系統的哲學
- Remote Method Invocation (Java RMI), 遠端過程呼叫(RPC)的問題
- remote procedure calls (RPCs), 遠端過程呼叫(RPC)的問題-RPC 的資料編碼與演化
- (另見 services)
- 資料編碼和演化, RPC 的資料編碼與演化
- 問題, 遠端過程呼叫(RPC)的問題
- 使用 Avro, 但什麼是寫入者模式?
- 對信件經紀人, 事件驅動的架構
- 可再生能源, 分散式與單節點系統
- 可重複讀(切換隔離), 快照隔離、可重複讀和命名混淆
- 複製品, 單主複製
- 複製, 複製-總結, 術語表
- 永續性, 永續性
- 解決衝突, 衝突解決與複製
- 一致性屬性, 複製延遲的問題-複製延遲的解決方案
- 在分散式檔案系統中, 分散式檔案系統
- 無主(無領導者), 無主複製-版本向量
- 監測停滯情況, 監控陳舊性
- 多領導者, 多主複製-處理寫入衝突
- 使用原因, 分散式與單節點系統, 複製
- 硬化和, 分片
- 單人領導, 單主複製-邏輯(基於行)日誌複製
- 故障切換, 領導者故障:故障轉移
- 實施複製日誌, 複製日誌的實現-邏輯(基於行)日誌複製
- 與協商一致的關係, 從單主複製到共識, 共識的利弊
- 設立新的追隨者, 設定新的副本
- 同步對同步, 同步複製與非同步複製-同步複製與非同步複製
- 狀態機複製, 基於語句的複製, 儲存過程的利弊, 使用共享日誌, 資料庫與流
- 事件溯源, 事件溯源與 CQRS
- 依賴決定性因素, 確定性模擬測試
- 利用協商一致, 共識的利弊
- 使用擦除編碼, 分散式檔案系統
- 使用物件儲存, 設定新的副本
- 相對備份, 複製
- 具有多樣化資料系統, 保持系統同步
- replication logs(見 logs)
- representations of data(見 data models)
- 後處理資料, 應用演化後重新處理資料, 統一批處理和流處理
- (另見 可演化性)
- 從基於日誌的信件, 重播舊訊息
- 請求套期, 單主與無主複製的效能
- 請求識別符號, 操作識別符號, 多分割槽請求處理
- 請求路由, 請求路由-請求路由
- 方法, 請求路由
- 資料居住法, 分散式與單節點系統, 面向多租戶的分片
- 彈性系統, 可靠性與容錯
- (另見 fault tolerance)
- 資源隔離, 雲計算與超級計算, 面向多租戶的分片
- 資源限制, 雲時代的運維
- 響應時間
- 作為業績計量, 描述效能, 批處理
- 保證, 響應時間保證
- 對使用者的影響, 平均值、中位數與百分位點
- 在複製系統中, 單主與無主複製的效能
- 暫時性與, 延遲與響應時間
- 平均值和百分位數, 平均值、中位數與百分位點
- 使用者體驗, 平均值、中位數與百分位點
- 責任和問責制, 責任與問責
- 表述性狀態傳遞, Web 服務
- (另見 services)
- 重報(工作流程引擎), 持久化執行與工作流
- RethinkDB(資料庫)
- 加入支援, 文件和關係資料庫的融合
- 鍵程硬化, 按鍵的範圍分片
- 重試風暴, 描述效能, 軟體故障
- reverse ETL, 超越資料湖
- Riak(資料庫)
- CRDT support, CRDT 與操作變換, 檢測併發寫入
- 點版向量, 版本向量
- 流言協議, 請求路由
- 雜湊變硬, 固定數量的分片
- 無領導複製, 無主複製
- 線性,缺少, 線性一致性與仲裁
- 多區域支助, 多地區操作
- 再平衡, 運維:自動/手動再平衡
- 二級指數, 本地二級索引
- 草率法定人數, 單主與無主複製的效能
- 節點(硬化), 分片
- 環緩衝器, 磁碟空間使用
- RisingWave(資料庫)
- 增量檢視維護, 維護物化檢視
- 火箭彈, 拜占庭故障
- RocksDB (storage engine), 構建和合並 SSTable
- 退縮(事務), 事務
- 滾動升級, 透過冗餘容忍硬體故障, 編碼與演化, 故障與部分失效
- 在多種租戶系統中, 面向多租戶的分片
- routing(見 request routing)
- 基於行的複製, 邏輯(基於行)日誌複製
- 面向行儲存, 列式儲存
- 搶劫犯(貪汙), 硬體與軟體故障
- RPCs(見 remote procedure calls)
- 規則(資料), Datalog:遞迴關係查詢
- Rust(程式語言)
- 記憶體管理, 限制垃圾回收的影響
S
- S3(物件儲存), 雲服務的分層, 設定新的副本, 批處理, 分散式檔案系統, 物件儲存
- SaaS(見 軟體即服務(SaaS))
- 安全和生活特性, 安全性與活性
- sagas(見 compensating transactions)
- Samza (流處理器), 流分析
- SAP HANA(資料庫), 分析型資料儲存
- 可伸縮性, 可伸縮性-可伸縮性原則, 流式系統的哲學
- 自動縮放, 運維:自動/手動再平衡
- 透過磨損, 分片的利與弊
- 描述負載, 描述負載
- 描述效能, 描述效能
- 線性, 描述負載
- 原則, 可伸縮性原則
- 複製和, 複製延遲的問題
- 擴大規模與擴大規模, 共享記憶體、共享磁碟與無共享架構
- 縮放, 共享記憶體、共享磁碟與無共享架構
- (另見 shared-nothing architecture)
- 透過磨損, 分片的利與弊
- 擴大規模, 共享記憶體、共享磁碟與無共享架構
- 緩慢變化的維度, 連線的時間依賴性
- 排程
- 閱讀時的圖謀, 文件模型中的模式靈活性
- 與可變方案比較, 模式的優點
- 拼寫圖, 文件模型中的模式靈活性
- schemaless databases(見 schema-on-read)
- 計劃, 術語表
- Avro, Avro-動態生成的模式
- 讀者決定作家的計劃, 但什麼是寫入者模式?
- 計劃演變, 寫入者模式與讀取者模式
- 動態生成, 動態生成的模式
- 變化, 應用演化後重新處理資料
- 影響應用程式程式碼, 編碼與演化
- 相容性檢查, 但什麼是寫入者模式?
- 資料庫中, 流經資料庫的資料流-歸檔儲存
- 服務電話, RPC 的資料編碼與演化
- 檔案模式的靈活性, 文件模型中的模式靈活性
- 用於分析, 星型與雪花型:分析模式-星型與雪花型:分析模式
- for JSON and XML, JSON、XML 及其二進位制變體, JSON 模式
- generation and migration using ORMs, 物件關係對映(ORM)
- 案情, 模式的優點
- 遷移, 文件模型中的模式靈活性
- Protocol Buffers, Protocol Buffers-欄位標籤與模式演化
- 計劃演變, 欄位標籤與模式演化
- 鐵路移民計劃, 應用演化後重新處理資料
- 傳統的設計方法,謬誤, 從同一事件日誌中派生多個檢視
- Avro, Avro-動態生成的模式
- 科學計算, 雲計算與超級計算
- scikit-learn (Python 圖書館), 從資料倉庫到資料湖
- ScyllaDB(資料庫)
- 叢集元資料, 請求路由
- consistency level ANY, 單主與無主複製的效能
- 雜湊變硬, 按鍵的雜湊分片, 按雜湊範圍分片
- 最後寫成的解決衝突, 檢測併發寫入
- 無領導複製, 無主複製
- 輕量事務, 單物件寫入
- 線性,缺少, 實現線性一致性系統
- 日誌結構儲存, 構建和合並 SSTable
- 多區域支助, 多地區操作
- 使用時鐘, 仲裁一致性的侷限, 用於事件排序的時間戳
- 節點(硬化), 分片
- search engines(見 全文檢索)
- 搜尋流, 在流上搜索
- 備庫(見 基於領導者的複製)
- 二級指數, 多列索引與二級索引, 術語表
- 二次排序, JOIN 與 GROUP BY
- sed (Unix 工具) (英語)., 簡單日誌分析
- 自我託管, 雲服務與自託管
- 資料倉庫, 雲資料倉庫
- 自我歡樂, 本章小結
- 自動驗證系統, 不要盲目信任承諾
- 語義搜尋, 向量嵌入
- 語義相似性, 向量嵌入
- 語義網, 三元組儲存與 SPARQL
- 半同步複製, 同步複製與非同步複製
- 順序寫(訪問模式), 順序與隨機寫入
- 可序列化, 隔離性, 弱隔離級別, 可序列化-可序列化快照隔離的效能, 術語表
- 線性比對, 什麼使系統具有線性一致性?
- 悲觀與樂觀的併發控制, 悲觀併發控制與樂觀併發控制
- 序列執行, 實際序列執行-序列執行總結
- 分片, 分片
- 使用儲存程式, 將事務封裝在儲存過程中, 使用共享日誌
- 可序列化快照隔離, 可序列化快照隔離(SSI)-可序列化快照隔離的效能
- detecting stale MVCC reads, 檢測陳舊的 MVCC 讀取
- 檢測影響先前讀取的寫入, 檢測影響先前讀取的寫入
- 分散式執行, 可序列化快照隔離的效能, 資料庫內部的分散式事務
- performance of SSI, 可序列化快照隔離的效能
- 防止寫入skew, 基於過時前提的決策-檢測影響先前讀取的寫入
- 嚴格的序列性, 什麼使系統具有線性一致性?
- 及時性與完整性, 及時性與完整性
- 兩階段鎖定, 兩階段鎖定(2PL)-索引範圍鎖
- 可序列化, 特定語言的格式
- 序列化, 編碼資料的格式
- (另見 編碼)
- 無伺服器, 微服務與無伺服器
- 服務發現, 負載均衡器、服務發現和服務網格, 請求路由, 服務發現
- 登記, 負載均衡器、服務發現和服務網格
- using DNS, 負載均衡器、服務發現和服務網格, 請求路由, 服務發現
- 服務級別協議(SLA), 響應時間指標的應用, 描述負載
- 服務網格, 負載均衡器、服務發現和服務網格
- Service Organization Control (SOC), 資料系統、法律與社會
- 服務時間, 延遲與響應時間
- 面向服務的體系結構, 微服務與無伺服器
- (另見 services)
- 服務, 流經服務的資料流:REST 與 RPC-RPC 的資料編碼與演化
- 微服務, 微服務與無伺服器
- 與批次/流程處理器的關係, 批處理, 流處理器和服務
- remote procedure calls (RPCs), 遠端過程呼叫(RPC)的問題-RPC 的資料編碼與演化
- 問題, 遠端過程呼叫(RPC)的問題
- 與資料庫相似, 流經服務的資料流:REST 與 RPC
- 網路服務, Web 服務
- 會話視窗(流處理), 視窗的型別
- (另見 windows)
- 分片, 分片-總結, 術語表
- 和共識, 使用共享日誌
- 複製, 分片
- 分散事務, 分散式事務
- 熱的軟糖, 鍵值資料的分片
- 分批處理, 批處理
- 鍵程分割, 重新平衡鍵範圍分片資料
- 多硬性操作, 多分割槽資料處理
- 關鍵值資料, 鍵值資料的分片-偏斜的工作負載與緩解熱點
- 按金鑰範圍, 按鍵的範圍分片
- 搖擺和熱點, 偏斜的工作負載與緩解熱點
- 詞源, 分片
- 分割槽鍵, 分片的利與弊, 鍵值資料的分片
- 再平衡
- 金鑰範圍壓縮資料, 重新平衡鍵範圍分片資料
- 重新平衡困難, 重新平衡鍵範圍分片資料-運維:自動/手動再平衡
- 自動或人工重新平衡, 運維:自動/手動再平衡
- Hash mod N的問題, 雜湊取模節點數
- 使用固定的碎片數, 固定數量的分片
- 使用 N 個節點, 按雜湊範圍分片
- 請求路由, 請求路由-請求路由
- 二級指數, 分片與二級索引-全域性二級索引
- 連續執行事務和, 分片
- 正在排序硬化資料, 混洗資料
- 共享日誌, 共識的實踐-共識的利弊, 全序的限制, 基於日誌訊息傳遞中的唯一性
- 共享模式, 兩階段鎖定的實現
- 共享磁碟架構, 共享記憶體、共享磁碟與無共享架構, 分散式檔案系統
- 共享記憶體架構, 共享記憶體、共享磁碟與無共享架構
- 共享- 無結構, 共享記憶體、共享磁碟與無共享架構, 術語表
- 鯊魚
- shredding (deletion)(見 crypto-shredding)
- 粉碎(專欄編碼), 列式儲存
- 粉碎(相關模型), 何時使用哪種模型
- 混洗, 混洗資料-混洗資料
- 兄弟, 手動衝突解決, 捕獲先發生關係, 衝突解決與複製
- (另見 conflicts)
- 倉, 資料倉庫
- 相似性搜尋
- 簡單, 簡單性:管理複雜度
- 歌手, 資料倉庫
- single-instruction-multi-data (SIMD) instructions, 查詢執行:編譯與向量化
- single-leader replication(見 基於領導者的複製)
- 單條執行, 原子寫操作, 實際序列執行
- 在溪流處理中, 日誌與傳統的訊息傳遞相比, 併發控制, 基於日誌訊息傳遞中的唯一性
- SingleStore(資料庫)
- 記憶體儲, 全記憶體儲存
- 工地可靠性工程師, 雲時代的運維
- 大小級緊湊, 壓實策略, 磁碟空間使用
- 偏斜, 術語表
- 時鐘搖擺, 對同步時鐘的依賴-帶置信區間的時鐘讀數, 實現線性一致性系統
- 事務隔離
- 含義, 快照隔離與可重複讀
- 不平衡的工作量, 鍵值資料的分片
- 補償, 偏斜的工作負載與緩解熱點
- 由於名人, 偏斜的工作負載與緩解熱點
- 時間序列資料, 按鍵的範圍分片
- 跳過列表, 構建和合並 SSTable
- 服務級別協議(見 服務級別協議)
- Slack(分組聊天)
- GraphQL example, GraphQL
- SlateDB(資料庫), 構建和合並 SSTable, 設定新的副本
- 滑動視窗(流處理), 視窗的型別
- (另見 windows)
- 草率法定人數, 單主與無主複製的效能
- 緩慢變化的維度, 連線的時間依賴性
- 塗抹(傾斜秒調整), 時鐘同步和準確性
- 快照(資料庫)
- 作為備份, 複製
- 計算衍生資料, 建立索引
- 變化資料捕獲中, 初始快照
- 可序列化快照隔離, 可序列化快照隔離(SSI)-可序列化快照隔離的效能
- 新建複製品, 設定新的副本
- 快速隔離和可重複讀取, 快照隔離與可重複讀-快照隔離、可重複讀和命名混淆
- implementing with MVCC, 多版本併發控制(MVCC)
- indexes and MVCC, 索引與快照隔離
- 可見度規則, 觀察一致快照的可見性規則
- 全球快照同步時鐘, 用於全域性快照的同步時鐘
- Snowflake(資料庫), 雲原生系統架構, 雲服務的分層, 雲資料倉庫, 批處理
- Snowflake (ID generator), ID 生成器和邏輯時鐘
- 雪花計劃, 星型與雪花型:分析模式
- SOAP (web services), 遠端過程呼叫(RPC)的問題
- SOC2(見 Service Organization Control (SOC))
- 社會圖表, 圖資料模型
- 社會
- 的責任, 資料系統、法律與社會, 立法與自律
- 社會技術系統, 人類與可靠性
- 軟體即服務(SaaS), 資料系統架構中的權衡, 雲服務與自託管
- 軟體錯誤, 軟體故障
- 維護誠信, 維護完整性,儘管軟體有Bug
- 太陽風暴, 硬體與軟體故障
- solid state drives (SSDs)
- Solr (搜尋伺服器)
- 排序(Unix 工具), 簡單日誌分析, 簡單日誌分析, 排序與記憶體聚合, 分散式作業編排
- 排序歸併連線(MapReduce), JOIN 與 GROUP BY
- Sorted String Tables(見 SSTables)
- 排序
- 列儲存中的排序順序, 列儲存中的排序順序
- 真相來源(權威資料來源)(見 systems of record)
- Spanner(資料庫)
- 一致性模式, 什麼使系統具有線性一致性?
- 資料位置, 讀寫的資料區域性
- 在雲層中, 雲原生系統架構
- 使用時鐘快照隔離, 用於全域性快照的同步時鐘
- 事務, 事務到底是什麼?, 資料庫內部的分散式事務
- TrueTime API, 帶置信區間的時鐘讀數
- Spark(處理框架), 從資料倉庫到資料湖, 雲原生系統架構, 批處理, 資料流引擎
- SPARQL(查詢語言), SPARQL 查詢語言
- 零星指數, SSTable 檔案格式
- 稀疏矩陣, 資料框、矩陣與陣列
- 腦裂, 領導者故障:故障轉移, 請求路由, 術語表
- 執行限制, 唯一性約束需要達成共識
- 在共識演算法中, 共識, 從單主複製到共識
- 預防, 實現線性一致性系統
- 使用柵欄標誌來避免, 隔離殭屍程序和延遲請求-多副本隔離
- 現場例項, 故障處理
- 電子表格, 資料系統架構中的權衡, 資料框、矩陣與陣列
- SQL (Structured Query Language), 簡單性:管理複雜度, 關係模型與文件模型, 雲資料倉庫
- 用於分析, 資料倉庫, 列式儲存
- 圖表查詢, SQL 中的圖查詢
- 隔離級別標準,問題, 快照隔離、可重複讀和命名混淆
- 加入, 正規化、反正規化與連線
- 簡歷(例), 用於一對多關係的文件資料模型
- 社會網路家庭時間表(例), 表示使用者、帖子與關注關係
- SQL injection vulnerability, 拜占庭故障
- 基於語句的複製, 基於語句的複製
- 儲存程式, 儲存過程的利弊
- 批次處理框架中的支援, 批處理
- 檢視, Datalog:遞迴關係查詢
- SQL Server(資料庫)
- SQLite(資料庫), 分散式系統的問題, 壓實策略
- archiving WAL to object stores, 設定新的副本
- SRE (site reliability engineer), 雲時代的運維
- SSDs(見 solid state drives)
- SSTables (storage format), SSTable 檔案格式-壓實策略
- 建造和維護, 構建和合並 SSTable
- making LSM-Tree from, 構建和合並 SSTable
- 階段釋出(見 rolling upgrades)
- 停滯(舊資料), 讀己之寫
- 跨渠道時間依賴性, 跨通道時序依賴
- 無頭資料庫中, 當節點故障時寫入資料庫
- 多轉換併發控制, 檢測陳舊的 MVCC 讀取
- 監測, 監控陳舊性
- 客戶端狀態, 將狀態變更推送給客戶端
- 相對線性, 線性一致性
- 相對於及時性, 及時性與完整性
- standbys(見 基於領導者的複製)
- 恆星複製地形, 多主複製拓撲
- 恆星計劃, 星型與雪花型:分析模式-星型與雪花型:分析模式
- 星球大戰類比(事件時間與處理時間), 事件時間與處理時間
- 飢餓(時間安排), 資源分配
- 國家
- 從不可改變事件日誌中得出, 狀態、流和不變性
- 狀態變化與應用程式程式碼之間的相互作用, 資料流:應用程式碼與狀態變化的互動
- 保持衍生狀態, 維護派生狀態
- 由流處理器在流-流連線中維護, 流流連線(視窗連線)
- 觀察匯出狀態, 觀察派生資料狀態-多分割槽資料處理
- 流處理器失敗後重建, 失敗後重建狀態
- 應用程式碼和, 應用程式碼和狀態的分離
- 狀態機複製, 基於語句的複製, 儲存過程的利弊, 使用共享日誌, 資料庫與流
- 事件溯源, 事件溯源與 CQRS
- 依賴決定性因素, 確定性模擬測試
- 無國籍人制度, 資料系統架構中的權衡
- 基於語句的複製, 基於語句的複製
- 依賴決定性因素, 確定性模擬測試
- 靜態輸入語言
- 類比於圖案, 文件模型中的模式靈活性
- 統計和數字演算法, 資料框、矩陣與陣列
- StatsD (metrics aggregator), 直接從生產者傳遞給消費者
- 股票市場飼料, 直接從生產者傳遞給消費者
- 爆彼之頭, 領導者故障:故障轉移
- 問題, 隔離殭屍程序和延遲請求
- 停止所有處理(見 garbage collection)
- 儲存
- 構建資料儲存技術, 組合使用資料儲存技術-分拆系統與整合系統
- 儲存區網路, 共享記憶體、共享磁碟與無共享架構, 分散式檔案系統
- 儲存引擎, 儲存與檢索-總結
- 儲存程式, 將事務封裝在儲存過程中-儲存過程的利弊, 術語表
- 和共享日誌, 使用共享日誌
- 利弊因素, 儲存過程的利弊
- 類似於流處理器, 應用程式碼作為派生函式
- 風暴(流處理器), 流分析
- distributed RPC, 事件驅動架構與 RPC, 多分割槽資料處理
- 三叉戟狀態處理, 冪等性
- 斜拉機事件, 處理滯留事件
- Stream Control Transmission Protocol (SCTP), TCP 的侷限性
- 流處理, 流處理-本章小結, 術語表
- 在工作範圍內獲得外部服務, 流表連線(流擴充), 微批次與存檔點, 冪等性, 恰好執行一次操作
- 與批次處理相結合, 統一批處理和流處理
- 與批次處理的比較, 流處理
- 複合事件處理, 複合事件處理
- 過失容忍, 容錯-失敗後重建狀態
- 資料整合, 批處理與流處理-統一批處理和流處理
- 用於事件原始碼, 事件溯源與 CQRS
- 保持衍生狀態, 維護派生狀態
- 維持實際意見, 維護物化檢視
- messaging systems(見 messaging systems)
- 關於時間的推理, 時間推理-視窗的型別
- relation to databases(見 streams)
- 與服務的關係, 流處理器和服務
- 與批次處理的關係, 批處理
- 在流中搜索, 在流上搜索
- 單條執行, 日誌與傳統的訊息傳遞相比, 併發控制
- 流式分析, 流分析
- 串流連線, 流連線-連線的時間依賴性
- 串流流連線, 流流連線(視窗連線)
- 序列表連線, 流表連線(流擴充)
- 表格連線, 表表連線(維護物化檢視)
- 時間的依賴性, 連線的時間依賴性
- 流程, 流處理-重播舊訊息
- 端對端,向客戶推進事件, 端到端的事件流
- messaging systems(見 messaging systems)
- processing(見 流處理)
- 與資料庫的關係, 資料庫與流-不變性的侷限性
- (另見 changelogs)
- 變更流的 API 支援, 變更流的 API 支援
- 資料變更捕獲, 資料變更捕獲-變更流的 API 支援
- 按時間分列的狀態衍生物, 狀態、流和不變性
- 事件溯源, 資料變更捕獲與事件溯源
- 保持系統同步, 保持系統同步-保持系統同步
- 不可改變事件哲學, 狀態、流和不變性-不變性的侷限性
- 專題, 傳遞事件流
- 嚴格的序列性, 什麼使系統具有線性一致性?
- 及時性與完整性, 及時性與完整性
- 條紋(列編碼), 列式儲存
- 強一致性(見 線性一致性)
- 最終的一致性, 自動衝突解決
- 強烈的單份序列性, 什麼使系統具有線性一致性?
- 主題、上游和物體(三層), 三元組儲存與 SPARQL
- 訂閱者, 傳遞事件流
- (另見 consumers)
- 超級計算機, 雲計算與超級計算
- Superset(資料視覺化軟體), 分析(Analytics)
- 監視, 監視
- (另見 隱私)
- 壽司原則, 從資料倉庫到資料湖
- 可持續性, 分散式與單節點系統
- Swagger(服務定義格式), Web 服務
- swapping to disk(見 virtual memory)
- Swift(程式語言)
- 記憶體管理, 限制垃圾回收的影響
- 同步引擎, 同步引擎與本地優先軟體-同步引擎的利弊
- 例項, 同步引擎的利弊
- 用於本地第一軟體, 即時協作、離線優先和本地優先應用
- 同步網路, 同步與非同步網路, 術語表
- 同步複製, 同步複製與非同步複製, 術語表
- 有多個領導, 多主複製
- 系統管理員, 雲時代的運維
- 系統模型, 知識、真相和謊言, 系統模型與現實-確定性模擬測試
- 假設, 信任但驗證
- 演算法的正確性, 定義演算法的正確性
- 繪製真實世界的地圖, 將系統模型對映到現實世界
- 安全和生活, 安全性與活性
- 記錄系統, 記錄系統與派生資料, 術語表
- 資料變更捕獲, 資料變更捕獲的實現, 理解資料流
- 事件日誌, 事件溯源與 CQRS
- 事件日誌處理為, 狀態、流和不變性
- 系統思維, 反饋迴路
T
- t- digest(演算法), 響應時間指標的應用
- 表格連線, 表表連線(維護物化檢視)
- Tableau(資料視覺化軟體), 事務處理與分析的特徵, 分析(Analytics)
- 尾巴 (Unix 工具), 使用日誌進行訊息儲存
- tail latency(見 延遲)
- 尾頂(財產圖), 屬性圖
- task (workflows)(見 workflow engines)
- TCP (Transmission Control Protocol), TCP 的侷限性
- 時間(工作流程引擎), 持久化執行與工作流
- Tensorflow (機器學習圖書館), 機器學習
- Teradata(資料庫), 雲原生系統架構, 雲資料倉庫
- term-partitioned indexes(見 global secondary indexes)
- 終止(協商一致), 單值共識, 原子提交作為共識
- 測試, 人類與可靠性
- 擊打(記憶體斷), 程序暫停
- 執行緒(併發)
- Actor 模型, 分散式 actor 框架, 事件驅動架構與 RPC
- (另見 event-driven architecture)
- 原子操作, 原子性
- 背景執行緒, 構建和合並 SSTable
- 執行暫停, 我們不能簡單地使網路延遲可預測嗎?, 程序暫停-程序暫停
- 記憶體障礙, 線性一致性與網路延遲
- 預設, 程序暫停
- single(見 single-threaded execution)
- Actor 模型, 分散式 actor 框架, 事件驅動架構與 RPC
- 三階段承諾, 三階段提交
- 三方關係, 屬性圖
- Thrift(資料格式), Protocol Buffers
- 吞吐量, 描述效能, 描述負載, 批處理
- TIBCO, 訊息代理
- Enterprise Message Service, 訊息代理與資料庫的對比
- StreamBase (stream analytics), 複合事件處理
- TiDB(資料庫)
- 基於共識的複製, 單主複製
- 區域(硬化), 分片
- 請求路由, 請求路由
- 服務衍生資料, 對外提供派生資料
- 硬化二級指數, 全域性二級索引
- 快速隔離支援, 快照隔離與可重複讀
- 時間戳, 實現線性一致的 ID 生成器
- 事務, 事務到底是什麼?, 資料庫內部的分散式事務
- 使用模型檢查, 模型檢查與規範語言
- 分層儲存, 設定新的副本, 磁碟空間使用
- TigerBeetle(資料庫), 總結
- 確定性模擬測試, 確定性模擬測試
- TigerGraph(資料庫)
- GSQL language, SQL 中的圖查詢
- Tigris(物件儲存), 分散式檔案系統
- TileDB(資料庫), 資料框、矩陣與陣列
- 時間
- 時間序列資料
- 每日時鐘, 日曆時鐘
- 混合邏輯時鐘, 混合邏輯時鐘
- 及時性, 及時性與完整性
- 超時, 不可靠的網路, 術語表
- 動態配置, 網路擁塞和排隊
- 失敗, 領導者故障:故障轉移
- 長度, 超時和無界延遲
- TimescaleDB(資料庫), 列式儲存
- 時間戳, 邏輯時鐘
- 指定流處理中的事件, 你用的是誰的時鐘?
- 讀後寫入一致性, 讀己之寫
- 用於事務命令, 用於全域性快照的同步時鐘
- 執行制約因素不足, 使用邏輯時鐘強制約束
- 金鑰範圍, 按鍵的範圍分片
- 蘭波特, Lamport 時間戳
- 邏輯, 排序事件以捕獲因果關係
- 命令事件, 用於事件排序的時間戳
- 時間戳, 實現線性一致的 ID 生成器
- TLA+ (specification language), 模型檢查與規範語言
- 符號桶(限制重試), 描述效能
- 墓碑, 構建和合並 SSTable, 磁碟空間使用, 日誌壓縮
- 專題(資訊), 訊息代理, 傳遞事件流
- 撕裂的頁面(B- 樹), 使 B 樹可靠
- 全序, 術語表
- 追蹤, 分散式系統的問題
- 跟蹤行為資料, 隱私與追蹤
- (另見 隱私)
- 權衡, 資料系統架構中的權衡-資料系統、法律與社會
- transaction coordinator(見 協調者)
- transaction manager(見 協調者)
- 事務處理, 事務處理與分析的特徵-事務處理與分析的特徵
- 與分析的比較, 事務處理與分析的特徵
- 與資料儲存的比較, 分析型資料儲存
- 事務, 事務-總結, 術語表
- ACID properties of, ACID 的含義
- 資料完整性, 及時性與完整性
- 複製, 複製延遲的解決方案
- compensating(見 compensating transactions)
- 概念, 事務到底是什麼?
- 分散式事務, 分散式事務-再談恰好一次訊息處理
- 避開, 派生資料與分散式事務, 開展分拆工作, 強制約束-無協調資料系統
- 失敗放大, 維護派生狀態
- 已磨損的系統, 分片的利與弊
- 可疑/不確定狀況, 協調器故障, 存疑時持有鎖
- 兩階段提交, 兩階段提交(2PC)-三階段提交
- 使用, 跨不同系統的分散式事務-恰好一次訊息處理
- XA 事務, XA 事務-XA 事務的問題
- OLTP versus analytics queries, 分析(Analytics)
- 目標, 事務
- 可序列化, 可序列化-可序列化快照隔離的效能
- 實際執行, 實際序列執行-序列執行總結
- 悲觀與樂觀的併發控制, 悲觀併發控制與樂觀併發控制
- 可序列化快照隔離, 可序列化快照隔離(SSI)-可序列化快照隔離的效能
- 兩階段鎖定, 兩階段鎖定(2PL)-索引範圍鎖
- 單物件和多物件, 單物件與多物件操作-處理錯誤和中止
- 快照隔離(見 snapshots)
- 嚴格的序列性, 什麼使系統具有線性一致性?
- 薄弱的隔離水平, 弱隔離級別-物化衝突
- 曲線(圖), 屬性圖
- 三(資料結構), 構建和合並 SSTable, 全文檢索
- as SSTable index, SSTable 檔案格式
- 觸發器(資料庫), 傳遞事件流
- Trino(資料倉庫), 雲資料倉庫
- 聯邦資料庫, 一切的元資料庫
- 查詢最佳化器, 查詢語言
- 用於 ETL, 提取-轉換-載入(ETL)
- 工作流程示例, 工作流排程
- 三層, 三元組儲存與 SPARQL-SPARQL 查詢語言
- SPARQL 查詢語言, SPARQL 查詢語言
- 翻轉視窗(流處理), 視窗的型別
- (另見 windows)
- 在微戰鬥中, 微批次與存檔點
- Turbopuffer(種子搜尋) Name, 設定新的副本
- Turtle (RDF data format), 三元組儲存與 SPARQL
- Twitter(見 X (social network))
- 兩階段提交, 兩階段提交(2PC)-協調器故障, 術語表
- 與雙相鎖定混淆, 兩階段鎖定(2PL)
- 協調員失敗, 協調器故障
- 協調員恢復, 從協調器故障中恢復
- 如何運作, 系統性的承諾
- 績效成本, 跨不同系統的分散式事務
- problems with XA transactions, XA 事務的問題
- 持有鎖定的事務, 存疑時持有鎖
- 兩階段鎖定, 兩階段鎖定(2PL)-索引範圍鎖, 什麼使系統具有線性一致性?, 術語表
- 與兩階段提交混淆, 兩階段鎖定(2PL)
- 增長和縮小階段, 兩階段鎖定的實現
- 索引範圍鎖定, 索引範圍鎖
- 業績, 兩階段鎖定的效能
- 型別檢查,動態對靜態, 文件模型中的模式靈活性
U
- UDP (User Datagram Protocol)
- comparison to TCP, 網路擁塞和排隊
- 多廣播, 直接從生產者傳遞給消費者
- 終極線上(遊戲), 分片
- 未繫結的資料集, 流處理, 術語表
- (另見 streams)
- 無限制的延誤, 術語表
- 解析資料庫, 分拆資料庫-多分割槽資料處理
- 構建資料儲存技術, 組合使用資料儲存技術-分拆系統與整合系統
- 聯邦制與拆分制, 一切的元資料庫
- 圍繞資料流設計應用程式, 圍繞資料流設計應用-流處理器和服務
- 觀察匯出狀態, 觀察派生資料狀態-多分割槽資料處理
- 實現檢視和快取, 物化檢視和快取
- 多硬資料處理, 多分割槽資料處理
- 推動客戶端更改狀態, 將狀態變更推送給客戶端
- 構建資料儲存技術, 組合使用資料儲存技術-分拆系統與整合系統
- uncertain (transaction status)(見 存疑)
- 聯盟型別(在 Avro), 模式演化規則
- uniq(Unix 工具), 簡單日誌分析, 簡單日誌分析, 分散式作業編排
- 獨特性限制
- 同步檢查, 寬鬆地解釋約束
- 需要協商一致, 唯一性約束需要達成共識
- 需要線性, 約束與唯一性保證
- 以日誌為基礎的信件中的獨特性, 基於日誌訊息傳遞中的唯一性
- 團結(資料目錄), 雲資料倉庫
- universally unique identifiers(見 UUIDs)
- unix 哲學
- unix 管道, 簡單日誌分析
- 與分散式批次處理相比, 工作流排程
- UPDATE statement (SQL), 文件模型中的模式靈活性
- 更新
- 使用量
- 批次過程排程, 資源分配
- 透過預設增加, 故障處理
- 與暫時取捨, 我們不能簡單地使網路延遲可預測嗎?
- uTP protocol (BitTorrent), TCP 的侷限性
- UUIDs, ID 生成器和邏輯時鐘
V
- 有效性(協商一致), 單值共識, 原子提交作為共識
- vBuckets(硬化), 分片
- 向量時鐘, 版本向量
- (另見 版本向量)
- 和 Lamport/hybrid 邏輯鍾, Lamport/混合邏輯時鐘 vs. 向量時鐘
- 和版本向量, 版本向量
- 向量嵌入, 向量嵌入
- 向量處理, 查詢執行:編譯與向量化
- 供應商鎖定, 雲服務的利弊
- Venice(資料庫), 對外提供派生資料
- 核查, 信任但驗證-用於可審計資料系統的工具
- 避免盲目信任, 不要盲目信任承諾
- 設計可審計性, 為可審計性而設計
- 端對端完整性檢查, 端到端原則重現
- 可審計資料系統工具, 用於可審計資料系統的工具
- 版本控制系統
- 版本向量, 不同拓撲的問題, 版本向量
- Vertica(資料庫), 雲資料倉庫
- 處理寫入, 寫入列式儲存
- vertical scaling(見 scaling up)
- 頂點(圖), 圖資料模型
- 屬性圖模型, 屬性圖
- 電子遊戲, 同步引擎的利弊
- 影片轉碼(例如), 跨通道時序依賴
- views (SQL queries), Datalog:遞迴關係查詢
- materialized views(見 物化)
- 檢視戳複製, 共識, 共識的實踐
- 虛擬塊裝置, 儲存與計算的分離
- 虛擬檔案系統, 分散式檔案系統
- 比較分散式檔案系統, 分散式檔案系統
- 虛擬機器, 雲服務的分層
- 虛擬記憶體
- Virtuoso(資料庫), SPARQL 查詢語言
- VisiCalc (spreadsheets), 圍繞資料流設計應用
- Vitess(資料庫)
- 鍵程硬化, 按鍵的範圍分片
- 節點(硬化), 分片
- 詞彙, 三元組儲存與 SPARQL
- Voice over IP (VoIP), 網路擁塞和排隊
- VoltDB(資料庫)
W
- 預寫式日誌, 使 B 樹可靠
- WAL-G (backup tool), 設定新的副本
- WarpStream(訊息系統), 磁碟空間使用
- web services(見 services)
- 網路使用者, 直接從生產者傳遞給消費者
- 網路方法(通訊), 訊息代理
- WebSocket (protocol), 將狀態變更推送給客戶端
- 寬柱資料模型, 讀寫的資料區域性
- 相對於面向列的儲存, 列壓縮
- 視窗(流程處理), 流分析, 時間推理-視窗的型別
- 更改日誌的無限視窗, 維護物化檢視, 流表連線(流擴充)
- 知道所有事件何時到來, 處理滯留事件
- 串流在視窗內連線, 流流連線(視窗連線)
- 視窗型別, 視窗的型別
- WITH RECURSIVE syntax (SQL), SQL 中的圖查詢
- Word2Vec (language model), 向量嵌入
- 工作流程引擎, 持久化執行與工作流
- Airflow(見 Airflow(工作流排程器))
- 批處理, 工作流排程
- Camunda(見 Camunda (workflow engine))
- Dagster(見 Dagster(工作流排程器))
- 持久執行, 持久化執行與工作流
- 提取-轉換-載入(ETL)(見 ETL)
- 執行器, 持久化執行與工作流
- 樂團, 持久化執行與工作流, 批處理
- Orkes(見 Orkes (workflow engine))
- Prefect(見 Prefect(工作流排程器))
- 依賴決定性因素, 確定性模擬測試
- Restate(見 Restate (workflow engine))
- Temporal(見 Temporal (workflow engine))
- 工作設定, 排序與記憶體聚合
- 寫入放大, 寫放大
- 寫路徑, 觀察派生資料狀態
- 寫偏差, 寫偏差與幻讀-物化衝突
- 預寫式日誌, 使 B 樹可靠, 預寫日誌(WAL)傳輸
- 持久執行, 持久化執行
- 寫入(資料庫)
- 原子寫入操作, 原子寫操作
- 檢測影響前讀的寫入, 檢測影響先前讀取的寫入
- 防止汙穢的寫作,, 沒有髒寫
- WS-* framework, 遠端過程呼叫(RPC)的問題
- WS-AtomicTransaction (2PC), 兩階段提交(2PC)
X
- X (社會網路)
- 建造住房時間表(例如), 案例研究:社交網路首頁時間線, 從同一事件日誌中派生多個檢視, 表表連線(維護物化檢視), 物化檢視和快取
- 加入費用, 社交網路案例研究中的反正規化
- 描述負載, 描述負載
- 過失容忍, 容錯
- 業績計量, 描述效能
- DistributedLog (event log), 使用日誌進行訊息儲存
- Snowflake (ID generator), ID 生成器和邏輯時鐘
- 建造住房時間表(例如), 案例研究:社交網路首頁時間線, 從同一事件日誌中派生多個檢視, 表表連線(維護物化檢視), 物化檢視和快取
- XA 事務, 兩階段提交(2PC), XA 事務-XA 事務的問題
- xargs (Unix 工具) (英語)., 簡單日誌分析
- XFS (file system), 分散式檔案系統
- XGBoost (machine learning library), 機器學習
- XML
- 二進位制變體, 二進位制編碼
- 資料位置, 讀寫的資料區域性
- encoding RDF data, RDF 資料模型
- 應用資料的問題, JSON、XML 及其二進位制變體
- 關係資料庫, 文件模型中的模式靈活性
- XML databases, 關係模型與文件模型, 文件的查詢語言
- Xorq(查詢引擎), 一切的元資料庫
- XPath, 文件的查詢語言
- XQuery, 文件的查詢語言
Y
- 亞虎
- 響應時間研究, 平均值、中位數與百分位點
- YARN (job scheduler), 分散式作業編排, 應用程式碼和狀態的分離
- ApplicationMaster, 分散式作業編排
- Yjs (CRDT library), 同步引擎的利弊
- YugabyteDB(資料庫)
- 雜湊變硬, 按雜湊範圍分片
- 鍵程硬化, 按鍵的範圍分片
- 多領導複製, 跨地域執行
- 請求路由, 請求路由
- 硬化二級指數, 全域性二級索引
- 平板(硬化), 分片
- 事務, 事務到底是什麼?, 資料庫內部的分散式事務
- 使用時鐘同步, 用於全域性快照的同步時鐘
Z
- Zab(協商一致演算法), 共識, 共識的實踐
- use in ZooKeeper, 實現線性一致性系統
- 零複製, 編碼資料的格式
- zero-disk architecture (ZDA), 設定新的副本
- ZeroMQ (messaging library), 直接從生產者傳遞給消費者
- 殭屍(分裂的大腦), 隔離殭屍程序和延遲請求
- zones (cloud computing)(見 availability zones)
- ZooKeeper (coordination service), 協調服務-服務發現
- 生成柵欄標誌, 隔離殭屍程序和延遲請求, 使用共享日誌, 協調服務
- 線性操作, 實現線性一致性系統
- 鎖和領袖選舉, 鎖定與領導者選舉
- 觀察員, 服務發現
- 用於服務發現, 負載均衡器、服務發現和服務網格, 服務發現
- 用於硬性轉讓, 請求路由
- 使用 Zab 演算法, 共識
最後更新於