索引

3FS（分散式檔案系統）, 分散式檔案系統

中止（事務）, 事務, 原子性
- 級聯, 沒有髒讀
- 在兩階段提交中, 兩階段提交（2PC）
- 樂觀併發控制的效能, 可序列化快照隔離的效能
- 重試已中止的事務, 處理錯誤和中止
抽象, 雲服務的分層, 簡單性：管理複雜度, 資料模型與查詢語言, 事務, 總結
意外複雜性, 簡單性：管理複雜度
問責制, 責任與問責
會計（財務資料）, 總結, 不可變事件的優點
Accumulo（資料庫）
- 寬柱資料模型, 讀寫的資料區域性, 列壓縮
ACID 屬性（事務）, ACID 的含義
- 原子性, 原子性, 單物件與多物件操作
- 一致性, 一致性, 維護完整性，儘管軟體有Bug
- 永續性, 使 B 樹可靠, 永續性
- 隔離性, 隔離性, 單物件與多物件操作
確認（訊息）, 確認與重新傳遞
active/active replication（見 multi-leader replication）
active/passive replication（見基於領導者的複製）
ActiveMQ（訊息系統）, 訊息代理, 訊息代理與資料庫的對比
- 分散式事務支援, XA 事務
ActiveRecord（物件關係對映器）, 物件關係對映（ORM）, 處理錯誤和中止
activity (workflows)（見 workflow engines）
Actor 模型, 分散式 actor 框架
- （另見 event-driven architecture）
- 與流處理的比較, 事件驅動架構與 RPC
自適應容量, 偏斜的工作負載與緩解熱點
Advanced Message Queuing Protocol（見 AMQP）
航空航天系統, 拜占庭故障
Aerospike（資料庫）
- 強一致性模式, 單物件寫入
AGE（圖資料庫）, Cypher 查詢語言
彙總
- 資料立方體和已實現檢視, 物化檢視與資料立方體
- 分批處理, 排序與記憶體聚合
- 流程中, 流分析
聚合管道（MongoDB）, 正規化、反正規化與連線, 文件的查詢語言
敏捷, 可演化性：讓變化更容易
- 最小化不可逆性, 批處理, 應用演化後重新處理資料
- 充滿自信地快速前進, 端到端原則重現
一致意見, 單值共識, 原子提交作為共識
- （另見共識）
AI (artificial intelligence)（見 machine learning）
AI Act (European Union), 資料系統、法律與社會
Airbyte, 資料倉庫
Airflow（工作流排程器）, 持久化執行與工作流, 批處理, 工作流排程
- 雲資料倉整合, 查詢語言
- 用於 ETL, 提取-轉換-載入（ETL）
阿卡邁
- 響應時間研究, 平均值、中位數與百分位點
演算法
- 演算法正確性, 定義演算法的正確性
- B樹, B 樹-B 樹變體
- 分散式系統, 系統模型與現實
- 歸併排序, 構建和合並 SSTable, 混洗資料
- 排程, 資源分配
- SSTable 與 LSM 樹, SSTable 檔案格式-壓實策略
全互聯複製拓撲, 多主複製拓撲
AllegroGraph（資料庫）, 圖資料模型
- SPARQL 查詢語言, SPARQL 查詢語言
ALTER TABLE 語句（SQL）, 文件模型中的模式靈活性, 編碼與演化
亞馬遜
- Dynamo（見 Dynamo（資料庫））
- 響應時間研究, 平均值、中位數與百分位點
Amazon Web Services (AWS)
- Aurora（見 Aurora（雲資料庫））
- ClockBound（見 ClockBound（時間同步））
- 正確性測試, 形式化方法和隨機測試
- DynamoDB（見 DynamoDB（資料庫））
- EBS（見 EBS（虛擬塊裝置））
- Kinesis（見 Kinesis（訊息系統））
- Neptune（見 Neptune（圖資料庫））
- 網路可靠性, 實踐中的網路故障
- S3（見 S3（物件儲存））
放大
- 偏見, 偏見與歧視
- 故障, 維護派生狀態
- 尾延遲, 響應時間指標的應用, 本地二級索引
- 寫入放大, 寫放大
AMQP（高階訊息佇列協議）, 訊息代理與資料庫的對比
- （另見 messaging systems）
- 比較基於日誌的郵件, 日誌與傳統的訊息傳遞相比, 重播舊訊息
- 訊息順序, 確認與重新傳遞
分析系統, 分析型與事務型系統
- 作為衍生資料系統, 記錄系統與派生資料
- 來自運營系統的 ETL, 資料倉庫
- 治理, 超越資料湖
分析, 分析型與事務型系統-記錄系統與派生資料
- 與事務處理的比較, 事務處理與分析的特徵
- 資料正常化, 正規化的權衡
- data warehousing（見 data warehousing）
- predictive（見 predictive analytics）
- 與批次處理的關係, 分析（Analytics）-分析（Analytics）
- 計劃, 星型與雪花型：分析模式-星型與雪花型：分析模式
- 快速隔離查詢, 快照隔離與可重複讀
- 流式分析, 流分析
分析工程, 分析型與事務型系統
反熵, 追趕錯過的寫入
Antithesis（確定性模擬測試）, 確定性模擬測試
Apache Accumulo（見 Accumulo）
Apache ActiveMQ（見 ActiveMQ）
Apache AGE（見 AGE）
Apache Arrow（見 Arrow（資料格式））
Apache Avro（見 Avro）
Apache Beam（見 Beam）
Apache BookKeeper（見 BookKeeper）
Apache Cassandra（見 Cassandra）
Apache Curator（見 Curator）
Apache DataFusion（見 DataFusion（查詢引擎））
Apache Druid（見 Druid（資料庫））
Apache Flink（見 Flink（處理框架））
Apache HBase（見 HBase）
Apache Iceberg（見 Iceberg（表格式））
Apache Jena（見 Jena）
Apache Kafka（見 Kafka）
Apache Lucene（見 Lucene）
Apache Oozie（見 Oozie（工作流排程器））
Apache ORC（見 ORC（資料格式））
Apache Parquet（見 Parquet（資料格式））
Apache Pig（查詢語言）, 查詢語言
Apache Pinot（見 Pinot（資料庫））
Apache Pulsar（見 Pulsar）
Apache Qpid（見 Qpid）
Apache Samza（見 Samza）
Apache Solr（見 Solr）
Apache Spark（見 Spark；見 Spark（處理框架））
Apache Storm（見 Storm）
Apache Superset（見 Superset（資料視覺化軟體））
Apache Thrift（見 Thrift）
Apache ZooKeeper（見 ZooKeeper）
Apama （流式分析）, 複合事件處理
append-only files（見 logs）
Application Programming Interfaces (APIs), 資料模型與查詢語言
- 用於改變流, 變更流的 API 支援
- 分散式事務, XA 事務
- 服務費用, 流經服務的資料流：REST 與 RPC-RPC 的資料編碼與演化
  - （另見 services）
  - 可演化性, RPC 的資料編碼與演化
  - RESTful, Web 服務
application state（見國家）
approximate search（見 similarity search）
檔案儲存、資料庫資料, 歸檔儲存
arcs（見 edges）
ArcticDB（資料庫）, 資料框、矩陣與陣列
算術平均值, 平均值、中位數與百分位點
陣列
- 陣列資料庫, 資料框、矩陣與陣列
- 多層面, 資料框、矩陣與陣列
Arrow（資料格式）, 列式儲存, DataFrames
artificial intelligence（見 machine learning）
ASCII text, Protocol Buffers
ASN.1 (schema language), 模式的優點
關聯表格, 多對一與多對多關係, 屬性圖
同步網路, 不可靠的網路, 術語表
- 比較同步網路, 同步與非同步網路
- 系統模型, 系統模型與現實
同步複製, 同步複製與非同步複製, 術語表
- 故障資料損失, 領導者故障：故障轉移
- 從同步跟蹤器讀取, 複製延遲的問題
- 有多個領導, 多主複製
非同步傳輸模式, 我們不能簡單地使網路延遲可預測嗎？
原子廣播, 共享日誌作為共識
原子鐘, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
- （另見 clocks）
原子性, 術語表
- 原子自增, 單物件寫入
- 比較和設定, 條件寫入（比較並設定）, 什麼使系統具有線性一致性？
  - （另見比較和設定）
- 異常資料, 正規化的權衡
- 獲取和新增/遞增, ID 生成器和邏輯時鐘, 共識, 獲取並增加作為共識
- 寫入操作, 原子寫操作
原子性, 原子性, 單物件與多物件操作, 術語表
- 原子提交
  - 避開, 多分割槽請求處理, 無協調資料系統
  - 遮蔽和非遮蔽, 三階段提交
  - 在溪流處理中, 恰好一次訊息處理, 再談恰好一次訊息處理, 原子提交再現
  - 維護衍生資料, 保持系統同步
- 分散式事務, 分散式事務-再談恰好一次訊息處理
- 用於多物件事務, 單物件與多物件操作
- 用於單物件寫入, 單物件寫入
- 與協商一致的關係, 原子提交作為共識
可審計性, 信任但驗證-用於可審計資料系統的工具
- 設計, 為可審計性而設計
- 自動審計系統, 不要盲目信任承諾
- 透過不可改變性, 不可變事件的優點
- 可審計資料系統工具, 用於可審計資料系統的工具
Aurora（雲資料庫）, 雲原生系統架構
Aurora DSQL（資料庫）
- 快速隔離支援, 快照隔離與可重複讀
自動縮放, 運維：自動/手動再平衡
Automerge (CRDT library), 同步引擎的利弊
可用性, 可靠性與容錯
- （另見 fault tolerance）
- 在 CAP 定理中, CAP 定理
- 領袖選舉, 共識的微妙之處
- 在服務級別協議（SLA）中, 響應時間指標的應用
可用區, 透過冗餘容忍硬體故障, 讀己之寫
Avro（資料格式）, Avro-動態生成的模式
- 動態生成的計劃, 動態生成的模式
- 物件容器檔案, 但什麼是寫入者模式？, 歸檔儲存
- 讀者決定作家的計劃, 但什麼是寫入者模式？
- 計劃演變, 寫入者模式與讀取者模式
- 批次處理中的用途, MapReduce
awk （Unix 工具）（英語）., 簡單日誌分析, 簡單日誌分析, 分散式作業編排
Axon Framework, 事件溯源與 CQRS
Azkaban（工作流排程器）, 批處理
Azure Blob Storage（物件儲存）, 雲服務的分層, 設定新的副本
- 有條件的標題, 隔離殭屍程序和延遲請求
Azure managed disks, 儲存與計算的分離
Azure SQL DB（資料庫）, 雲原生系統架構
Azure Storage, 物件儲存
Azure Synapse Analytics（資料庫）, 雲原生系統架構
Azure Virtual Machines
- 現場虛擬機器, 故障處理

臉書
- 費斯（媒介指數）, 向量嵌入
- 反應（使用者介面庫）, 端到端的事件流
- 社會圖表, 圖資料模型
事實
- 事實表（星圖）, 星型與雪花型：分析模式
- 在資料日誌中, Datalog：遞迴關係查詢
- 如果來源, 事件溯源與 CQRS
慢故障, 系統模型與現實
失敗停止模式, 系統模型與現實
故障切換, 領導者故障：故障轉移, 術語表
- （另見基於領導者的複製）
- 無領導複製,沒有, 當節點故障時寫入資料庫
- 領袖選舉, 分散式鎖和租約, 共識, 從單主複製到共識
- 潛在問題, 領導者故障：故障轉移
失敗
- 透過經銷事務擴充, 維護派生狀態
- 檢測失敗, 檢測故障
  - 自動再平衡導致連鎖故障, 運維：自動/手動再平衡
  - 超時和無限制延誤, 超時和無界延遲, 網路擁塞和排隊
  - 使用協調服務, 協調服務
- 錯對錯, 可靠性與容錯
- 部分失敗, 故障與部分失效, 總結
費斯（媒介指數）, 向量嵌入
假陽性（Bloom 過濾器）, 布隆過濾器
扇出, 時間線的物化與更新, 多個消費者
斷層注射, 容錯, 實踐中的網路故障, 故障注入
斷層隔離, 面向多租戶的分片
過失容忍, 可靠性與容錯-人類與可靠性, 術語表
- 協商一致的形式化, 單值共識
- 容忍人為失誤, 批處理
- 分批處理, 故障處理
- 在基於日誌的系統中, 在資料系統中應用端到端思考, 及時性與完整性-資料流系統的正確性
- 在溪流處理中, 容錯-失敗後重建狀態
  - 原子提交, 原子提交再現
  - 冪等性, 冪等性
  - 保持衍生狀態, 維護派生狀態
  - 微打鬥和檢查站, 微批次與存檔點
  - 失敗後重建狀態, 失敗後重建狀態
- 分散式事務, XA 事務-再談恰好一次訊息處理
- 基於領導和無領導者的複製, 單主與無主複製的效能
- 事務原子性, 原子性, 分散式事務-恰好一次訊息處理
錯誤
- 拜占庭斷層, 拜占庭故障-弱形式的謊言
- 失敗與, 可靠性與容錯
- 事務處理, 事務
- 超級計算機和雲計算處理, 雲計算與超級計算
- 硬體, 硬體與軟體故障
- 在分散式系統中, 故障與部分失效
- introducing deliberately（見 fault injection）
- 網路斷層, 實踐中的網路故障-檢測故障
  - 非對稱斷層, 多數派原則
  - 檢測, 檢測故障
  - 容忍,多領導複製, 跨地域執行
- 軟體故障, 軟體故障
- tolerating（見 fault tolerance）
特性工程（機器學習）, 從資料倉庫到資料湖
聯邦資料庫, 一切的元資料庫
Feldera（資料庫）
- 增量檢視維護, 維護物化檢視
圍欄, 線性一致性與網路延遲
屏障, 領導者故障：故障轉移, 隔離殭屍程序和延遲請求-多副本隔離
- 生成柵欄標誌, 使用共享日誌, 協調服務
- 柵欄標誌的屬性, 定義演算法的正確性
- 流處理器寫入資料庫, 冪等性, 恰好執行一次操作
獲取和新增
- 與協商一致的關係, 獲取並增加作為共識
纖維通道（網路）, 分散式檔案系統
欄位標記（協議緩衝）, Protocol Buffers-欄位標籤與模式演化
Figma （圖形軟體）, 即時協作、離線優先和本地優先應用
filesystem in userspace (FUSE), 設定新的副本, 分散式檔案系統
- 在物件儲存中, 物件儲存
財務資料
- 會計分類賬, 總結
- 不可改變性, 不可變事件的優點
- 時間序列資料, 資料框、矩陣與陣列
五特蘭, 資料倉庫
FizzBee (specification language), 模型檢查與規範語言
平面指數（媒介指數）, 向量嵌入
FlatBuffers（資料格式）, 編碼資料的格式
Flink（處理框架）, 批處理, 資料流引擎
- 成本效率, 查詢語言
- DataFrames, 資料框、矩陣與陣列, DataFrames
- 過失容忍, 故障處理, 微批次與存檔點, 失敗後重建狀態
- FlinkML, 機器學習
- 資料倉庫, 雲資料倉庫
- high availability using ZooKeeper, 協調服務
- 整合批次和流處理, 統一批處理和流處理
- 查詢最佳化器, 查詢語言
- 移動資料, 混洗資料
- 流處理, 流分析
- streaming SQL support, 複合事件處理
流量控制, TCP 的侷限性, 訊息傳遞系統, 術語表
FLP result (on consensus), 共識
Flyte（工作流排程器）, 機器學習
追隨者, 單主複製, 術語表
- （另見基於領導者的複製）
正式方法, 形式化方法和隨機測試-確定性模擬測試
轉發相容性, 編碼與演化
前進衰變（演算法）, 響應時間指標的應用
化石（版本控制系統）, 併發控制
- 避免, 不變性的侷限性
FoundationDB（資料庫）
- 一致性模式, 什麼使系統具有線性一致性？
- 確定性模擬測試, 確定性模擬測試
- 鍵程硬化, 按鍵的範圍分片
- 程序/核心模式, 分片的利與弊
- 可序列事務, 可序列化快照隔離（SSI）, 可序列化快照隔離的效能
- 事務, 事務到底是什麼？, 資料庫內部的分散式事務
分數索引, 何時使用哪種模型
碎裂（B樹）, 磁碟空間使用
框架（計算機圖形）, 同步引擎的利弊
前端（網頁開發）, 資料系統架構中的權衡
FrostDB（資料庫）
- 確定性模擬測試（DST）, 確定性模擬測試
fsync （系統呼叫）, 使 B 樹可靠, 永續性
全文檢索, 全文檢索, 術語表
- 和模糊的指數, 全文檢索
- Lucene 儲存引擎, 全文檢索
- 硬化指數, 分片與二級索引
Function as a Service (FaaS), 微服務與無伺服器
職能方案擬訂
- inspiration for MapReduce, MapReduce
職能要求, 定義非功能性需求
FUSE（見 filesystem in userspace (FUSE)）
模糊, 形式化方法和隨機測試
fuzzy search（見 similarity search）

Gallina（特寫語言）, 模型檢查與規範語言
遊戲開發, 同步引擎的利弊
垃圾收集
- 不可改變性和, 不變性的侷限性
- 程序暫停, 延遲與響應時間, 程序暫停-限制垃圾回收的影響, 多數派原則
  - （另見 process pauses）
加油站演算法定價, 反饋迴路
GDPR (regulation), 資料系統、法律與社會, 不變性的侷限性
- 同意書, 同意與選擇自由
- 資料最小化, 立法與自律
- 合法權益, 同意與選擇自由
- 使用權, 面向多租戶的分片
- 清除的權利, 資料系統、法律與社會, 磁碟空間使用, 面向多租戶的分片
GenBank (genome database), 總結
General Data Protection Regulation（見 GDPR (regulation)）
基因組分析, 總結
geographic distribution（見 regions (geographic distribution)）
地理空間指數, 多維索引與全文索引
Git（版本控制系統）, 併發控制
- 本地第一軟體, 即時協作、離線優先和本地優先應用
- 合併衝突, 手動衝突解決
GitHub, postmortems, 領導者故障：故障轉移, 領導者故障：故障轉移, 將系統模型對映到現實世界
全球二級指數, 全域性二級索引, 總結
globally unique identifiers（見 UUIDs）
GlusterFS（分散式檔案系統）, 批處理, 分散式檔案系統, 物件儲存
GNU Coreutils (Linux), 排序與記憶體聚合
Go（程式語言）
- 垃圾收集, 限制垃圾回收的影響
GoldenGate (change data capture), 資料變更捕獲的實現
- （另見 Oracle）
谷歌
- BigQuery（見 BigQuery（資料庫））
- Bigtable（見 Bigtable（資料庫））
- Chubby（鎖服務）, 協調服務
- Cloud Storage（物件儲存）, 設定新的副本, 物件儲存
  - 請求先決條件, 隔離殭屍程序和延遲請求
- Compute Engine
  - 預設例項, 故障處理
- 資料流（流程處理）
  - 資料倉整合, 雲資料倉庫
  - 移動資料, 混洗資料
- 資料流（流處理器）, 流分析, 原子提交再現, 統一批處理和流處理
  - （另見 Beam）
- 資料流（變化資料捕獲）, 變更流的 API 支援
- Docs（協作編輯）, 即時協作、離線優先和本地優先應用, CRDT 與操作變換
  - 操作轉換, CRDT 與操作變換
- Dremel（查詢引擎）, 列式儲存
- Firestore（資料庫）, 同步引擎的利弊
- MapReduce (batch processing), 批處理
  - （另見 MapReduce）
- Percolator（事務系統）, 實現線性一致的 ID 生成器
- 永續性磁碟（雲服務）, 儲存與計算的分離
- Pub/Sub（訊息系統）, 訊息代理, 訊息代理與資料庫的對比, 使用日誌進行訊息儲存
- 響應時間研究, 平均值、中位數與百分位點
- 工作表（協作電子表格）, 即時協作、離線優先和本地優先應用, CRDT 與操作變換
- Spanner（見 Spanner（資料庫））
- TrueTime (clock API), 帶置信區間的時鐘讀數
流言協議, 請求路由
治理, 超越資料湖
政府對資料的使用, 資料作為資產與權力
GPS (Global Positioning System)
- 用於時鐘同步, 不可靠的時鐘, 時鐘同步和準確性, 帶置信區間的時鐘讀數, 用於全域性快照的同步時鐘
GPT (language model), 向量嵌入
GPU (graphics processing unit), 雲服務的分層, 分散式與單節點系統
gradual rollout（見 rolling upgrades）
GraphQL（查詢語言）, GraphQL
- 驗證, 儲存過程的利弊
圖表, 術語表
- 作為資料模型, 圖資料模型-GraphQL
  - 屬性圖, 屬性圖
  - RDF and triple-stores, 三元組儲存與 SPARQL-SPARQL 查詢語言
- DAGs（見 directed acyclic graphs）
- 處理和分析, 機器學習
- 查詢語言
  - 密碼, Cypher 查詢語言
  - 資料日誌, Datalog：遞迴關係查詢-Datalog：遞迴關係查詢
  - GraphQL, GraphQL
  - 格倫林, 圖資料模型
  - recursive SQL queries, SQL 中的圖查詢
  - SPARQL, SPARQL 查詢語言-SPARQL 查詢語言
- 轉彎, 屬性圖
灰色失敗, 系統模型與現實
- 無領導複製, 單主與無主複製的效能
格勒姆林（圖形查詢語言）, 圖資料模型
grep （Unix 工具）（英語）., 簡單日誌分析
gRPC (service calls), 微服務與無伺服器, Web 服務
- 前向和後向相容性, RPC 的資料編碼與演化
GUIDs（見 UUIDs）

Hadoop（資料基礎設施）
- 比較分散式資料庫, 批處理
- MapReduce（見 MapReduce）
- NodeManager, 分散式作業編排
- YARN（見 YARN (job scheduler)）
HANA（見 SAP HANA（資料庫））
發生關係前, “先發生"關係與併發
硬碟
- 訪問模式, 順序與隨機寫入
- 偵查腐敗, 端到端原則, 不要盲目信任承諾
- 錯誤在, 硬體與軟體故障, 永續性
- 順序對隨機寫入, 順序與隨機寫入
- 連續寫入吞吐量, 磁碟空間使用
硬體故障, 硬體與軟體故障
雜湊函式
- 在 Bloom 過濾器中, 布隆過濾器
加入雜湊
- 在溪流處理中, 流表連線（流擴充）
雜湊變硬, 按鍵的雜湊分片-一致性雜湊, 總結
- 連續的雜湊, 一致性雜湊
- Hash mod N的問題, 雜湊取模節點數
- 區域查詢, 按雜湊範圍分片
- 合適的雜湊函式, 按鍵的雜湊分片
- 有固定的硬塊數, 固定數量的分片
散列表格, 日誌結構儲存
Hazelcast（模擬資料網）
- FencedLock, 隔離殭屍程序和延遲請求
- Flake ID Generator, ID 生成器和邏輯時鐘
HBase（資料庫）
- 由於缺乏圍欄而出現錯誤, 分散式鎖和租約
- 鍵程硬化, 按鍵的範圍分片
- 日誌結構儲存, 構建和合並 SSTable
- 區域（硬化）, 分片
- 請求路由, 請求路由
- 大小級緊湊, 壓實策略
- 寬柱資料模型, 讀寫的資料區域性, 列壓縮
HDFS (Hadoop Distributed File System), 批處理, 分散式檔案系統
- （另見 distributed filesystems）
- 檢查資料完整性, 不要盲目信任承諾
- DataNode, 分散式檔案系統
- NameNode, 分散式檔案系統
- use in MapReduce, MapReduce
- 工作流程示例, 工作流排程
HdrHistogram (numerical library), 響應時間指標的應用
頭（Unix 工具）, 簡單日誌分析, 分散式作業編排
頭頂（財產圖）, 屬性圖
頭部阻塞, 延遲與響應時間
堆積檔案（資料庫）, 在索引中儲存值
- 多轉換併發控制, 多版本併發控制（MVCC）
熱量管理, 偏斜的工作負載與緩解熱點
被套期請求, 單主與無主複製的效能
分散事務, 跨不同系統的分散式事務, XA 事務的問題
啟發式決策, 從協調器故障中恢復
十六進位制（註解本）, 機器學習
六邊形
- 地理空間索引, 多維索引與全文索引
Hibernate（物件關係對映器）, 物件關係對映（ORM）
層次模型, 關係模型與文件模型
可導航的小世界（媒介指數）, 向量嵌入
hierarchical queries（見 recursive common table expressions）
high availability（見 fault tolerance）
高頻事務, 時鐘同步和準確性
high-performance computing (HPC), 雲計算與超級計算
提示移交, 追趕錯過的寫入
直方圖, 響應時間指標的應用
蜂窩（資料倉）, 雲資料倉庫
- 查詢最佳化器, 查詢語言
HNSW (vector index), 向量嵌入
購物視窗（流程處理）, 視窗的型別
- （另見 windows）
Hoptimator（查詢引擎）, 一切的元資料庫
地平線醜聞, 人類與可靠性
- 缺乏事務, 事務
horizontal scaling（見 scaling out）
- 透過磨損, 分片的利與弊
HornetQ（訊息系統）, 訊息代理, 訊息代理與資料庫的對比
- 分散式事務支援, XA 事務
熱鍵, 鍵值資料的分片
熱點, 鍵值資料的分片
- 由於名人, 偏斜的工作負載與緩解熱點
- 時間序列資料, 按鍵的範圍分片
- 解除武裝, 偏斜的工作負載與緩解熱點
hot standbys（見基於領導者的複製）
HTAP（見 hybrid transactional/analytic processing）
HTTP, use in APIs（見 services）
人類錯誤, 人類與可靠性, 實踐中的網路故障, 批處理
混合邏輯時鐘, 混合邏輯時鐘
混合事務/分析處理, 資料倉庫, 分析型資料儲存
hydrating IDs (join), 社交網路案例研究中的反正規化
高頻圖, 屬性圖
HyperLogLog (algorithm), 流分析

N+1 query problem, 物件關係對映（ORM）
奈米msg（資訊庫）, 直接從生產者傳遞給消費者
Narayana（事務協調員）, 兩階段提交（2PC）
NATS（訊息系統）, 訊息代理
自然語言處理, 從資料倉庫到資料湖
Neo4j（資料庫）
- Cypher 查詢語言, Cypher 查詢語言
- 圖表資料模型, 圖資料模型
Neon（資料庫）, 設定新的副本
侄子（資料流引擎）, 資料流引擎
Neptune（圖資料庫）, 圖資料模型
- Cypher 查詢語言, Cypher 查詢語言
- SPARQL 查詢語言, SPARQL 查詢語言
網碼（遊戲開發）, 同步引擎的利弊
Network Attached Storage (NAS), 共享記憶體、共享磁碟與無共享架構, 分散式檔案系統
網路模型（資料表示）, 關係模型與文件模型
Network Time Protocol（見網路時間協議）
網路
- 擁堵和排隊, 網路擁塞和排隊
- 資料中心網路地形, 雲計算與超級計算
- faults（見 faults）
- 線性化和網路延遲, 線性一致性與網路延遲
- 網路分割槽, 實踐中的網路故障
  - 在 CAP 定理中, 線性一致性的代價
- 超時和無限制延誤, 超時和無界延遲
NewSQL, 關係模型與文件模型, 複製延遲的解決方案
- 事務和, 事務到底是什麼？, 資料庫內部的分散式事務
下鍵鎖定, 索引範圍鎖
NFS (network file system), 分散式檔案系統
- 在物件儲存中, 物件儲存
Nimble（資料格式）, 雲資料倉庫, 列式儲存
- （另見 column-oriented storage）
node (in graphs)（見 vertices）
節點（程序）, 分散式與單節點系統, 術語表
- 在基於領導器的複製中處理斷電, 處理節點故障
- 失敗的系統模型, 系統模型與現實
吵鬧的鄰居, 網路擁塞和排隊
原子承諾, 三階段提交
非決定性操作, 基於語句的複製
- （另見 deterministic operations）
- 在分散式系統中, 確定性模擬測試
- 工作流程引擎中, 持久化執行
- 部分失敗, 故障與部分失效
- 非決定因素, 確定性模擬測試
不起作用的要求, 定義非功能性需求, 總結
不可重複讀作, 快照隔離與可重複讀
- （另見讀取偏差）
正規化, 正規化、反正規化與連線-多對一與多對多關係, 術語表
- 外國關鍵參考文獻, 多物件事務的需求
- 社會網路案例研究, 社交網路案例研究中的反正規化
- 在記錄系統中, 記錄系統與派生資料
- 相對於非正常化, 從同一事件日誌中派生多個檢視
NoSQL, 關係模型與文件模型, 複製延遲的解決方案, 分拆資料庫
- 事務和, 事務到底是什麼？
Notation3 (N3), 三元組儲存與 SPARQL
網路時間協議, 不可靠的時鐘
- 準確性, 時鐘同步和準確性, 用於事件排序的時間戳
- 對單音鐘的調整, 單調時鐘
- 多個伺服器地址, 弱形式的謊言
XML 與 JSON 編碼中的數字, JSON、XML 及其二進位制變體
NumPy (Python library), 資料框、矩陣與陣列, 列式儲存
NVMe (Non-Volatile Memory Express)（見 solid state drives (SSDs)）

物件資料庫, 關係模型與文件模型
物件儲存, 雲服務的分層, 物件儲存-物件儲存
- Azure Blob Storage（見 Azure Blob Storage）
- 比較分散式檔案系統, 物件儲存
- 與關鍵價值庫存的比較, 物件儲存
- 資料庫由, 設定新的副本
- 備份, 複製
- 用於雲資料倉庫, 雲資料倉庫, 寫入列式儲存
- 資料庫複製, 設定新的副本
- Google Cloud Storage（見 Google Cloud Storage）
- 物件大小, 儲存與計算的分離
- S3（見 S3（物件儲存））
- storing LSM segment files, 構建和合並 SSTable
- 支援圍欄, 隔離殭屍程序和延遲請求
- 資料湖中的使用, 從資料倉庫到資料湖
物件關係對映（ORM）框架, 物件關係對映（ORM）
- 處理錯誤和中止事務, 處理錯誤和中止
- 不安全的讀寫週期程式碼, 原子寫操作
物件關係不匹配, 物件關係不匹配
可觀察性, 分散式系統的問題, 人類與可靠性, 可運維性：讓運維更輕鬆
觀察員模式, 應用程式碼和狀態的分離
OBT (one big table), 星型與雪花型：分析模式, 星型與雪花型：分析模式
離線系統, 批處理
- （另見 batch processing）
離線第一應用程式, 即時協作、離線優先和本地優先應用, 有狀態、可離線的客戶端
頁:1
- 加工過的原木中的消費者抵消額, 消費者偏移量
- 已磨損日誌中的訊息, 使用日誌進行訊息儲存
OLAP, 事務處理與分析的特徵, 術語表
- 資料方塊, 物化檢視與資料立方體
OLTP, 事務處理與分析的特徵, 術語表
- 分析查詢與, 分析（Analytics）
- 資料正常化, 正規化的權衡
- 工作量特點, 實際序列執行
現場部署, 雲服務與自託管
- 資料倉庫, 雲資料倉庫
一個大表格（資料倉計劃）, 星型與雪花型：分析模式, 星型與雪花型：分析模式
單熱編碼, 資料框、矩陣與陣列
一對夫婦關係, 用於一對多關係的文件資料模型
一對多種關係, 用於一對多關係的文件資料模型
- JSON representation, 用於一對多關係的文件資料模型
線上系統, 批處理
- （另見 services）
- 相對於科學計算, 雲計算與超級計算
腫瘤, 三元組儲存與 SPARQL
Oozie（工作流排程器）, 批處理
OpenAPI (service definition format), 微服務與無伺服器, Web 服務, Web 服務
- use of JSON Schema, JSON 模式
openCypher（見 Cypher（查詢語言））
OpenLink Virtuoso（見 Virtuoso（資料庫））
OpenStack
- Swift（物件儲存）, 物件儲存
可操作性, 可運維性：讓運維更輕鬆
作業系統與資料庫, 分拆資料庫
業務系統, 分析型與事務型系統
- （另見線上事務處理）
- 作為記錄系統, 記錄系統與派生資料
- ETL into analytical systems, 資料倉庫
操作轉換, CRDT 與操作變換
行動組, 雲時代的運維
運算元, 查詢執行：編譯與向量化
- 在溪流處理中, 流處理
樂觀併發控制, 悲觀併發控制與樂觀併發控制
樂觀鎖定, 條件寫入（比較並設定）
Oracle（資料庫）
- 分散式事務支援, XA 事務
- GoldenGate (change data capture), 資料變更捕獲的實現
- 等級查詢, SQL 中的圖查詢, SQL 中的圖查詢
- 缺乏序列性, 隔離性
- 基於領導者的複製, 單主複製
- 多領導複製, 跨地域執行
- 多表索引叢集表, 讀寫的資料區域性
- 無法阻止寫入 skew, 寫偏差的特徵
- PL/SQL language, 儲存過程的利弊
- 防止丟失更新, 自動檢測丟失的更新
- 讀作承諾隔離, 實現讀已提交
- Real Application Clusters (RAC), 鎖定與領導者選舉
- 快速隔離支援, 快照隔離與可重複讀, 快照隔離、可重複讀和命名混淆
- TimesTen (in-memory database), 全記憶體儲存
- WAL-based replication, 預寫日誌（WAL）傳輸
ORC（資料格式）, 雲資料倉庫, 列式儲存
- （另見 column-oriented storage）
協調（服務部署）, 雲服務與自託管, 微服務與無伺服器
- 批次任務執行, 分散式作業編排-分散式作業編排
- 工作流程引擎, 批處理
順序
- 事件日誌, 事件溯源與 CQRS
- 總訂單的限制, 全序的限制
- 邏輯時間戳, 邏輯時鐘
- of auto-incrementing IDs, ID 生成器和邏輯時鐘
- 共享日誌, 共識的實踐-共識的利弊
Orkes（工作流程引擎）, 持久化執行與工作流
孤兒頁面（B- 樹）, 使 B 樹可靠
發件箱圖案, 資料變更捕獲與事件溯源
異常值（響應時間）, 平均值、中位數與百分位點
外包, 雲服務與自託管
超載, 描述效能, 處理錯誤和中止

UDP (User Datagram Protocol)
- comparison to TCP, 網路擁塞和排隊
- 多廣播, 直接從生產者傳遞給消費者
終極線上（遊戲）, 分片
未繫結的資料集, 流處理, 術語表
- （另見 streams）
無限制的延誤, 術語表
- 在網路中, 超時和無界延遲
- 程序暫停, 程序暫停
解析資料庫, 分拆資料庫-多分割槽資料處理
- 構建資料儲存技術, 組合使用資料儲存技術-分拆系統與整合系統
  - 聯邦制與拆分制, 一切的元資料庫
- 圍繞資料流設計應用程式, 圍繞資料流設計應用-流處理器和服務
- 觀察匯出狀態, 觀察派生資料狀態-多分割槽資料處理
  - 實現檢視和快取, 物化檢視和快取
  - 多硬資料處理, 多分割槽資料處理
  - 推動客戶端更改狀態, 將狀態變更推送給客戶端
uncertain (transaction status)（見存疑）
聯盟型別（在 Avro）, 模式演化規則
uniq（Unix 工具）, 簡單日誌分析, 簡單日誌分析, 分散式作業編排
獨特性限制
- 同步檢查, 寬鬆地解釋約束
- 需要協商一致, 唯一性約束需要達成共識
- 需要線性, 約束與唯一性保證
- 以日誌為基礎的信件中的獨特性, 基於日誌訊息傳遞中的唯一性
團結（資料目錄）, 雲資料倉庫
universally unique identifiers（見 UUIDs）
unix 哲學
- 比較關係資料庫, 分拆資料庫, 一切的元資料庫
- 與流處理的比較, 流處理
unix 管道, 簡單日誌分析
- 與分散式批次處理相比, 工作流排程
UPDATE statement (SQL), 文件模型中的模式靈活性
更新
- 防止丟失更新, 防止丟失更新-衝突解決與複製
  - 原子寫入操作, 原子寫操作
  - 自動檢測丟失的更新, 自動檢測丟失的更新
  - 比較和設定, 條件寫入（比較並設定）
  - 衝突解決和推廣, 衝突解決與複製
  - 使用明確的鎖定, 顯式鎖定
- 防止寫入skew, 寫偏差與幻讀-物化衝突
使用量
- 批次過程排程, 資源分配
- 透過預設增加, 故障處理
- 與暫時取捨, 我們不能簡單地使網路延遲可預測嗎？
uTP protocol (BitTorrent), TCP 的侷限性
UUIDs, ID 生成器和邏輯時鐘

有效性（協商一致）, 單值共識, 原子提交作為共識
vBuckets（硬化）, 分片
向量時鐘, 版本向量
- （另見版本向量）
- 和 Lamport/hybrid 邏輯鍾, Lamport/混合邏輯時鐘 vs. 向量時鐘
- 和版本向量, 版本向量
向量嵌入, 向量嵌入
向量處理, 查詢執行：編譯與向量化
供應商鎖定, 雲服務的利弊
Venice（資料庫）, 對外提供派生資料
核查, 信任但驗證-用於可審計資料系統的工具
- 避免盲目信任, 不要盲目信任承諾
- 設計可審計性, 為可審計性而設計
- 端對端完整性檢查, 端到端原則重現
- 可審計資料系統工具, 用於可審計資料系統的工具
版本控制系統
- 合併衝突, 手動衝突解決
- 依賴不可改變的資料, 併發控制
版本向量, 不同拓撲的問題, 版本向量
- 點數, 版本向量
- 對向量時鐘, 版本向量
Vertica（資料庫）, 雲資料倉庫
- 處理寫入, 寫入列式儲存
vertical scaling（見 scaling up）
頂點（圖）, 圖資料模型
- 屬性圖模型, 屬性圖
電子遊戲, 同步引擎的利弊
影片轉碼（例如）, 跨通道時序依賴
views (SQL queries), Datalog：遞迴關係查詢
- materialized views（見物化）
檢視戳複製, 共識, 共識的實踐
- 使用模型檢查, 模型檢查與規範語言
- 檢視編號, 從單主複製到共識
虛擬塊裝置, 儲存與計算的分離
虛擬檔案系統, 分散式檔案系統
- 比較分散式檔案系統, 分散式檔案系統
虛擬機器, 雲服務的分層
- 上下文開關, 程序暫停
- 網路效能, 網路擁塞和排隊
- 吵鬧的鄰居, 網路擁塞和排隊
- 虛擬時鐘在, 時鐘同步和準確性
虛擬記憶體
- 因頁面錯誤造成的程序暫停, 延遲與響應時間, 程序暫停
Virtuoso（資料庫）, SPARQL 查詢語言
VisiCalc (spreadsheets), 圍繞資料流設計應用
Vitess（資料庫）
- 鍵程硬化, 按鍵的範圍分片
節點（硬化）, 分片
詞彙, 三元組儲存與 SPARQL
Voice over IP (VoIP), 網路擁塞和排隊
VoltDB（資料庫）
- 交叉硬度序列化, 分片
- 確定性儲存程式, 儲存過程的利弊
- 記憶體儲, 全記憶體儲存
- 程序/核心模式, 分片的利與弊
- 二級指數, 本地二級索引
- 事務的序列執行, 實際序列執行
- 基於語句的複製, 基於語句的複製, 失敗後重建狀態
- 流程處理中的事務, 原子提交再現

預寫式日誌, 使 B 樹可靠
WAL-G (backup tool), 設定新的副本
WarpStream（訊息系統）, 磁碟空間使用
web services（見 services）
網路使用者, 直接從生產者傳遞給消費者
網路方法（通訊）, 訊息代理
WebSocket (protocol), 將狀態變更推送給客戶端
寬柱資料模型, 讀寫的資料區域性
- 相對於面向列的儲存, 列壓縮
視窗（流程處理）, 流分析, 時間推理-視窗的型別
- 更改日誌的無限視窗, 維護物化檢視, 流表連線（流擴充）
- 知道所有事件何時到來, 處理滯留事件
- 串流在視窗內連線, 流流連線（視窗連線）
- 視窗型別, 視窗的型別
WITH RECURSIVE syntax (SQL), SQL 中的圖查詢
Word2Vec (language model), 向量嵌入
工作流程引擎, 持久化執行與工作流
- Airflow（見 Airflow（工作流排程器））
- 批處理, 工作流排程
- Camunda（見 Camunda (workflow engine)）
- Dagster（見 Dagster（工作流排程器））
- 持久執行, 持久化執行與工作流
- 提取-轉換-載入（ETL）（見 ETL）
- 執行器, 持久化執行與工作流
- 樂團, 持久化執行與工作流, 批處理
- Orkes（見 Orkes (workflow engine)）
- Prefect（見 Prefect（工作流排程器））
- 依賴決定性因素, 確定性模擬測試
- Restate（見 Restate (workflow engine)）
- Temporal（見 Temporal (workflow engine)）
工作設定, 排序與記憶體聚合
寫入放大, 寫放大
寫路徑, 觀察派生資料狀態
寫偏差, 寫偏差與幻讀-物化衝突
- 特性, 寫偏差與幻讀-導致寫偏差的幻讀, 基於過時前提的決策
- 例項, 寫偏差與幻讀, 寫偏差的更多例子
- 物化衝突, 物化衝突
- 實際發生情況, 維護完整性，儘管軟體有Bug
- 幻讀, 導致寫偏差的幻讀
- 預防
  - 在快照隔離中, 基於過時前提的決策-檢測影響先前讀取的寫入
  - 雙相鎖定, 謂詞鎖-索引範圍鎖
  - 選項, 寫偏差的特徵
預寫式日誌, 使 B 樹可靠, 預寫日誌（WAL）傳輸
- 持久執行, 持久化執行
寫入（資料庫）
- 原子寫入操作, 原子寫操作
- 檢測影響前讀的寫入, 檢測影響先前讀取的寫入
- 防止汙穢的寫作,, 沒有髒寫
WS-* framework, 遠端過程呼叫（RPC）的問題
WS-AtomicTransaction (2PC), 兩階段提交（2PC）

Zab（協商一致演算法）, 共識, 共識的實踐
- use in ZooKeeper, 實現線性一致性系統
零複製, 編碼資料的格式
zero-disk architecture (ZDA), 設定新的副本
ZeroMQ (messaging library), 直接從生產者傳遞給消費者
殭屍（分裂的大腦）, 隔離殭屍程序和延遲請求
zones (cloud computing)（見 availability zones）
ZooKeeper (coordination service), 協調服務-服務發現
- 生成柵欄標誌, 隔離殭屍程序和延遲請求, 使用共享日誌, 協調服務
- 線性操作, 實現線性一致性系統
- 鎖和領袖選舉, 鎖定與領導者選舉
- 觀察員, 服務發現
- 用於服務發現, 負載均衡器、服務發現和服務網格, 服務發現
- 用於硬性轉讓, 請求路由
- 使用 Zab 演算法, 共識

最後更新於 2026-02-15

術語表後記

索引

符號

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z