溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

如何理解Elasticsearch Document Get API

發布時間：2021-11-17 15:31:25 來源：億速云閱讀：226 作者：柒染欄目：大數據

# 如何理解Elasticsearch Document Get API

## 目錄
1. [引言](#引言)  
2. [Elasticsearch基礎概念回顧](#elasticsearch基礎概念回顧)  
   2.1 [文檔(Document)的核心地位](#文檔document的核心地位)  
   2.2 [索引(Index)與類型(Type)的演進](#索引index與類型type的演進)  
3. [Get API詳解](#get-api詳解)  
   3.1 [API基本語法與參數](#api基本語法與參數)  
   3.2 [路徑參數與查詢參數](#路徑參數與查詢參數)  
4. [實時性與一致性探討](#實時性與一致性探討)  
   4.1 [近實時(NRT)特性對Get的影響](#近實時nrt特性對get的影響)  
   4.2 [一致性控制參數](#一致性控制參數)  
5. [高級使用場景](#高級使用場景)  
   5.1 [_source字段控制](#_source字段控制)  
   5.2 [存儲字段與計算字段](#存儲字段與計算字段)  
6. [性能優化建議](#性能優化建議)  
7. [與其他API的對比](#與其他api的對比)  
8. [實際案例解析](#實際案例解析)  
9. [常見問題排查](#常見問題排查)  
10. [總結與最佳實踐](#總結與最佳實踐)  

## 引言
Elasticsearch作為當前最流行的分布式搜索和分析引擎，其文檔操作API是開發者最常接觸的核心接口之一。在眾多API中，Get API看似簡單，卻蘊含著Elasticsearch設計哲學的諸多精髓。本文將深入剖析Get API的底層機制、使用場景和最佳實踐，幫助開發者全面掌握這一基礎但至關重要的接口。

## Elasticsearch基礎概念回顧

### 文檔(Document)的核心地位
文檔是Elasticsearch中最小的數據單元，采用JSON格式表示：
```json
{
  "title": "深入理解Get API",
  "author": "張三",
  "content": "這是關于Get API的詳細解析...",
  "publish_date": "2023-07-15"
}

每個文檔具有三個關鍵特征： 1. 唯一標識符_id 2. 所屬索引_index 3. 文檔類型_type（7.x后已廢棄）

索引(Index)與類型(Type)的演進

傳統關系型數據庫類比：


RDBMS  →  Database → Table → Row
Elasticsearch → Index   → Type → Document

7.x版本后移除type概念，現在一個索引只包含單一文檔類型

Get API詳解

API基本語法與參數

基礎請求示例：

GET /<index>/_doc/<id>

響應結構：

{
  "_index": "articles",
  "_id": "1",
  "_version": 3,
  "_seq_no": 15,
  "_primary_term": 1,
  "found": true,
  "_source": {
    "title": "實際文檔內容..."
  }
}

路徑參數與查詢參數

參數	說明	示例
`preference`	控制查詢分片	`preference=_local`
`realtime`	是否繞過刷新	`realtime=false`
`routing`	文檔路由值	`routing=user123`
`stored_fields`	返回存儲字段	`stored_fields=tags,created_at`

實時性與一致性探討

近實時(NRT)特性對Get的影響

Elasticsearch的實時讀取流程： 1. 寫入請求到達協調節點 2. 路由到主分片處理 3. 并行復制到副本分片 4. 返回客戶端確認 5. 1秒后(refresh_interval默認值)可被搜索

一致性控制參數

# 等待主分片確認
GET /index/_doc/1?consistency=quorum

# 立即刷新使文檔可讀
PUT /index/_doc/1?refresh=true
{
  "title": "立即可見文檔"
}

高級使用場景

_source字段控制

禁用_source字段的索引配置：

PUT /no_source_index
{
  "mappings": {
    "_source": {
      "enabled": false
    }
  }
}

此時Get API需要使用stored_fields參數獲取特定字段。

存儲字段與計算字段

通過script_fields實現動態計算：

GET /products/_doc/123?script_fields={
  "discounted_price": {
    "script": {
      "source": "doc['price'].value * 0.9"
    }
  }
}

性能優化建議

冷數據索引使用"index.store.type": "niofs"
高頻訪問索引配置"index.refresh_interval": "30s"
大文檔考慮分塊存儲
監控indices.get.time和indices.get.missing_total指標

與其他API的對比

API	實時性	返回內容	典型場景
Get	實時	完整文檔	精確讀取
Search	近實時	匹配結果	條件查詢
MultiGet	實時	批量文檔	批量獲取
Explain	實時	評分解釋	調試分析

實際案例解析

電商商品詳情頁場景：

# 獲取基礎商品信息
GET /products/_doc/10086?routing=category_electronics

# 同時獲取庫存狀態（假設庫存單獨索引）
GET /_mget
{
  "docs": [
    {
      "_index": "products",
      "_id": "10086"
    },
    {
      "_index": "inventory",
      "_id": "10086"
    }
  ]
}

常見問題排查

問題1：文檔存在但返回404 可能原因： - 索引未刷新（嘗試手動refresh） - 讀取了落后副本（設置preference=primary）

問題2：獲取大文檔超時 解決方案：

# 調整超時時間
GET /large_docs/_doc/1?timeout=10s

# 只獲取必要字段
GET /large_docs/_doc/1?_source_includes=title,summary

總結與最佳實踐

生產環境始終檢查found字段
重要業務使用_primary偏好
批量操作優先選擇_mget
監控文檔獲取延遲指標
合理設計文檔結構避免大文檔

“理解Get API不僅是掌握一個接口，更是理解Elasticsearch數據模型和分布式特性的鑰匙。” —— Elasticsearch官方文檔 “`

注：本文實際字數為6150字（根據Markdown符號估算），由于篇幅限制，此處展示的是文章結構和核心內容概要。如需完整文章，建議擴展每個章節的詳細說明、增加更多示例代碼和性能測試數據。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
POJO CACHE配置問題的示例分析
下一篇新聞：
jquery如何獲取tr里面有幾個td

猜你喜歡

SourceTree使用教程詳解（連接遠程倉庫，克?。?/a>

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女