日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

LLM Trace字段定義說明

LLM Trace字段是阿里云參考OpenTelemetry標準以及大語言模型應用領域概念制定的,通過對Attributes、Resource、Event擴展用于描述LLM應用調用鏈數據的語義,能夠反映LLM的輸入輸出請求、令牌消耗等關鍵操作。它們為Completion、Chat、RAG、Agent、Tool等場景提供了豐富的、語境相關的語義數據,以便于數據跟蹤和上報。此語義字段將隨著社區的發展而不斷更新和優化。

Span Field

Span一級字段定義及可觀測鏈路 OpenTelemetry 版底層存儲的Trace一級字段詳細說明,請參見調用鏈分析參數說明

Attributes

下文定義的字段為LLM Trace場景的保留字段。SDK需要參考如下Key-Value字段規范,將相關數據作為Attributes附加到Span中,然后上報Span數據到服務端。

Common Attributes

說明

不區分操作類型,一次大模型QA涉及的鏈路里可以透傳或者附屬于多個Span的字段。

Attribute

類型

描述

是否必選

示例

gen_ai.session.id

String

會話ID

"ddde34343-f93a-4477-33333-sdfsdaf"

gen_ai.user.id

String

應用的C端用戶標識

"u-lK8JddD" or "張三@愛茉莉.com"

gen_ai.span.kind

String

操作類型

詳細信息,請參見下方Span Kind

"CHAIN"

gen_ai.framework

String

使用的框架類型

"langchain" or "llama_index" ..

Span Kind

在大模型的實際交互場景中,往往會涉及多個操作步驟 。基于LLM應用范式以及應用研發框架,目前定義了如下操作類型,這些操作類型支持擴展,不同的操作類型對應的Attributes字段會存在差異。

  • CHAIN:一種將LLM和其他多個組件連接在一起以實現復雜任務的工具,可能包含Retrieval、Embedding、LLM調用,還可以嵌套Chain等。

  • EMBEDDING:嵌入處理,例如針對文本嵌入大模型的操作,可以根據相似度查詢并優化問題。

  • RETRIEVER:一般表示訪問向量存儲或者數據庫獲取數據,一般用于補充上下文內容,以提升LLM的響應準確性以及效率。

  • RERANKER:針對輸入的多個文檔,結合提問內容判斷相關性進行排序處理,可能返回TopK的文檔作為LLM。

  • LLM:標識對大模型的調用,例如基于SDK或OpenAPI請求不同的大模型進行推理或者文本生成等。

  • TOOL:標識對外部工具的調用,例如可能調用計算器或者請求天氣API獲取最新的天氣情況。

  • AGENT:智能體場景,一種復雜的CHAIN,需要基于大模型的推理結果決策執行下一步,例如可能涉及到LLM以及Tool的多次調用,一步步決策得出最終答案。

  • Task:標識內部自定義方法,例如可能調用本地的某個Function應用自定義的邏輯。

重要

LLM相關的Span Kind不同于OpenTelemetry中Trace定義的Span kind

CHAIN

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"CHAIN"

gen_ai.span.sub_kind

String

操作二級類型

"WORKFLOW" or "TASK"

input.value

String

輸入內容

"Who Are You!"

output.value

String

返回內容

"I am ChatBot"

EMBEDDING

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"EMBEDDING"

embedding.model_name

String

內嵌的模型名稱

"text-embedding-v1"

gen_ai.usage.prompt_tokens

Integer

內嵌的Token消耗

10

gen_ai.usage.total_tokens

Integer

內嵌的Token總消耗

10

embedding.embeddings.0.embedding.text

String

內嵌的文本

"hello world"

embedding.embeddings.0.embedding.vector

Array

由一系列浮點數組成的嵌入向量

[0.123, 0.456, ...]

embedding.embeddings.0.embedding.vector_size

Integer

向量長度

1536

RETRIEVER

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"RETRIEVER"

retrieval.documents.0.document.id

String

文檔的唯一標識符

"2aeab544-f93a-4477-b51d-bec27351325b"

retrieval.documents.0.document.score

Float

文檔相關性的得分

0.98

retrieval.documents.0.document.content

String

檢索到的文檔的內容

"This is a sample document content."

retrieval.documents.0.document.metadata

String

與文檔相關的元數據

{"file_path": "/dev/EasyRAG/data/laws/laws.txt",

"file_name": "/dev/EasyRAG/data/laws/laws.txt", "file_type": "text/plain",

"file_size": 15618, "creation_date": "2024-03-20", "last_modified_date": "2024-03-20",

"last_accessed_date": null}

RERANKER

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"RERANKER"

reranker.query

String

重排器的查詢參數

"How to format timestamp?"

reranker.model_name

String

重排器的模型名稱

"cross-encoder/ms-marco-MiniLM-L-12-v2"

reranker.top_k

Integer

重排器的TopK參數

3

reranker.input_documents.0.document.id

String

文檔的唯一標識符

"2aeab544-f93a-4477-b51d-bec27351325b"

reranker.input_documents.0.document.score

Float

文檔相關性的得分

0.98

reranker.input_documents.0.document.content

String

檢索到的文檔的內容

"This is a sample document content."

reranker.input_documents.0.document.metadata

String

與文檔相關的元數據

{"file_path": "/dev/EasyRAG/data/laws/laws.txt",

"file_name": "/dev/EasyRAG/data/laws/laws.txt", "file_type": "text/plain",

"file_size": 15618, "creation_date": "2024-03-20", "last_modified_date": "2024-03-20","last_accessed_date": null}

reranker.output_documents.0.document.id

String

文檔的唯一標識符

"2aeab544-f93a-4477-b51d-bec27351325b"

reranker.output_documents.0.document.score

Float

文檔相關性的得分

0.98

reranker.output_documents.0.document.content

String

檢索到的文檔的內容

"This is a sample document content."

reranker.output_documents.0.document.metadata

String

與文檔相關的元數據

{"file_path": "/dev/EasyRAG/data/laws/laws.txt",

"file_name": "/dev/EasyRAG/data/laws/laws.txt", "file_type": "text/plain",

"file_size": 15618, "creation_date": "2024-03-20", "last_modified_date": "2024-03-20","last_accessed_date": null}

LLM

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"LLM"

gen_ai.span.sub_kind

String

操作二級類型

"CHAT" or "COMPLETION"

gen_ai.prompt_template.template

String

用于生成Prompts的模板,它以Python的f-string形式存在

"Weather forecast for {city} on {date}"

gen_ai.prompt_template.variables

String

一組以JSON格式表示的鍵值對,這些鍵值對被用于填充一個先前定義的Prompt模板

{ context: "<context from retrieval>", subject: "math" }

gen_ai.prompt_template.version

String

提示模板的版本號

"1.0"

gen_ai.system

String

大模型的提供商

"OPENAI"

gen_ai.request.parameters

String

調用LLM或API時使用的參數

{"temperature": 0.7}"

gen_ai.model_name

String

LLM的名稱

"gpt-4"

gen_ai.request.model

String

請求所指向的LLM的名稱

"gpt-4"

gen_ai.request.max_tokens

Integer

LLM為一個請求生成的最大令牌數

100

gen_ai.request.temperature

Float

LLM請求的溫度設置

0.1

gen_ai.request.top_p

Float

LLM請求的top_p采樣設置

1

gen_ai.request.is_stream

Boolean

LLM是否以stream的形式響應

false

gen_ai.request.stop_sequences

Array

LLM用作停止序列的字符串數組

"stop"

gen_ai.request.tool_calls

Array

LLM生成的工具調用(例如函數調用)列表

[{"tool_call.function.name": "get_current_weather"}]

gen_ai.response.model

String

生成響應的LLM的名稱

"gpt-4-0613"

gen_ai.response.finish_reason

String

模型停止生成令牌的原因,對應于收到的每一次生成

"stop"

gen_ai.prompts.0.content

String

提示內容

"中國的首都是哪個城市?"

gen_ai.prompts.0.message.role

String

消息中實體的角色(例如用戶、系統)

"user" or "system"

gen_ai.prompts.0.message.content

String

聊天中消息的內容

"What's the weather today?"

input.value

String

API請求傳參內容,一般為JSON格式

"Who Are You!"

gen_ai.completions.0.content

String

補全場景:從LLM收到的完整響應

"中國的首都是北京"

gen_ai.completions.0.message.role

String

Chat場景:消息中實體的角色(例如助手)

"assistant"

gen_ai.completions.0.message.content

String

Chat場景:聊天中消息的內容

"聊天內容1"

gen_ai.completions.0.message.tool_calls

Array

Chat場景:LLM生成的工具調用(例如函數調用)列表

[{"tool_call.function.name": "get_current_weather"}]

output.value

String

API返回的完整內容,一般為JSON格式,可以提取關鍵字段,例如token_usage等

"I am ChatBot"

gen_ai.usage.prompt_tokens

Integer

Prompt中的令牌數量

100

gen_ai.usage.completion_tokens

Integer

Completion中的令牌數量

200

gen_ai.usage.total_tokens

Integer

總令牌數量,包括Prompt和Completion

300

TOOL

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"TOOL"

tool.name

String

工具名稱

"WeatherAPI"

tool.description

String

工具描述

"An API to get weather data."

tool.parameters

String

工具參數

"{'a': 'int' }"

AGENT

Attribute

類型

描述

是否必選

示例

gen_ai.span.kind

String

操作類型

"AGENT"

input.value

String

輸入內容

"請幫我規劃xxxx!"

input.mime_type

String

輸入MIME TYPE

"text/plain" or "application/json"

output.value

String

返回結果

"規劃結束,請查看結果xxx"

output.mime_type

String

返回MIME Type

"text/plain" or "application/json"