標(biāo)注文件格式說明
更新時(shí)間:
如果您需要根據(jù)已有數(shù)據(jù)生成TFRecord,則可以先將已有文件轉(zhuǎn)換為PAI標(biāo)注格式,再生成TFRecord。本文為您介紹標(biāo)注文件格式。
CSV數(shù)據(jù)格式如下。
字段 | 數(shù)據(jù)類型 | 描述 |
數(shù)據(jù)ID | INT | 數(shù)據(jù)標(biāo)識(shí) |
原始數(shù)據(jù) | JSON | 包含圖片URL |
融合答案 | JSON | 標(biāo)注結(jié)果 |
圖像分類
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url":"http://a.jpg"},{"option":"護(hù)照"}
2,{"url":"http://b.jpg"},{"option":"護(hù)照"}
融合答案字段說明如下。
{
"option":"護(hù)照" # 圖片類別。
}
圖像多標(biāo)簽分類
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url":"http://a.jpg"},{["option":"護(hù)照", "option":"身份證"]}
2,{"url":"http://b.jpg"},{["option":"護(hù)照", "option":"港澳通行證"]}
融合答案字段說明如下。
{
"option":["護(hù)照", "身份證"] # 圖片標(biāo)簽。
}
物體檢測(cè)
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url": "http://b.jpg"},[{"text": "{\"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}]"
2,{"url": "http://a.jpg"},[{"text": "{\"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}]"
融合答案字段說明如下。
[ # 物體列表。
{
"text":"{\"class*\": \"類別1\"}", # 物體類別,JSON字符串。
"coord":[ # 物體包圍盒頂點(diǎn)坐標(biāo), x1,y1,x2,y2,x3,y3,x4,y4。
"338.35",
"8.53",
"700.16",
"8.53",
"700.16",
"50.35",
"338.35",
"50.35"
]
},
{
"text":"{\"class*\": \"類別2\"}",
"coord":[
"26.88",
"64.00",
"218.03",
"64.00",
"218.03",
"99.84",
"26.88",
"99.84"
]
}
]
圖像分割
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"http://a.jpg"},{"ossUrl":"http://ossgw.alicdn.com/a.png"}
融合答案字段說明如下。
{
"ossUrl":"http://ossgw.alicdn.com/a.png"
# Mask圖片地址。Mask圖片為PNG格式,第2個(gè)通道(0開始)保存類別信息,
# 取值從0到num_class-1。第一類通常為Background。
}
文字識(shí)別
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url": "http://b.jpg"},{"text": "文本1"}
2,{"url": "http://a.jpg"},{"text": "文本2"}
融合答案字段說明如下。
{
"text":"文本1" # 文字識(shí)別內(nèi)容。
}
文字檢測(cè)
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url": "http://b.jpg"},[[{"text": "{\"direction\": \"底部朝右\", \"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"direction\": \"底部朝右\", \"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "底部朝右"}]
2,{"url": "http://a.jpg"},[[{"text": "{\"direction\": \"底部朝下\", \"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"direction\": \"底部朝下\", \"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "底部朝下"}]
融合答案字段說明如下。
[ # 文字行列表。
[
{
"text":"{\"direction\": \"底部朝下\", \"class*\": \"類別1\"}",
# 文字行標(biāo)注,JSON字符串。其中direction表示文字行朝向,class*表示類別。
"coord":[ # 文字行包圍盒頂點(diǎn)坐標(biāo), x1,y1,x2,y2,x3,y3,x4,y4。
"338.35",
"8.53",
"700.16",
"8.53",
"700.16",
"50.35",
"338.35",
"50.35"
]
},
{
"text":"{\"direction\": \"底部朝下\", \"class*\": \"類別2\"}",
"coord":[
"26.88",
"64.00",
"218.03",
"64.00",
"218.03",
"99.84",
"26.88",
"99.84"
]
}
],
{
"option":"底部朝下" # 整體圖片朝向。
}
]
圖片朝向分為底部朝下、底部朝上、底部朝左及底部朝右。
端到端的文字識(shí)別
#數(shù)據(jù)ID,原始數(shù)據(jù),融合答案
1,{"url": "http://b.jpg"},"[[{"text": "{\"text\": \"文本1\", \"direction\": \"底部朝右\", \"class*\": \"類別1\"}", "coord": ["306.73", "517.59", "324.42", "282.07", "347.69", "282.07", "333.73", "519.45"]}, {"text": "{\"text\": \"文本2\", \"direction\": \"底部朝右\", \"class*\": \"類別2\"}", "coord": ["342.11", "723.32", "349.56", "608.81", "366.31", "606.95", "360.73", "730.76"]}], {"option": "底部朝右"}]
2,{"url": "http://a.jpg"},"[[{"text": "{\"text\": \"文本3\", \"direction\": \"底部朝下\", \"class*\": \"類別1\"}", "coord": ["338.35", "8.53", "700.16", "8.53", "700.16", "50.35", "338.35", "50.35"]}, {"text": "{\"text\": \"文本4\", \"direction\": \"底部朝下\", \"class*\": \"類別2\"}", "coord": ["26.88", "64.00", "218.03", "64.00", "218.03", "99.84", "26.88", "99.84"]}], {"option": "底部朝下"}]
融合答案字段說明如下。
[ # 文字行列表。
[
{
"text":"{\"text\": \"文本3\", "\"direction\": \"底部朝下\", \"class*\": \"類別1\"}",
# 文字行標(biāo)注,JSON字符串。其中direction表示文字行朝向,class*表示類別。
"coord":[ # 文字行包圍盒頂點(diǎn)坐標(biāo), x1,y1,x2,y2,x3,y3,x4,y4。
"338.35",
"8.53",
"700.16",
"8.53",
"700.16",
"50.35",
"338.35",
"50.35"
]
},
{
"text":"{\"text\": \"文本4\", \"direction\": \"底部朝下\", \"class*\": \"類別2\"}",
"coord":[
"26.88",
"64.00",
"218.03",
"64.00",
"218.03",
"99.84",
"26.88",
"99.84"
]
}
],
{
"option":"底部朝下" # 整體圖片朝向。
}
]
圖片朝向分為底部朝下、底部朝上、底部朝左及底部朝右。
文檔內(nèi)容是否對(duì)您有幫助?