日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

非結(jié)構(gòu)化分析

AnalyticDB PostgreSQL版的向量分析旨在幫助您實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的近似檢索和分析,具備豐富功能和優(yōu)異性能。

功能說明

向量分析實(shí)現(xiàn)原理是通過AI算法提取非結(jié)構(gòu)化數(shù)據(jù)的特征,然后利用特征向量唯一標(biāo)識(shí)非結(jié)構(gòu)化數(shù)據(jù),向量間的距離用于衡量非結(jié)構(gòu)化數(shù)據(jù)之間的相似度。AnalyticDB PostgreSQL版向量檢索分析基于MPP查詢架構(gòu)構(gòu)建,幫助用戶實(shí)現(xiàn)基于SQL接口進(jìn)行非結(jié)構(gòu)化數(shù)據(jù)檢索,并支持同結(jié)構(gòu)化數(shù)據(jù)的關(guān)聯(lián)分析。

典型應(yīng)用場(chǎng)景

通過AnalyticDB PostgreSQL版向量分析,您可以非常容易地搭建各種智能化應(yīng)用。

  • 以圖搜圖,即通過圖片檢索圖片。

  • 聲紋匹配,通過音頻檢索音頻。

  • 基于語(yǔ)義的文本檢索和推薦,通過文本檢索近似文本。

  • 文件去重,通過文件指紋去除重復(fù)文件。

  • 商品圖片分析,在大量圖片中分析哪些圖片包含了同一個(gè)商品。

向量分析作為AnalyticDB PostgreSQL版向量分析的高級(jí)特性目前已經(jīng)服務(wù)阿里巴巴內(nèi)外部多項(xiàng)業(yè)務(wù),包括阿里巴巴數(shù)據(jù)中臺(tái),阿里巴巴電商新零售業(yè)務(wù),阿里云城市大腦。

典型架構(gòu)

圖 1. 基于AnalyticDB PostgreSQL版實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)向量分析示例示例

  • Web App把文本,圖片或者視頻等非結(jié)構(gòu)化數(shù)據(jù)(后續(xù)簡(jiǎn)稱非結(jié)構(gòu)化數(shù)據(jù))通過特征提取服務(wù)提取特征向量,然后再把特征向量寫入云原生數(shù)據(jù)倉(cāng)庫(kù)PostgreSQL版向量分析的向量表。

  • Web App檢索的時(shí)候首先把非結(jié)構(gòu)化數(shù)據(jù)通過特征提取服務(wù)接口提取出向量,然后調(diào)用云原生數(shù)據(jù)倉(cāng)庫(kù)PostgreSQL版向量分析的查詢分析接口做查詢。

優(yōu)勢(shì)

云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB PostgreSQL版的向量分析特性針對(duì)非結(jié)構(gòu)化數(shù)據(jù)檢索分析,與普通的檢索系統(tǒng)有較大的差異,主要體現(xiàn)在下面的幾點(diǎn):

  • 結(jié)構(gòu)化和非結(jié)構(gòu)化混合分析

    例如,可以檢索與輸入圖片中的連衣裙相似度最高、價(jià)格在100元到200元之間且上架時(shí)間在最近1個(gè)月以內(nèi)的產(chǎn)品。

  • 支持?jǐn)?shù)據(jù)實(shí)時(shí)更新

    傳統(tǒng)的向量分析系統(tǒng)中數(shù)據(jù)只能按照T+1更新,不支持?jǐn)?shù)據(jù)實(shí)時(shí)寫入。云原生數(shù)據(jù)倉(cāng)庫(kù)PostgreSQL版向量分析支持?jǐn)?shù)據(jù)實(shí)時(shí)更新和查詢。

  • 支持向量分析碰撞

    AnalyticDB PostgreSQL版向量分析支持KNN-Join,即比較一堆向量與另外一堆向量的相似度,類似于spark中的KNN-Join操作,這種場(chǎng)景計(jì)算量巨大,AnalyticDB PostgreSQL版針對(duì)該場(chǎng)景做了大量?jī)?yōu)化。

    典型的應(yīng)用場(chǎng)景有商品去重,計(jì)算新加入的商品與歷史商品庫(kù)中有哪些是相似的。人臉聚類,計(jì)算一段時(shí)間內(nèi)的人臉庫(kù)中,哪些人臉是同一個(gè)人。

  • 易用性

    AnalyticDB PostgreSQL版向量分析申請(qǐng)即可使用,支持標(biāo)準(zhǔn)SQL,簡(jiǎn)化開發(fā)流程。

  • 低成本

    向量數(shù)據(jù)占用空間非常大,1條512維float向量,占用2k存儲(chǔ)空間,AnalyticDB PostgreSQL版向量支持FP32數(shù)據(jù)壓縮成FP16,降低一半存儲(chǔ)成本。