日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

基本概念

為便于您更好的理解視頻點播產品,您可以在使用前了解視頻格式、視頻編碼、視頻轉碼等基本概念。

文件格式

操作系統中的文件名都有后綴,即擴展名,例如1.doc,2.jpg,3.avi等。設置擴展名的目的是讓系統中的應用程序來識別并關聯這些文件,讓相應的文件由相應的應用程序打開。常見的文件格式如1.avi,2.mpg,3.mp4這些都叫做視頻的文件格式,可由電腦上安裝的視頻播放器關聯和打開(播放)。

封裝格式

封裝格式(Format),也稱多媒體容器(Multimedia Container),是將已編碼壓縮好的視頻軌道、音頻軌道和元數據(視頻基本信息如標題、字幕等)按照一定的格式規范,打包放到一個文件中,形成特定文件格式的視頻文件。

封裝格式主要分為兩大類:面向存儲的和面向流媒體的。

  • 面向存儲的,常見的有AVI、ASF(WMA/WMV)、MP4、MKV、RMVB(RM/RA)等;

  • 面向流媒體的,常見的有FLV、TS(需要配合流媒體網絡傳輸協議,如HLS、RTMP等),MP4也支持流媒體方式(配合HTTP等)。

下面以流媒體傳輸協議的視角重點介紹面向流媒體的封裝格式:

  • MP4:經典的視頻封裝格式,移動端(iOS、Android)、PC Web多終端都能良好支持。但MP4的視頻文件頭太大,結構復雜;如果視頻較長(如數小時),則其文件頭會過大,影響視頻加載速度,故更適合短視頻場景。

    MP4由一個個的box(以前叫atom)組成,所有的Metadata(媒體描述元數據),包括定義媒體的排列和時間信息的數據都包含在這樣的一些結構box中。Metadata 對媒體數據(比如視頻幀)引用說明,而媒體數據在這些引用文件中的排列關系全部在第一個主文件中的metadata描述,這樣就會導致視頻時長越大文件頭就會越大、加載越慢。

  • HLS(HTTP Live Streaming):蘋果公司推出的基于HTTP的流媒體網絡傳輸協議,視頻的默認封裝格式是TS,除了多個TS分片文件,還定義了用來控制播放的m3u8索引文件(文本文件),可以規避普通MP4長時間緩沖頭部數據的問題,比較適合點播場景。移動端(iOS、Android)支持較好,但PC端IE存在兼容性問題依賴播放器的二次開發(建議使用阿里云Web播放器)。

  • FLV:Adobe公司推出的標準,在PC端有Flash的強力支持,但在移動終端只有App實現播放器才能支持(建議使用阿里云播放器),大部分手機端瀏覽器(特別是蘋果的移動設備)均不支持。

  • DASH(Dynamic Adaptive Streaming over HTTP):使用fragmented MP4(fMP4)格式,將MP4視頻分割為多個分片,每個分片可以存在不同的編碼形式(如分辨率、碼率等);播放器端可自由選擇需要播放的視頻分片,實現自適應多碼率、不同畫質內容的無縫切換,提供更好的播放體驗。其中MPD文件類似HLS的m3u8文件,國外視頻網站如YouTube、Netflix等較多使用DASH。

  • HLS+fMP4(HTTP Live Streaming with fragmented MP4):此處單列,但本質上還是HLS協議。蘋果公司于WWDC 2016宣布新的HLS標準支持文件封裝格式為fragmented MP4,使用方法與TS分片類似,意味著一次轉碼可同時打包成DASH和HLS。

    HLS(包括HLS+fMP4)和DASH是最常用的自適應流媒體傳輸技術(Adaptive Video Streaming),推薦使用。

編碼方式

視頻編碼方式(Codec)是指能夠對數字視頻進行壓縮或解壓縮(視頻解碼)的程序或者設備。通常這種壓縮屬于有損數據壓縮。也可以指通過特定的壓縮技術,將某個視頻格式轉換成另一種視頻格式。常見的編碼方式有:

  1. H.26X系列:由ITU(國際電信聯盟)主導,包括H.261、H.262、H.263、H.264、H.265。

    • H.261:主要應用于老的視頻會議和視頻電話產品中。

    • H.262:主要應用于廣播、DVD、數字電視等領域,主要提供標清(SD)視頻的編碼和傳輸功能。

    • H.263:主要應用于視頻會議、視頻電話和網絡視頻中。

    • H.264:H.264/MPEG-4第十部分,或稱AVC(Advanced Video Coding,高級視頻編碼),是一種視頻壓縮標準,一種被廣泛使用的高精度視頻的錄制、壓縮和發布格式。

    • H.265:高效率視頻編碼(High Efficiency Video Coding,簡稱HEVC)是一種視頻壓縮標準,H.264/MPEG-4 AVC的繼任者。HEVC不僅提升圖像質量,同時也能達到H.264/MPEG-4 AVC兩倍的壓縮率(等同于同樣畫面質量下碼率減少50%),可支持4K分辨率甚至超高畫質電視,最高分辨率可達8192×4320(8K分辨率),這是目前發展的趨勢。

  2. MPEG系列:由ISO(國際標準化組織)下屬的MPEG(動態圖像專家組)主導,視頻編碼方面主要有:

    • MPEG-1第二部分:主要使用在VCD上,有些在線視頻也使用這種格式,該編解碼器的質量大致上和原有的VHS錄像帶相當。

    • MPEG-2第二部分:等同于H.262,使用在DVD、SVCD和大多數數字視頻廣播系統和有線分布系統(Cable Distribution Systems)中。

    • MPEG-4第二部分:可以使用在網絡傳輸、廣播和媒體存儲上,比起MPEG-2和第一版的H.263,它的壓縮性能有所提高。

    • MPEG-4第十部分:技術上和ITU-TH.264是相同的標準,二者合作,誕生了H.264/AVC標準,ITU-T將其命名為H.264,而ISO/IEC稱它為MPEG-4高級視頻編碼(Advanced Video Coding,AVC)。

  3. AVS(Audio Video coding Standard):我國自主知識產權的信源編碼標準,是《信息技術先進音視頻編碼》系列標準的簡稱,目前已完成兩代AVS標準的制定。

    • 第一代AVS標準包括國家標準《信息技術先進音視頻編碼第2部分:視頻》(簡稱AVS1)和《信息技術先進音視頻編碼第16部分:廣播電視視頻》(簡稱AVS+)。AVS+的壓縮效率與國際同類標準H.264/AVC最高檔次(High Profile)相當。

    • 第二代AVS標準,簡稱AVS2,首要應用目標是超高清晰度視頻,支持超高分辨率(4K以上)、高動態范圍視頻的高效壓縮。AVS2的壓縮效率比上一代標準AVS+和H.264/AVC提高了一倍,超過國際同類型標準HEVC/H.265。

  4. 其他系列,如,VP8、VP9(Google 主導),RealVideo(RealNetworks推出)等編碼方式,在互聯網視頻使用較少,此處不再介紹。

選擇編碼方式要充分考慮播放終端(如移動端APP、Web瀏覽器等)的兼容性,盡量使用最常見和廣泛支持的。阿里云視頻點播支持視頻編碼格式:H.264/AVC(默認)、 H.265/HEVC,音頻編碼格式:MP3(默認)、AAC、VORBIS、FLAC。

轉碼

視頻轉碼(Video Transcoding)是指將已經壓縮編碼的視頻碼流轉換成另一個視頻碼流,以適應不同的網絡帶寬、不同的終端處理能力和不同的用戶需求。轉碼本質上是一個先解碼、再編碼的過程,因此轉換前后的碼流可能遵循相同的視頻編碼標準,也可能不遵循相同的視頻編碼標準。

轉封裝

轉封裝指的是將視頻或音頻的封裝格式進行轉換,如將AVI的視頻轉換為MP4,其間并不會進行音視頻的編碼和解碼工作,而是直接將視頻和音頻壓縮碼流從一種封裝格式文件中獲取出來然后打包成另一種封裝格式的文件。相比轉碼,轉封裝有兩大特點:

  • 處理速度極快。音視頻編解碼過程十分復雜,占據了轉碼的絕大部分時間。轉封裝不需要進行編碼和解碼,節約了大量的處理時間。

  • 音視頻質量無損。沒有解碼(解壓縮)和編碼(壓縮)過程,所以不會有音視頻的壓縮損傷。

轉封裝后的文件與原始文件的分辨率、碼率等幾乎一致,故播放時也稱其為“原畫”。

碼率、碼流

碼率(Bitrate)是指視頻文件在單位時間內使用的數據流量,也叫碼流或碼流率,是視頻編碼中畫面質量控制最重要的部分。量度單位為“比特每秒”(bit/s或bps),常使用Kbps(每秒多少千個比特)或Mbps。一般來說同樣分辨率下,視頻文件的碼率越大,壓縮比就越小,畫面質量就越高。碼率越大,說明單位時間內取樣率越大,數據流精度就越高,處理出來的文件就越接近原始文件,圖像質量越好,畫質越清晰,要求播放設備的解碼能力也越高。

當然,碼率越大,文件體積也越大,其計算公式是文件體積=時間×碼率/8。例如,網絡上常見的一部60分鐘的碼率為1Mbps的720P的視頻文件,其體積就大概為3600秒×1Mbps/8=450MB。

分辨率

分辨率(Resolution)用來描述視頻對細節的分辨能力,通常表示為每一個方向上的像素數量,比如1280x720等。分辨率決定了視頻畫面細節的精細程度。通常情況下,視頻的分辨率越高,所包含的像素就越多,畫面就越清晰。

分辨率是決定碼率的主要因素,不同的分辨率要采用不同的碼率。總體而言,視頻的分辨率越高,所要求的碼率也越大,但并不總是如此,不同分辨率都有合理的碼率選擇范圍。所謂“合理的范圍”指的是,如果低于這個范圍,視頻畫面質量會很差;如果高于這個范圍,畫面提升有限甚至幾乎無提升,且浪費網絡流量和存儲空間。

幀率

幀率(Frame Rate)是單位時間內視頻顯示幀數的量度單位,也就是每秒鐘刷新的圖片的幀數,量度單位為“每秒顯示幀數”(Frame Per Second,FPS)或“赫茲”。

高的幀率可以得到更流暢、更逼真的畫面效果。一般來說25~30fps就可接受,提升至60fps則可以明顯提升交互感和逼真感,但一般來說超過75fps就不容易察覺到有明顯的流暢度提升了。如果幀率超過屏幕刷新率只會浪費圖形處理的能力,因為顯示設備不能以這么快的速度更新,這樣超過刷新率的幀率就浪費掉了。在分辨率不變的情況下,幀率越高,則對顯卡的處理能力要求越高。

GOP(關鍵幀間隔)

GOP(Group of Pictures)是一組以 MPEG 編碼的影片或視訊串流內部的連續圖像,以 I 幀開頭,到下一個 I 幀結束。一個 GOP 包含如下圖像類型:

  • I幀(Intra Coded Picture):又稱幀內編碼幀,為關鍵幀,是一種自帶全部信息的獨立幀,無需參考其他圖像便可獨立進行解碼,可以簡單理解為一張靜態畫面。視頻序列中的第一個幀始終都是I幀,每個GOP由I幀開始。

  • P幀(Predictive Coded Picture):又稱幀間預測編碼幀,需要參考前面的I幀才能進行編碼。表示的是當前幀畫面與前一幀(前一幀可能是I幀也可能是P幀)的差別。解碼時需要用之前緩存的畫面疊加上本幀定義的差別,生成最終畫面。與I幀相比,P幀通常占用更少的數據位,但不足是,由于P幀對前面的P和I參考幀有著復雜的依賴性,因此對傳輸錯誤非常敏感。

  • B幀(Bidirectionally Predictive Coded Pictures):又稱雙向預測編碼幀,也就是B幀記錄的是本幀與前后幀的差別。也就是說要解碼B幀,不僅要取得之前的緩存畫面,還要解碼之后的畫面,通過前后畫面的與本幀數據的疊加取得最終的畫面。B幀壓縮率高,但是對解碼性能要求較高。

GOP值表示關鍵幀的間隔(即兩個關鍵幀之間的幀數),也就是兩個IDR幀之間的距離,一個幀組的最大幀數。一般而言,每一秒視頻至少需要使用1個關鍵幀。增加關鍵幀個數可改善視頻質量,但會同時增加帶寬和網絡負載。GOP值(幀數)除以幀率即為時間間隔,如阿里云視頻點播默認的GOP值為250幀,幀率為25fps,則時間間隔為10秒。

GOP值需要控制在合理范圍,以平衡視頻質量、文件大小(網絡帶寬)和seek效果(拖動、快進的響應速度)等:

  • 加大GOP值有利于減小視頻文件大小,但也不宜設置過大,太大則會導致GOP后部幀的畫面失真,影響視頻質量。

  • GOP值也是影響視頻seek響應速度的關鍵因素,seek時播放器需要定位到離指定位置最近的前一個關鍵幀,如果GOP太大意味著距離指定位置可能越遠(需要解碼的預測幀就越多)、seek響應的時間(緩沖時間)也越長。

  • 由于P、B幀的復雜度大于I幀,GOP值過大,過多的P、B幀會影響編碼效率,使編碼效率降低。

  • 但如果設置過小的GOP值,則需要提高視頻的輸出碼率,以確保畫面質量不會降低,故會增加網絡帶寬。

掃描模式

  • 逐行掃描(progressive):在電子顯示屏上通過掃描顯示圖像時,每一幀圖像通過一場掃描來完成,由電子束順序地一行接著一行連續掃描而成,一場掃描即能構成完整的畫面。

  • 隔行掃描(interlaced):在電子顯示屏上通過掃描顯示圖像時,每一幀圖像通過兩場掃描來完成,通常第一場先只掃描奇數行,然后第二場只掃描偶數行,兩場組合起來構成完整的畫面。

IDR 幀對齊

IDR幀(Instantaneous Decoding Refresh Picture),即時解碼刷新幀,是 I 幀的一種。與普通 I 幀的區別在于,一個 IDR 幀之后的所有幀都不能引用該 IDR 幀之前的幀的內容;相反,對于普通的 I 幀,其后的 P 幀和 B 幀可以引用該普通 I 幀之前的其他 I 幀。在編碼和解碼中為了方便,將首個I幀和其他I幀區別開,稱為IDR,這樣就方便控制編碼和解碼流程。

IDR幀的作用是立刻刷新,使錯誤不致傳播,從IDR幀開始,重新算一個新的序列開始編碼。而普通I幀不具有隨機訪問的能力,這個功能是由IDR承擔。視頻播放時,播放器一般都支持隨機seek(拖動)到指定位置,而播放器直接選擇到指定位置附近的 IDR 幀進行播放最為便捷,因為可以明確知道該 IDR 幀之后的所有幀都不會引用其之前的其他 I 幀,從而避免較為復雜的反向解析。

在對同一個視頻進行多碼率轉碼時,如果指定 IDR 幀對齊(IDR Frame Alignment),則意味著所有輸出視頻的 IDR 幀在時間點、幀內容方面都保持精確同步,此時播放器便可實現多碼率視頻平滑切換,從而不會出現較為明顯的切換卡頓。

編碼級別

編碼檔次(Profile)是針對特定應用場景的特定編碼功能的集合。H.264 規定了三種主要級別:

  • Baseline:支持 I/P 幀,只支持無交錯(Progressive)和 CAVLC,一般用于低階或需要額外容錯的應用,比如視頻通話、手機視頻等即時通信領域;

  • Main:提供 I/P/B 幀,支持無交錯(Progressive)和交錯(Interlaced),同樣提供對于 CAVLC 和 CABAC 的支持,用于主流消費類電子產品規格如低解碼(相對而言)的 MP4、便攜的視頻播放器、PSP 和 iPod 等;

  • High:在 Main 的基礎上增加了 8x8 內部預測、自定義量化、無損視頻編碼和更多的 YUV 格式(如 4:4:4),用于廣播及視頻碟片存儲(藍光影片),高清電視的應用。

比特率

比特率(Bit rate)是指每秒傳送的比特(bit)數,單位為bps(Bit Per Second),比特率越高,傳送的數據越大。在視頻領域,比特率等同于碼率。比特率表示經過編碼(壓縮)后的音、視頻數據每秒鐘需要用多少個比特來表示,而比特就是二進制里面最小的單位,要么是0,要么是1。與碼率類似,比特率與音、視頻壓縮的關系,簡單的說就是比特率越高,音、視頻的質量就越好,但編碼后的文件就越大;如果比特率越低則文件越小。

碼率控制方法

碼率控制是指視頻編碼中決定輸出碼率的過程,常用的碼率控制方法有:

  • VBR(Variable Bitrate):動態比特率,也就是沒有固定的比特率,音視頻壓縮軟件在壓縮時根據音視頻數據的復雜程度即時確定使用什么比特率,這是以質量為前提兼顧文件大小的方式。

  • CBR(Constant Bitrate):固定比特率,指文件從頭到尾都是一種位速率。相對于VBR和ABR來講,它壓縮出來的文件體積很大,而且視頻質量相對于VBR和ABR不會有明顯的提高。

  • ABR(Average Bitrate):平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點創造了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。

    ABR在一定的時間范圍內達到設定的碼率,但是局部碼率峰值可以超過設定的碼率,平均碼率恒定。ABR是VBR的改良版,能確保輸出平均碼率在合理范圍,且在這個范圍內,還是動態根據復雜度編碼,也是阿里云默認的編碼控制方式。

編碼格式

定義參考視頻編碼方式。主要包括無損編碼和有損編碼兩種。根據采樣定理,音頻編碼只能“無限接近”自然信號,故而所有的音頻編碼方式實質上都是有損的。在計算機領域中,通常約定能夠達到最高保真水平的PCM編碼為無損編碼。互聯網中常見的音頻編碼均為有損編碼,常見的編碼格式有MP3、AAC等。

采樣率

采樣率(Sample Rate),也稱為采樣速度或者采樣頻率,定義了每秒從連續信號中提取并組成離散信號的采樣個數,單位為赫茲(HZ)。采樣率是指將模擬信號轉換成數字信號時的采樣頻率,也就是單位時間內采樣多少點,采樣頻率越高聲音的還原就越真實越自然。

碼率

參考視頻編碼的“碼率”介紹。

聲道、聲道數

聲道(Sound Channel)是指聲音在錄制(或播放)時,在不同空間位置采集(或播放)的相互獨立的音頻信號。所謂聲道數,也就是聲音錄制時的音源數量或播放時的揚聲器數量。

UTC時間(ISO 8601標準時間格式)

UTC時間指的是協調世界時,又稱世界統一時間、世界標準時間、國際協調時間。由于英文(CUT)和法文(TUC)的縮寫不同,作為妥協,簡稱UTC。協調世界時是以原子時秒長為基礎,在時刻上盡量接近于世界時的一種時間計量系統。中國內地采用ISO 8601-1988的《數據元和交換格式信息交換日期和時間表示法》(GB/T 7408-1994)稱之為國際協調時間。

如無特別指定,阿里云視頻點播默認返回的時間字段或接口請求的時間參數都為UTC時間,時間格式按照ISO8601標準表示,格式為:YYYY-MM-DDThh:mm:ssZ。例如:2017-01-11T12:00:00Z 表示北京時間2017年1月11日20點0分0秒。注:北京時間與UTC的時差為+8,也就是UTC+8。