當前位置:首頁 » 操作系統 » 灰度世界演算法

灰度世界演算法

發布時間: 2022-02-24 18:28:03

㈠ HDV 和HVD分別是什麼,詳細一點,包括他們的公司都解釋一下,謝謝了!

[轉貼]解析DVD、HDV、EVD、HVD的編碼技術

一、國際音頻編碼技術現狀和發展趨勢

目前,國際運動圖像專家組(MPEG)已經推出了幾種音頻編碼技術。其中MPEG-1(ISO/IEC11172-3)按照編碼復雜度分三層編碼機制,支持采樣率為32、44.1和48KHz的單聲道(mono)及雙聲道(stereo或Dual mono)編碼。第3層(MP3)在對雙聲道立體聲編碼時,在128Kbit/s對絕大多數音樂編碼可達到接近CD的音質效果,成為網路音樂和便攜電子設備的首選標准。MPEG-2BC(ISO/IEC13818-3)則是對MPEG-1的向後兼容多聲道擴展方案,並增加了一個「低頻效果」聲道從而提升至5.1個聲道編碼,且支持16、22.5和24KHz采樣音頻信號編碼。標志MPEG的最高技術水平的MPEG-2 Advanced Audio Coding (ISO/IEC13818-7AAC)在采樣率為8~96KHz下提供了1~48個聲道可選范圍的高質量音頻編碼。它適用於從比特率在8kbit/s單聲道的電話音質到160kbit/s多聲道高質量音頻編碼。用AAC對單聲道音頻編碼,在64Kbit/s下對絕大多數音樂編碼可達到接近CD的音質效果。因此和MP3的單聲道96Kbit/s相比,編碼效率已經有了很大提高,被認為是下一代音頻編碼標准。

在多聲道環繞立體聲編碼方面,美國杜比實驗室的AC-3提供對32、44.1和48KHz采樣,從單聲道到5.1環繞立體聲的音頻信號的編碼,並支持碼率范圍從32kbit/s的單聲道碼流到640kbit/s的多聲道高質量音頻碼流。目前,DolbyAC-3已經憑借其良好的聲場和聲像重現能力,贏得了電影、家庭影院、DVD和數字電視伴音等領域的廣泛應用,成為事實上的國際標准。

其他優秀的音頻編碼技術,如索尼的ATARC、貝爾實驗室的PAC和微軟的WMA等,都獲得了相當廣泛的應用。

目前,從國際數字音頻應用的發展來看,數字音頻編碼技術已經在互聯網、廣播、個人消費電子產品和數字影視等領域獲得了廣泛的應用,隨著3G技術的興起,正在進入移動通信領域。因此,新一代的數字音頻編碼技術在傳輸的可靠性、對帶寬的要求和版權的安全性等方面的要求更高。

中國在數字音頻編碼領域起步較晚,目前已經開展數字音頻編碼技術研究的大學有清華大學、天津大學、西安電子科技大學、哈爾濱工業大學、華南理工大學、東南大學和北京郵電大學等,還沒獲得較成熟和完整的成果。

二、圖像視頻編碼的國際標准及技術特點

近10年來,圖像編碼技術得到了迅速發展和廣泛應用,關且日臻成熟,其標志就是幾個關於圖像編碼的國際標準的制定,即國際標准化組織ISO和國際電工委員會IEC關於靜止圖像的編碼標准JPEG、國際電信聯盟ITU-T關於電視電話/會議電視的視頻編碼標准H261,H.263和ISO/IEC關於活動圖像的編碼標准MPEG-1,MPEG-2和MPEG-4等。這些標准圖像編碼演算法融合了各種性能優良的圖像編碼方法,代表了目前圖像編碼的發展水平。

1、JPEG(Joint Photographic Expert Group)

JPEG是ISO/IEC聯合圖像專家組制定的靜止圖像壓縮標准,是適用於連續色調(包括灰度和彩色)靜止圖像壓縮演算法的國際標准。JPEC演算法共有4種運行模式,其中一種是基於空間預測(DPCM)的無損壓縮演算法,另外3種是基於DCT的有損壓縮演算法。

1)無損壓縮演算法,可以保證無失真地重建原始圖像。

2)基於DCT的順序模式,按從上到下,從左到右的順序對圖像進行編碼,稱為基本系統。

3)基於DCT的遞進模式,指對一幅圖像按由粗到細對圖像進行編碼。

4)分層模式。以各種解析度對圖像進行編碼,可以根據不同的要求,獲得不同解析度的圖像。

JEPG對圖像的壓縮有很大的伸縮性,圖像質量與比特率的關系如下:

a)1.5~2.0比特/像素:與原始圖像基本沒有區別(transparent quality)。

b)0.75~1.5比特/像素:極好(excellent quality),滿足大多數應用。

c)0.5~0.75比特/像素:好至很好(good to very good quality),滿足多數應用。

d)0.25~0.5比特/像素:中至好(moderate to very good quality),滿足某些應用。

2、JPEG-2000

與以往的JPEG標准相比,JPEG-2000壓縮率比JPEG高約30%,它有許多原先的標准所不可比擬的優點。JPEG-2000與傳統JPEG最大的不同,在於它放棄了JPEG所採用的以DCT變換為主的分塊編碼方式,而改為以小波變換為主的多解析度編碼方式。

首先,JPEG-2000能實現無損壓縮(lossless compression)。在實際應用中,有一些重要的圖像,如衛星遙感圖像、醫學圖像、文物照片等,通常需要進行無損壓縮。對圖像進行無損編碼的經典方法——預測法已經發展成熟,並作為一個標准寫入了JPEG-2000中。

JPEG-2000還有一個很好的優點就是誤碼魯棒性(robustness to bi terror)好。因此使用JPEG-2000的系統穩定性好,運行平穩,抗干擾性好,易於操作。

JPEG-2000能實現漸進運輸(progressive trans mission),這是JPEG-2000的一個極其重要的特徵。它可以先傳輸圖像的輪廓,然後逐步傳輸數據,不斷提高圖像質量,以滿足用戶的需要,這在網路傳輸中具有非常重大的意義。使用JPEG-2000下載一個圖片,用戶可先看到這個圖片的輪廓或縮影,然後再決定是否下載。而且,下載時可以根據用戶需要和帶寬來決定下載圖像質量的好壞,從而控制數據量的大小。

JPEG-2000另一個極其重要的優點就是感興趣區(ROI,Region Of Interest)特性。用戶在處理的圖像中可以指定感興趣區,對這些區域進行壓縮時可以指定特定的壓縮質量,或在恢復時指定特定的解壓縮要求,這給人們帶來了極大的方便。在有些情況下,圖像中只有一小塊區域對用戶是有用的,對這些區域採用高壓縮比。在保證不丟失重要信息的同時,又能有效地壓縮數據量,這就是感興趣區的編碼方案所採取的壓縮策略。基於感興趣區壓縮方法的優點,在於它結合了接收方對壓縮的主觀要求,實現了互動式壓縮。

3、MPEG-1

國際標准化組織ISO/IEC的運動圖像專家組MPEG(Moving Picture Expert Group)一直致力於運動圖像及其伴音編碼標准化工作,並制定了一系列關於一般活動圖像的國際標准。1993年制定的MPEG-1標準是針對1.5Mbit/s速率的數字存儲媒體運動圖像及其伴音編碼制定的國際標准,該標準的制定使得基於CD-ROM的數字視頻以及MP3等產品成為可能。MPEG-1的帶寬最多為1.5Mbit/s,其中11Mbit/s用於視頻,128Kbit/s用於音頻,其餘帶寬用於MPEG系統本身。

為了追求高的壓縮效率,去除圖像序列的時間冗餘度,同時滿足多媒體等應用所必須的隨機存取要求,MPEG-1視頻把圖像編碼分成I幀、P幀、B幀和D幀共4種類型。I幀為幀內編碼幀(intra coded frame),編碼時採用類似JPEG的幀內DCT編碼,I幀的壓縮率是幾種編碼類型中最低的。P幀為預測編碼幀(predictive coded frame),採用前向運動補償預測和誤差的DCT編碼,由其前面的I或P幀進行預測。B幀為雙向預測編碼幀(bi-directionally predictive coded frame),採用雙向運動補償預測和誤差的DCT編碼,由前面和後面的I或P幀進行預測,所以B幀的壓縮效率最高。D幀為直流編碼幀(Dc coded frame),只包含每個塊的直流分量。MPEG-1採用運動補償支除圖像序列時間軸上的冗餘度,可使對P幀和B幀圖像的壓縮倍數比I幀提高很多。

4、MPEG-2

MPEG組織1995年推出的MPEG-2標準是在MPEG-1標准基礎上的進一步擴展和改進,主要是針對數字視頻廣播、高清晰度電視和數字視盤等制定的4~9Mbit/s運動圖像及其伴音的編碼標准,MPEG-2是數字電視機頂盒與DVD等產品的基礎。MPEG-2系統要求必須與MPEG-l系統向下兼容,因此其語法的最大特點在於兼容性好並可擴展。MPEG-2的目標與MPEG-1相同,仍然是提高壓縮比,改善音頻、視頻質量,採用的核心技術還是分塊DCT和幀間運動補償預測技術。MPEG-2視頻允許數據速率高達100Mbit/s,支持隔行掃描視頻格式和許多高級性能。考慮到視頻信號隔行掃描的特點,MPEG-2專門設置了「按幀編碼」和「按場編碼」兩種模式,並相應地對運動補償和DCT方法進行了擴展,從而顯著提高了壓縮編碼的效率。考慮到標準的通用性,增大了重要的參數值,允許有更大的畫面格式、比特率和運動矢量長度。除此之外,MPEG-2視頻壓縮編碼還進行了以下擴展:

1)輸入/輸出圖像彩色分量之比可以是4∶2∶0,4∶2∶2,4∶4∶4。

2)輸入/輸出圖像格式不限定。

3)可以直接對隔行掃描視頻信號進行處理。

4)在空間解析度、時間解析度、信噪比方面的可分級性適合於不同用途的解碼圖像要求,並可給出傳輸上不同等級的優先順序。

5)碼流結構的可分級性,比如頭部信息、運動矢量等部分可以給予較高的優先順序,而對於DCT系數的高頻分量部分則給予較低的優先順序。

6)輸出碼率可以是恆定的也可以是變化的,以適應同步和非同步傳輸。

MPEG-2視頻是一系列的系統,每一個系統具有安排好的共性和兼容程度。它允許對四種源格式或者級別進行編碼,從簡單清晰度(CIF格式)到完全的高清晰度電視HDTV(High Definition Television)。除了源格式的這種靈活性外,MPEG-2還規定了解析度從低到高的4級5類共11種單獨的技術規范,同一種類不同級別間的圖像解析度和編碼速率相差甚遠。表2給出了MPEG-2允許的級別和類的組合。

5、MPEG-3

MPEG-3是ISO/IEC最初為HDTV開發的編碼和壓縮標准,它要求傳輸速率在20Mbits/sev-40Mbits/sec間,但這將使畫面有輕度扭曲。不過由於MPEG-2的出色性能表現,已能適用於HDTV,使得原打算為HDTV設計的MPEG-3,還沒出世就被扼殺在搖籃中了。

6、MPEG-4

1992年11月,MPEG專家組決定開發新的適應於極低碼率的音頻/視頻(AV,Audio-Visual)編碼的國際標准,即MPEG-4。對於學術界來說,極低碼率(即小於64Kbit/s)是視頻編碼標準的最後一個比特率范圍。

MPEG-4專家組深入分析了AV領域中電視(television)、計算機(computer)、通信(communication)以及其交叉融合的發展趨勢後,認為MPEG-4應該提供用於通信的新方式,其核心是基於內容content-based)的AV信息存儲、處理與操作,支持交互性、高壓縮比以及通用存儲性等功能。同時在其結構上應具有適應性與可擴展性,以適應硬、軟體技術的不斷發展,便於及時融合新的技術。

相對於MPEG的前兩個壓縮標准,MPEG-4已不再是一個單純的視頻音頻編解碼標准,它將內容與交互性作為核心,從而為多媒體提供了一個更為廣闊的平台。它更多定義的是一種格式和框架,而不是具體的演算法,這樣人們可以在系統中加入許多新的演算法。除了一些壓縮工具和演算法外,各種各樣的多媒體技術如圖像分析與合成、計算機視覺、語音合成等也可以充分應用於編碼中。

H.261是ITU-T針對可視電話和會議電視、窄帶ISDN等要求實時編解碼和低延時應用提出的一個編碼標准。該標准包含的比特率為p*64Kbit/s,其中p是一個整數,取值范圍為1~30,對應比特率為64Kbit/s~92Mbit/s。

7、H.261

H.261標准大體上分為兩種編碼模式:幀內模式和幀間模式。對於緩和運動的人頭肩像,幀間編碼模式將佔主導位置;而對畫面切換頻繁或運動劇烈的序列圖像,則幀間編碼模式要頻繁地向幀內編碼模式切換。

為了減少信道誤碼,採用一種叫做BCH(511,493)的糾錯編碼方式。這種糾錯碼可以在493比特中自動糾正2比特的錯誤。按H261規定,源編碼器必須具備糾錯編碼的功能,而糾錯編碼是選用的。

8、H.263

1995年,ITU-T總結當時國際上視頻圖像編碼的最新進展,針對低比特率視頻應用制定了H.263標准,該標准被公認為是以像素為基礎的採用第一代編碼技術的混合編碼方案所能達到的最佳結果。隨後幾年中,ITU-T又對其進行了多次補充,以提高編碼效率,增強編碼功能。補充修訂的版本有1998年的H.263+,2000年的H263++。H.263系列標准特別適合於PSTN網路、無線網路與網際網路等環境下的視頻傳輸。

H.263已被幾種可視電話採納為終端標准,如支持PSTN與無線網的H.324,支持N-ISDN的H.320,支持B-ISDN的H.310等。H.263信源編碼演算法的核心仍然是H.261標准中採用的DPCM/DCT混和編碼演算法,原理框圖也和H.261十分相似。

9、MPEG-7與MPEG-21

MPEG-7是為「多媒體內容描述介面」,是用於信息表示的,MPEG-7是「基於語義的表示」。MPEG-7定義了一個描述符標准集,用於描述各種類型的多媒體信息,與之相應的描述方案可以用於規范多媒體描述符的生成和不同描述符之間的有機聯系。

這些描述符與指定的多媒體對象的內容緊密聯系,採用提取對象特徵的方法為實現基於內容和語義的准確檢索提供介面。在此基礎上,MPEG-7定義了一種描述定義語言(DDL,Description Definition Language)用於指定和生成描述方案,即希望提出新的視頻、音頻信息表示方式,它既不同於基於波形和基於壓縮的表示方式(如MPEG-1和MPEG-2),又不同於基於對象的表示方式(MPEG-4)。這一表示方式允許對信息的含義進行一定程度的解釋,它可以被一個設備或計算機解碼器存取。MPEG-7的目的在於提供一個標准化的核心技,以便描述多媒環境下的視頻和音頻內容,最終使視頻和音頻搜集像文本搜集一樣簡單方便。

MPEG-7可以描述的多媒體對象范圍極其廣泛,其核心部分DDL語言將充分吸收現有的各種媒體描述語言的特點,以達到對多媒體數據的普遍適應性。MPEG-4中提出的基於對象編碼的思想將成為對多媒體資料庫中的視頻、音頻對象進行處理(包括特徵提取、壓縮編碼等)的基本手段。而MPEG-7的多媒體內容描述功能對MPEG-1,MPEG-2,MPEG-4起到性能提高和功能擴展的作用。

最後,MPEG-7將提供內容的描述而不是內容本身,它將不能替代已有的MPEG標准(MPEG-1,MPEG-2,MPEG-4),僅僅是已有3個標準的補充。

正在研製的新標准MPEG-21是一個支持通過異構網路和設備,使用戶透明方便地使用多媒體資源的標准,其目的是建立一個交互的多媒體對象,實現多種業務模型,包括對版權和交易的自動管理,對內容使用者隱私的尊重等。

三、國內現有碟機的使用的技術

1、DVD技術

據調查,不少DVD影碟機不能實現真正的AC-3解碼功能,而分別採用以下一些方式來代替:

1)、簡單的兩聲道。不管碟片上音頻數據是否按照AC-3進行編碼,均以兩路混合音頻輸出。由於省略了其餘四個聲道的音頻輸出,在硬體成本上大大降低,且向Dobly公司外納交專利費用比真杜比AC-3解碼大為減少,是DVD影碟機的低價位方案。在這種方式下,用戶僅僅只能聽到簡單的左右兩路聲道效果。如果要欣賞真正的杜比AC-35.1聲道環繞聲效果,還需外接一台帶同軸或光纖輸入端子且具有AC-3解碼功放,其市場價格約2000元,即另購一台DVD影碟機的價格。

2)、有六路輸出端子的兩聲道。這種方式又稱「假六聲道」,它實際上只有3組相同的兩聲道輸出,是雙聲道機的簡單復制,根本無法實現真正的杜比AC-35.1聲道的機器類似,往往容易成炒正當利益的來源。因此,消費者在選購時應仔細加以甄別。

3)、虛擬模擬AC-3聲道。該方式通過一顆聲場處理晶元將兩聲道音頻經過疊加、相消等軟體演算法模擬出一種類似於AC-35.1聲道解碼輸出呢?杜比AC-35.1聲道的效果,但由於其音源全部來自於兩路主聲道,聲場的表現力、層次感較真正AC-3解碼都要遜色得多,且極易混淆視聽,侵害消費者利益。

那麼,什麼是真正杜比AC-35.1聲道解碼輸出呢?杜比AC-3是一種專門為多聲道數字式音響設計的感性編碼技術,它將音質學和先進的數字信號處理技術結合在一起,具有前所未有的高效率、高質量和多面性。按多聲道的形式,杜比AC-3提供了五個全音頻聲道,其排列方法通常稱為3/2結構:三個前排聲道(左、中、右)加上兩個環繞聲道,還有一個低音頻效應的聲道。通俗地說,就是前置左、前置右、中置、環繞左、環繞右及重低音,也就是所謂「5.1」聲道。相對於模擬式的AC-2(杜比Prologic),杜比AC-3具有兩個完全獨立的環繞聲道,每一聲道都能提供於前排三個聲道完全相同的全頻帶保真音響。因而真實再現上述效應的解碼就是真正意義的杜比AC-35.1聲道解碼。

2、HDV技術

HD12壓縮編碼系統是北京凱誠高清技術有限公司開發的針對HDV高清數字電影格式激光多媒體碟片的壓縮編碼系統。該系統採用優化的MPEG2視頻編碼格式,在原來MPEG2的基礎上,採用重新定義宏塊大小、重新設定量化長度、優化熵編碼和優化運動補償的方式,利用目前在半導體領域中取得的最新進展,憑借半導體晶元的強大處理能力,實現了更高的壓縮比和更好的還原效果。

HD12壓縮編碼系統依託北京凱誠高清技術有限公司技術人員多年的技術積累,歷時2年多的時間才開發完成。該系統不僅具有高效的實時壓縮功能,而且還能夠完成圖像的清晰化處理和修補,字幕和配音的生成疊加等其他各種編輯功能。

利用凱誠高清技術有限公司開發的HD12壓縮編碼系統能夠實現對高清視頻流的高效壓縮,對於目前高清視頻節目匱乏的現狀提供了一個很好的技術平台,能夠充分滿足目前高清視頻節目的壓縮需求,從而可以讓廣大消費者能夠欣賞到更多更好的高清視頻節目。

HDV播放機可以兼容CD、VCD、DVD等光碟,但是HDV光碟在普通的VCD、DVD等影碟機上看不了。也就是說,HDV光碟只能與HDV高清數字電影播放機相匹配,如果沒有機器,買回的光碟只能等於是一張廢碟。

據凱誠高清技術有限公司開發人員說:「因為HDV碟片使用的是超強壓縮技術,可以在一張盤上存放3-5部高畫質的電影節目,這種技術目前在國內只有他們的生產廠商掌握,而且技術都設有加密,外人根本無法竊取。」

3、EVD技術

阜國的音頻壓縮技術始於公司成立之初(2000年3月),並作為「新一代高密度數字激光視盤系統EVD®」項目中的子課題,經過了起步、發展和成熟幾個階段,目前已經申請了近二十項核心專利技術。這些專利已經形成了一套高效的、自主知識產權的基於多解析度分析的音頻編碼技術方案EAC,在2001年7月江蘇省電子產品監督檢驗所組織的主觀音質評價實驗中獲得了與會專家的高度的評價。

目前,EAC編碼技術可以提供單聲道、雙聲道立體聲、5.1環繞立體聲、多采樣率和多碼率下的編解碼方案,編碼效率進一步提高,並已經成為EVD®規范的音頻編碼技術標准。

為了進一步提高編碼效率,特別是在極低碼率下的音頻質量,在自主研發的同時,我們也加強了和國外掌握最先進音頻編碼技術企業的技術合作。經過長期的技術合作,北京阜國數字技術有限公司將和擁有世界最先進水平帶寬擴展技術的瑞典-德國Coding Technologies公司成立合資企業,共同開發並推廣EAC Plus技術。EAC Plus技術將在EAC技術基礎上,進一步提高中國的音頻編碼技術水平,使中國音頻編碼技術達到國際領先水平。

我們知道,音頻編碼技術分可以從很多角度去分類:有損和無損、波形和參數、窄帶和寬頻,以及恆定碼率和變率等等。但是,音頻編碼所處理的信號類型可以簡單的分成兩類:緩變成分和瞬變成分。當然,從模型的角度可分成弦類成分、瞬變成分和雜訊成分,由於我們目前集中於波形編碼技術研究,故不做如此劃分。可以說,所有的波形編碼技術都在努力尋求在一種對緩變成分和瞬變成分都有盡可能高的效率的編碼技術,同時保證可以接受的編碼復雜度。問題的原因在於人耳對不同信號的聽覺特性。雖然從理論上講,人耳對信號的響應是非常復雜的生理和心理問題,但在編碼的過程中,突出的體現為兩個矛盾。對緩變成分,人耳響應的頻率解析度較高,而時間解析度較低;對瞬變成分則表現為較低的頻率解析度和較高的時域解析度;且這種特性隨信號的不同而不同。較高的頻率解析度對應著較高的編碼效率,但同時有較差的預回聲抑制能力;較高的時間解析度則有較好的預回聲抑制能力,但編碼效率較低。

EAC在設計和實現的過程中,一直在努力通過一種更自然的處理方式,來處理/編碼各種音頻信號,這是EAC設計的基本技術路線。並具體表現在EAC一直遵循了多解析度的分析機制,努力追求在一個統一的濾波框架中更高效的編碼各種類型的音頻信號。

4、HVD技術

4月28日,國內首個高清晰度視頻光碟產業聯盟(簡稱HVD聯盟)在上海隆重成立。作為國內新一代高清晰視盤機的重要生產開發商,基於其在高清DVD領域的巨大影響力,清華同方順利成為該聯盟的首批成員單位。

HVD聯盟是以具有自主知識產權的IC等核心關鍵件、自主開發的整機系統及技術為紐帶,由整機製造商、內容提供商、出版發行商、核心晶元等廠商以及相關的大學、研究所自願組成的產業聯合體。聯盟的奮斗目標是:通過產業鏈的有效整合,有序、高效、持續地推進HVD技術標准、市場和產業的發展,為我國影碟機行業從「製造大國」邁向「技術強國」做出貢獻。

聯盟的近期目標是發展、推進具有「高清」水平的利用紅光物理格式的HVD整機內容和碟片產業,讓HVD成為DVD的升級換代產品。「HVD聯盟」首批成員單位有18家,主要任務是:建立、保護「HVD」知識產權機制;聯盟內部實行知識產權共享;開展「HVD」標識授權和格式驗證工作,保證HVD整機和碟片的統一性;做好碟片的加密和防拷貝工作;組織召開各類技術介紹會、產品推廣會、格式標准發布會等

依託著自身強大的科研實力,經過三年多來的不斷探索,目前清華同方已經成為國內掌握高清影碟機技術的極少數的幾家生產商之一。作為清華同方影碟機產品的最新科技代表,不久前,清華同方已經推出了具有最高科技含量的DVP-i919高清DVD,可實現480P、720P逐行掃描,並可實現1920*1080i隔行掃描。同時作為目前DVD的替代產品,i919還支持MPEG4影片播放,同時設置USB1.1介面,可直接同諸多數碼產品進行數據交換和查看。從近期該公司的銷售數據看,清華同方高清產品市場反應不俗,目前已與市場上同期推出的EVD、HDV等換代產品並駕齊驅。

此次清華同方成功加入「HVD聯盟」,相信這將為其引領高清DVD時代贏得更多先機,並將對今後的高清DVD行業走向產生深遠影響。

HVD是英文High-definition Versatile Disc的縮寫。HVD集強大的功能、清晰的圖像、低廉的價格、優越的向下兼容能力、關鍵技術、自主知識產權於一身,HVD技術已向國家知識產權局申請6項發明專利。

HVD支持多種輸入格式的介面:1080i/720p/576p/576i/480i/VGA/SVGA,符合視頻、Y/C、YPbPr.HVD的水平清晰度和垂直清晰度均達到720線的高清標准。

一張DVD9一樣容量的大小光碟中,HVD可以存放150分鍾的高清晰度電影。

5、FVD技術

目前版本的FVD規格是使用650nm紅光雷射;NA0.6~0.65,其物理規格比DVD容量提升;單面單層的FVD碟片容量可達5.4GB~6GB;編碼方式第一代初期先用8/16編碼,未來第二代則採用效率較高的8/15編碼方式及提高糾錯(ECC)的能力。在邏輯規格部份,採用微軟WindowMediaVideo-9(WMV-9)視頻壓縮技術可容納135分鍾1280x720p的高畫質節目,其中新開發的高畫質影音技術如:Menu動態&動態含背景,Program playback, Menu playback, Sub-picture-playback, Master-Slave playback等。此外,為達到保護智能財產的目的,亦將提供Advanced Encryption Standard(AES)Content Protection system防拷機制。

㈡ 怎麼通俗地理解張量

對Gradle通俗的理解:
軟體開發講究代碼復用,通過復用可以使工程更易維護,代碼量更少..... 開發者可以通過繼承,組合,函數模塊等實現不同程度上的代碼復用.但不知你有沒有想過,軟體開發也是一種工程作業,絕不僅僅是寫代碼,還涉及到工程的各種管理(依賴,打包,部署,發布,各種渠道的差異管理.....),你每天都在build,clean,簽名,打包,發布,有沒有想過這種過程,也可以像代碼一樣被描述出來, 也可以被復用.

㈢ 諾亞方舟的演算法具有哪些特性

諾亞方舟的演算法具有以下特性:有窮性、持續性和可行性。

㈣ 灰色預測理論的C/C++語言演算法實現

之前我想幫你答這個題的,後來想了想,不太可能,四個狀態隨機出現,在出現十次的前提下,預測第十一次將會出現什麼狀態,並且精準度要求 99.9%; 如果真有這個演算法,估計這個世界已經不是現在這個模樣了

㈤ 圖像處理、計算機視覺、機器學習與模式識別的聯系與區別

摘要 計算機視覺(computer vision),用計算機來模擬人的視覺機理獲取和處理信息的能力。就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺研究相關的理論和技術,試圖建立能夠從圖像或者多維數據中獲取『信息』的人工智慧系統。計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。

㈥ AWB是什麼意思

AWB是Automatic white balance的英文縮寫,意思是白平衡。

在日光燈的房間里拍攝的影像會顯得發綠,在室內鎢絲燈光下拍攝出來的景物就會偏黃,而在日光陰影處拍攝到的照片則莫名其妙地偏藍,其原因就在於「白平衡」的設置上,白平衡的作用就是在這些場景下恢復圖像的正常顏色。

(6)灰度世界演算法擴展閱讀:

自動白平衡

【釋義】:Automatic white balance的英文縮寫,在日光燈的房間里拍攝的影像會顯得發綠,在室內鎢絲燈光下拍攝出來的景物就會偏黃,而在日光陰影處拍攝到的照片則莫名其妙地偏藍,其原因就在於「白平衡」的設置上,白平衡的作用就是在這些場景下恢復圖像的正常顏色。

【基本解釋】:圖像3A演算法(AWB、AE、AF)中的一個。



㈦ 圖像變換的目的是什麼,常用的圖像變換演算法有哪些

圖像變換的目的為了有效和快速地對圖像進行處理和分析,需要將原定義在圖像空間的圖像以某種形式轉換到另外的空間,利用空間的特有性質方便地進行一定的加工,最後再轉換回圖像空間以得到所需的效果。

圖像變換是對圖像處理演算法的總結,它可以分為四個部分:空域變換等維度演算法,空域變換變維度演算法,值域變換等維度演算法和值域變換變維度演算法。

其中空域變換主要指圖像在幾何上的變換,而值域變換主要指圖像在像素值上的變換。等維度變換是在相同的維度空間中,而變維度變換是在不同的維度空間中,例如二維到三維,灰度空間到彩色空間。

(7)灰度世界演算法擴展閱讀:

相關延伸:圖像簡介

21世紀是一個充滿信息的時代,圖像作為人類感知世界的視覺基礎,是人類獲取信息、表達信息和傳遞信息的重要手段。數字圖像處理,即用計算機對圖像進行處理,其發展歷史並不長。數字圖像處理技術源於20世紀20年代,當時通過海底電纜從英國倫敦到美國紐約傳輸了一幅照片,採用了數字壓縮技術。

首先數字圖像處理技術可以幫助人們更客觀、准確地認識世界,人的視覺系統可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高;

可以識別上千種顏色,但很多情況下,圖像對於人眼來說是模糊的甚至是不可見的,通過圖象增強技術,可以使模糊甚至不可見的圖像變得清晰明亮。

在計算機中,按照顏色和灰度的多少可以將圖像分為二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。大多數圖像處理軟體都支持這四種類型的圖像。

中國物聯網校企聯盟認為圖像處理將會是物聯網產業發展的重要支柱之一,它的具體應用是指紋識別技術。

㈧ 在圖像處理中有哪些演算法

1、圖像變換:

由於圖像陣列很大,直接在空間域中進行處理,涉及計算量很大。採用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散餘弦變換等間接處理技術,將空間域的處理轉換為變換域處理,可減少計算量,獲得更有效的處理。它在圖像處理中也有著廣泛而有效的應用。

2、圖像編碼壓縮:

圖像編碼壓縮技術可減少描述圖像的數據量,以便節省圖像傳輸、處理時間和減少所佔用的存儲器容量。

壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進行。

編碼是壓縮技術中最重要的方法,它在圖像處理技術中是發展最早且比較成熟的技術。

3、圖像增強和復原:

圖像增強和復原的目的是為了提高圖像的質量,如去除雜訊,提高圖像的清晰度等。

圖像增強不考慮圖像降質的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節明顯;如強化低頻分量可減少圖像中雜訊影響。

4、圖像分割:

圖像分割是數字圖像處理中的關鍵技術之一。

圖像分割是將圖像中有意義的特徵部分提取出來,其有意義的特徵有圖像中的邊緣、區域等,這是進一步進行圖像識別、分析和理解的基礎。

5、圖像描述:

圖像描述是圖像識別和理解的必要前提。

一般圖像的描述方法採用二維形狀描述,它有邊界描述和區域描述兩類方法。對於特殊的紋理圖像可採用二維紋理特徵描述。

6、圖像分類:

圖像分類屬於模式識別的范疇,其主要內容是圖像經過某些預處理(增強、復原、壓縮)後,進行圖像分割和特徵提取,從而進行判決分類。

圖像分類常採用經典的模式識別方法,有統計模式分類和句法模式分類。

(8)灰度世界演算法擴展閱讀:

圖像處理主要應用在攝影及印刷、衛星圖像處理、醫學圖像處理、面孔識別、特徵識別、顯微圖像處理和汽車障礙識別等。

數字圖像處理技術源於20世紀20年代,當時通過海底電纜從英國倫敦到美國紐約傳輸了一幅照片,採用了數字壓縮技術。

數字圖像處理技術可以幫助人們更客觀、准確地認識世界,人的視覺系統可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高,可以識別上千種顏色,

但很多情況下,圖像對於人眼來說是模糊的甚至是不可見的,通過圖象增強技術,可以使模糊甚至不可見的圖像變得清晰明亮。

㈨ 25%的灰度RGB是多少

25%的灰度RGB(25,25,25)。

灰度就是沒有色彩,RGB色彩分量全部相等。如果是一個二值灰度圖像,它的像素值只能為0或1,我們說它的灰度級為2。用個例子來說明吧:一個256級灰度的圖像,如果RGB三個量相同時,如:RGB(100,100,100)就代表灰度為100,RGB(50,50,50)代表灰度為50。

彩色圖像的灰度其實在轉化為黑白圖像後的像素值(是一種廣義的提法),轉化的方法看應用的領域而定,一般按加權的方法轉換,R, G,B 的比一般為3:6:1。

任何顏色都由紅、綠、藍三基色組成,假如原來某點的顏色為RGB(R,G,B),那麼,可以通過下面幾種方法,將其轉換為灰度:

1、浮點演算法:Gray=R*0.3+G*0.59+B*0.11

2、整數方法:Gray=(R*30+G*59+B*11)/100

3、移位方法:Gray =(R*77+G*151+B*28)>>8;

4、平均值法:Gray=(R+G+B)/3;

5、僅取綠色:Gray=G;

通過上述任一種方法求得Gray後,將原來的RGB(R,G,B)中的R,G,B統一用Gray替換,形成新的顏色RGB(Gray,Gray,Gray),用它替換原來的RGB(R,G,B)就是灰度圖了。

(9)灰度世界演算法擴展閱讀


RGB格式:

對一種顏色進行編碼的方法統稱為「顏色空間」或「色域」。用最簡單的話說,世界上任何一種顏色的「顏色空間」都可定義成一個固定的數字或變數。

RGB(紅、綠、藍)只是眾多顏色空間的一種。採用這種編碼方法,每種顏色都可用三個變數來表示-紅色綠色以及藍色的強度。記錄及顯示彩色圖像時,RGB是最常見的一種方案。

但是,它缺乏與早期黑白顯示系統的良好兼容性。因此,許多電子電器廠商普遍採用的做法是,將RGB轉換成YUV顏色空間,以維持兼容,再根據需要換回RGB格式,以便在電腦顯示器上顯示彩色圖形。

網頁格式:

由於網頁(WEB)是基於計算機瀏覽器開發的媒體,所以顏色以光學顏色RGB(紅、綠、藍)為主。網頁顏色是以16進制代碼表示,一般格式為#DEFABC (字母範圍從A-F,數字從0-9 );

如黑色,在網頁代碼中便是:#000000(在css編寫中可簡寫為#000)。當顏色代碼為#AABB11時,可以簡寫為#AB1表示,如#135與#113355表示同樣的顏色。

RGB1、RGB4、RGB8都是調色板類型的RGB格式,在描述這些媒體類型的格式細節時,通常會在BITMAPINFOHEADER數據結構後面跟著一個調色板(定義一系列顏色)。它們的圖像數據並不是真正的顏色值,而是當前像素顏色值在調色板中的索引。

以RGB1(2色點陣圖)為例,比如它的調色板中定義的兩種顏色值依次為0x000000(黑色)和0xFFFFFF(白色)…(每個像素用1位表示)表示對應各像素的顏色為:黑黑白白黑白黑白黑白白白。

㈩ 一幅灰度圖像,矩陣為512*512,灰度級別為256,在計算機中保存,圖像數據佔多少位元組

2的8次方=256,8個bit位可表示一個像素,8bit=1位元組

理論上是512*512=262144(byte)=256(kb)

不同格式的圖像壓縮演算法不一樣,所以實際大小也不同
BMP是無損壓縮,512*512灰度圖實際大小就是256kb
其它格式大小比BMP格式要小,但是會犧牲一些定的圖像質量

圖像壓縮無非就是犧牲圖像質量來成全圖像大小,或是犧牲圖像大小來成全圖像質量,魚與熊掌不可兼得,達到圖像品質與圖像大小之間的最佳點就成了圖像壓縮的追求。

當然了,現在的圖像演算法已經很成熟了,不同的應用採用不同的格式,如果你能開發一個超越現在圖像壓縮的演算法,恭喜你,你將獲得諾貝爾獎,以表彰你在圖像傳輸方面的巨大貢獻,使世界人民的生活更加豐富多彩。

熱點內容
安卓上哪裡下大型游戲 發布:2024-12-23 15:10:58 瀏覽:189
明日之後目前適用於什麼配置 發布:2024-12-23 14:56:09 瀏覽:56
php全形半形 發布:2024-12-23 14:55:17 瀏覽:829
手機上傳助手 發布:2024-12-23 14:55:14 瀏覽:733
什麼樣的主機配置吃雞開全效 發布:2024-12-23 14:55:13 瀏覽:830
安卓我的世界114版本有什麼 發布:2024-12-23 14:42:17 瀏覽:711
vbox源碼 發布:2024-12-23 14:41:32 瀏覽:279
詩經是怎麼存儲 發布:2024-12-23 14:41:29 瀏覽:661
屏蔽視頻廣告腳本 發布:2024-12-23 14:41:24 瀏覽:420
php解析pdf 發布:2024-12-23 14:40:01 瀏覽:820