Playback Designs總裁 Andreas Koch解放DSD的實力,除了1 bit解碼之外的秘密

【全文輯錄自「音響論壇」】

上次專訪Playback Designs總裁Andreas Koch,已經是五年前的事了,當年與大師一席談話,完全解開了我對於數位訊源與DSD解碼的許多疑問,至今依然令我印象深刻、獲益良多。五年之後,Playback Designs推出全新Sonoma系列,終於盼到Andreas再度來台,我當然不放過這次機會,從Andreas口中問出更多獨家技術與設計理念,以下就是這次訪談的完整記錄。

Sonoma是你為Sony所設計的DSD錄音剪輯工作站的名稱,新推出的Sonoma系列與當年的Sonoma有何關連?

主要原因是這次Sonoma系列的許多核心技術,都是移植自Sonoma工作站,兩者有許多共同之處,所以才引用了Sonoma這個型號。
Sonoma是我幫Sony開發的32軌SACD錄音與剪輯工作站,目前仍是唯一「真正1 bit」DSD錄音與剪輯設備。這個名稱是Sony One-bit Mastering Audio Station的縮寫,許多SACD內頁都註明使用Sonoma錄製,音響迷熟都悉這個名稱,這也是我採用Sonoma為新產品命名的原因之一。除此之外,Sonoma也是舊金山的葡萄酒產區,我的家就在那裡,與當地的釀酒師熟識。原本我打算在每一部Sonoma產品的包裝中附贈一瓶Sonoma產的紅酒,那是品質可比DSD的好酒啊!可惜礙於許多國家的法規限制,這個想法難以實現。

全新Sonoma系列的機箱都頗為小巧,與之前的MPS-5、MPS-3 SACD唱盤有何不同?

因為日本Esoteric不再對外銷售他們的SACD轉盤機構,所以MPS-5、MPS-3在五年前就已停產。原本Sonoma系列將要推出的旗艦SACD唱盤,也因為這個變化而延後推出。目前推出的Merlot DAC等產品,其實只是Sonoma的入門等級。我一直想推出體積較小、價格合理的產品,讓更多人可以體驗DSD重播的真正實力,Merlot DAC等小型化的產品,就是依循這個理念而推出。
Merlot的DSD解碼、時鐘控制技術都與MPS-5相同,但是線路較為簡化,MPS-5使用了三顆FPGA處理器,分別負責時鐘控制、升頻與DSD處理、面板邏輯控制;Merlot則用一顆FPGA負責所有數位運算。MPS-5的線路板分為數位、類比兩塊;Merlot則全部整合在一塊線路板,但數位、類比的接地仍清楚區隔。MPS-5的類比輸出採分砌式架構,Merlot的類比線路則接近MPS-3,但有大幅改良,線路面積更大,還加入耳擴線路,以及分砌式的類比音量控制。在等級上,Merlot介於MPS-5與MPS-3之間,更接近MPS-5一些,甚至有用家認為表現比MPS-5更好。

許多頂尖數位唱盤都採用Oppo的SACD轉盤機構,即將推出的Sonoma旗艦唱盤也會選擇Oppo嗎?

Oppo的SACD轉盤的確很可靠耐用,在前代MPS停產,新旗艦尚未推出的空窗期,我的確建議用家搭配Oppo播放機使用,還針對Oppo BDP-103推出了改裝模組,讓它可以直接輸出SACD的DSD訊號。不過這畢竟是權宜之計,Oppo的轉盤是為播放4K藍光片而設計,使用了超快速的處理器,解碼線路龐大,而且與顯示幕整合一體,很難單獨使用它的轉盤。此外Oppo的轉盤結構較為廉價,使用了太多塑料元件,我認為不符合高階唱盤的要求,所以即將推出的旗艦唱盤將會採用日本製的SACD轉盤機構。如果順利的話,今年五月慕尼黑音響展就會發表。

“ 1 bit DSD解碼先天沒有非線性失真,聲音更接近類比音質。”

你所研發的1 bit DSD解碼技術,與市售的Delta-sigma DAC晶片有何不同?

只有真正的1 bit DSD解碼,才能發揮DSD線性輸出的優勢,也才能跟PCM多位元解碼技術有所區隔。目前只有用FPGA晶片跑自行設計的演算法,才能做到真正的1 bit DSD解碼。市售Delta-Sigma DAC晶片則只有輸入端接收1 bit DSD訊號,接下來隨即轉換為多位元PCM,進行複雜的濾波處理,用陡峭的濾波線路完全濾除噪訊,測試規格雖然優異,但聽感上卻難以擺脫「數位聲」,喪失了DSD接近於類比音質的最大優勢。

為何廠製晶片不採用1 bit DSD解碼呢?

晶片廠最重視的要素有二,一是製造成本,二是規格數據。1 bit DSD解碼的噪訊太高,規格數據不好看,晶片廠怕客戶不買單,自然不會想要開發這種晶片。

難道1 bit DSD解碼的噪訊不會影響聽感嗎?

DSD大部分的噪訊都在人耳聽感範圍之外,就算落在可聞頻段,也會被人耳濾除,因為DSD的高頻噪訊是恆定的,不會隨著音樂訊號變動,人耳機制可以輕易的過濾掉這種噪訊。這就像是空間中的空調噪音,只要音量低到一定程度,人耳就不會察覺。如果用陡峭的濾波線路將這些噪訊切掉,測試數據雖然漂亮,但是卻會製造更多非線性失真,對聽感傷害更大。所以我一直堅持數位濾波線路不能只靠儀器測試,更重要的是以實際聽感作為設計的標準。

PCM解碼又有什麼問題?

多位元PCM解碼的每一個位元比重都不同,無法避免非線性問題。以PCM解碼最理想的Ladder DAC架構為例,就算使用了最精密的電阻建構R2R解碼陣列,也不可能保證每一個電阻的數值都剛好是前一個電阻的兩倍,總會有些微誤差,還會受到溫度變化的影響,這些變數都會造成非線性失真,對聽感造成嚴重的影響。
PCM解碼的另一個問題是使用了Brickwall濾波線路。以44.1kHz的PCM訊號為例,Brickwall濾波線路一刀切掉了20kHz以上的頻率,不但不符合人耳的聽感特性,而且還會產生更嚴重的Pre Ringing問題。Pre Ringing很類似聲波的繞射現象,訊號會在20kHz忽然截斷的銳角處,產生另一個繞射波,讓我們在實際訊號尚未播出前,就預先聽到還沒有產生的聲音,時間差即使只有10到15毫秒(毫秒=千分之一秒),但是人耳依然可以察覺這種不自然的聲響狀態,構成所謂「數位聲」的元兇。
反觀DSD解碼,因為只有一個位元,等於永遠只經過一顆電阻,先天架構就不會產生非線性失真,這是DSD相較於PCM解碼的最大優勢。除此之外,即使是最基本的一倍DSD(取樣率為CD的64倍,也稱為2.8MHz DSD或DSD64),雖然高頻延伸只到20kHz(20kHz以上會因為Noise Shapping而產生噪訊),但20kHz之後依然可以聽到些微訊息,訊息量的滾降是和緩的,沒有一刀切斷的銳角,不會產生Pre Ringing,聲音更為自然,也更符合人耳的聆聽狀態。

為何廠製DAC晶片不採用較為和緩的濾波線路呢?

現代許多DAC晶片藉由升頻大幅提高取樣頻率,的確可以搭配較為和緩的濾波線路,但是測試數據依然不夠理想,晶片廠擔心賣不出去,所以此類DAC晶片其實依然使用了Brickwall濾波線路,只不過將截斷點移到更高的頻率,Pre Ringing的時間差會縮短,對聽感有幫助,但是人耳仍可察覺,依然無法完全擺脫不自然的「數位聲」。

理論上96kHz的高解析PCM訊號,高頻延伸可達40kHz,在這種極高頻產生Pre Ringing,人耳也可以察覺嗎?

日本曾有研究報告指出,人耳的聆聽範圍雖然是20Hz到20kHz,但是在聆聽暫態訊號(Transient signal)時,人耳其實是可以聽到100kHz以上的極高頻的。所以用Brickwall濾波切掉40kHz以上高頻訊號,不但切掉了某些我們事實上可以聽到訊號,其所產生的Pre Ringing也依然可被人耳察覺。

Merlot DAC的液晶螢幕看似復古,但是這種螢幕本身不需要時鐘振盪器控制,不會干擾DAC的時脈,有助於降低時基誤差。

Merlot DAC的液晶螢幕看似復古,但是這種螢幕本身不需要時鐘振盪器控制,不會干擾DAC的時脈,有助於降低時基誤差。

所有進入Merlot DAC的PCM訊號,都會先轉換為DSD格式,再進行1 bit DSD解碼嗎?

是的,PCM會先轉換為DSD格式再解碼。不過在轉換之前,必須經過我開發的可變濾波技術先行處理,這種濾波演算法會即時分析PCM訊號的暫態變化狀態,即時切換不同的濾波線路。例如重播和緩的小提琴演奏,或是瞬間鐃鈸敲擊兩種不同的樂段,就必須搭配不同的濾波線路,才能徹底消除PCM的Pre Ringing問題,再生更接近於類比的聲音特質。
值得一提的是,這套濾波系統必須用特殊的測試訊號進行測試,如果用一般測試訊號,會得到很怪異的數據。這就是為何MPS-5當年推出時,有些媒體發現測試數據很差,但是聲音表現非常好的原因。

所以用一般電腦軟體進行DSD與PCM的轉換,效果可能不盡理想?

我不知道其他軟體的演算法是如何設計的,但是DSD與PCM的轉換並不只是轉換檔案格式而已,而是取樣率的轉換,本質上就不是無損的轉換,所以演算法影響重大。從DSD降轉為PCM問題不大,但是從PCM轉換為DSD,就必須注意PCM的暫態響應變化問題。

你曾經為文論述DSD256(四倍DSD取樣率,也稱為11.2MHz DSD或Quad DSD)的缺點,可否詳細說明原因?

SACD推出之時,一倍DSD的噪訊在20kHz出現,太接近人耳可聞頻段。兩倍DSD將噪訊推向40kHz,的確是一大進步。許多人以此類推,認為四倍取樣率的DSD256一定更好。但事實上,DSD256的高頻雖然進一步延伸到80kHz,但是對大多數錄音來說,40k到80kHz的極高頻訊息量微乎其微,對聽感幫助不大。但另一方面,取樣率越高,每一個取樣的訊息量越少,承受的恆定雜訊量卻並未減少,訊噪比因此大幅劣化。由此可證,DSD256的缺點已經大過優點,並非最理想的DAC解碼格式。我曾經做過實驗,用DSD256直接輸入1 bit DSD解碼線路,結果證明噪訊對聽感的確已經造成影響。
值得注意的是,DSD256雖然不適合DAC解碼,但是卻適用於錄音端的ADC轉換,因為類比轉換為數位的Delta-Sigma調變類似回授線路,回授時間必須越短越好。DSD256每一個取樣的時間是DSD128的一半,精確性因此比DSD128更高。此外DSD256更高的取樣率,對於轉換為PCM進行混音後製也有幫助。

既然如此,為何許多DAC依然支援四倍DSD?

因為他們使用的廠製DAC晶片已經完全將噪訊濾除,所以就算是對應八倍DSD,也不會察覺任何問題。可惜的是,這些DAC也因此無法展現DSD的真正實力,因為這些晶片的處理核心實際上都是PCM架構。

但是Merlot DAC為何也支援DSD256,會先將其轉為兩倍DSD再解碼嗎?

DSD256在解碼時雖然有缺陷,但是將原本的高取樣率丟棄太可惜,所以我沒有將其降轉為DSD128,而是另外開發一套演算法,藉此提升訊噪比。
其實DSD256的問題非常類似數位相機的感光元件,數位相機不斷往高畫素發展,但是在相同尺寸的感光元件中,畫素越高,每一個畫素接收到的進光量越少,由元件產生的恆定噪訊相較之下越大,此時必須搭配速度更快的處理器,才能消除噪訊提升畫質。簡單的說,數位相機的畫素提升,其實是跟著速度更快的處理器一同發展的。用數位相機的例子,或許更容易理解DSD取樣率提升所遭遇到的問題。

你非常堅持所有數位線路都由單一主時鐘控制時脈,原因為何?

許多DAC直接套用現成的晶片或數位線路模組,例如轉盤、數位處理,甚至螢幕控制線路都有各自的時鐘。這些時鐘會相互干擾,對聽感造成影響,所以我設計的數位訊源一向只用一個時鐘發送時脈訊號。對應PCM訊號時,雖然必須具備44.1kHz與48kHz兩種時脈頻率,但是其中一個運作時,另一個的電源就會切斷,彼此不會造成影響。

隸屬於全新Sonoma系列的Merlot DAC雖是入門等級,但是關鍵技術移植自Andreas當年替Sony開發的Sonoma工作站,實力甚至有機會超越前代旗艦MPS-5。

Merlot DAC這次採用的MEMS時鐘有何優點?

這種MEMS(Microelectromechanical System Oscillator)微機電震盪器,是針對傳統石英震盪器的缺點而改良的產物。它的時脈更精準,穩定性更高,較不受機械振動、溫度變化的影響。缺點是價格比一般石英震盪器貴上好幾倍,而且消耗功率較大,3C電子產品的接受度不高,但是非常符合Hi End數位訊源的需要。在Sonoma系列的研發階段,我曾經做過許多試作機,配備各種不同的時鐘產生器進行盲眼測試,結果發現MEMS毫無疑問聲音最好。MPS-5只要更新韌體,一樣可以換裝MEMS時鐘提升表現。

外接更精密的原子鐘有幫助嗎?

外接時鐘是因應錄音室環境而誕生的產物,錄音室必須整合錄音、混音、影像等等各種數位設備,所以必須靠外接時鐘統一控制時脈同步,家用數位訊源並沒有這種需要。最理想的時鐘必須盡量靠近DAC線路,兩者的距離一旦拉遠,就容易被雜訊干擾。外接時鐘透過導線連接,雜訊干擾的問題更為嚴重,時基誤差會大幅提升,對於重播並沒有幫助。

我還記得上回你曾經提到時基誤差有好、壞之分?

時基誤差的確並非全部都該去除,早在MPS-5推出時,我就在時鐘線路中導入這種觀念。有一種壞Jitter(時基誤差)產生於錄音階段,夾雜在音樂訊號中,無法由DAC的數位處理移除,但是可以藉由DAC所產生的好Jitter遮蔽,降低壞Jitter的影響。這種好Jitter類似白色噪音,是恆定的,不會隨音樂訊號而變動,所以不會影響聽感。有些DAC宣稱配備時基誤差超低的原子時鐘,會將好Jitter也一併消除,反而凸顯了錄音中的壞Jitter,聲音不一定更好。

有些人認為你所提倡的DoP傳輸技術會減損聲音表現,這是真的嗎?

DoP是DSD Over PCM的縮寫,簡單的說,就是將DSD偽裝成PCM進行傳輸。當年我之所以研發這項技術,是為了解決S/PDIF介面無法傳輸DSD的問題,但那時名稱可能沒取好,讓許多人誤以為DoP是將DSD轉換為PCM再進行傳輸。事實上,DoP完全沒有進行任何轉換處理,傳送的依然是原始的DSD格式。這個過程就像是在黑巧克力外面包上了白巧克力的糖果紙,運送到目的地後,再把糖果紙打開,裡面的黑巧克力原封不動。DoP所做只是包上與拆開糖果紙的動作而已。
事實上,就算不透過DoP,用USB直接傳輸DSD訊號,一樣會經過類似的包裝與拆開動作,因為USB必須將DSD拆解為一個一個8 bit的封包,才能傳輸DSD訊號,這個手續跟DoP其實是一樣的,只是大家不知道USB在幕後會做這樣的工作而已。

最後請談談Merlot DAC類比輸出線路的特點?

Merlot DAC的類比線路使用了OP晶片,不過搭配了特殊線路。我知道音響迷偏好分砌式線路,當年MPS-5就採用了分砌式的類比線路,聲音表現的確很好。但是那時我就開始進行OP晶片的研究,發現OP晶片其實並不差,只不過每一種OP的特性不同,必須量身打造符合其特性的線路,才能完全發揮實力。
在Merlot DAC的開發階段,我試作了200個用晶體搭建的分砌式放大線路,結果其中10%規格未達標準,其餘大多數必需要經過補償修正,可見分砌式線路的變數實在太多,包括溫度變化、焊錫、線路板、甚至晶體的接腳都會影響精密度與一致性,出錯的機率很高。反觀OP晶片,不論精密度與穩定性都超越分砌式線路。我曾經做過實驗,用分砌式架構搭出OP線路,與架構相同的OP晶片相較,聲音幾乎分不出差異,證明OP晶片的聲音並不會比較差。