HOME >> お知らせ 一覧 >> 一般

このページには、一部にPDFファイルを利用しておりますので、閲覧にはAdobe readerなどの閲覧アプリが必要です。

『2016/2015 アーカイブ』

音質の評価について

 2016.12.23
今日は、音質の評価について書かせていただきます。

  前にもお伝えしたかもしれませんが、電気設計の傍ら、20年以上に亘って仕事として音質評価を行ってきた経験を基にしています。
といっても最初から正しい評価ができた訳ではなく、諸先輩方から座学とOJTで鍛えていただき、徐々に一人前になりました。
座学では、以下のような概念を初めに教えていただいたのを未だに覚えています。

「まず、評価対象に音質として何を求めるか?ということを決めなければならない」というものです。
任されていたのがコンシューマ向けオーディオ製品でしたので、殆どの場合、再生音を聴かれる単独もしくは複数名のベストポジションで視聴されるお客様を想定します。そしてオーディオ製品であるがゆえに、スペックに載らない音質については「求められる再生音」がそれぞれの製品ごとに微妙に違ってきます。
求められる音は、大きく分けて「原音探求(あるべき音:忠実再生)」と「好ましい音」に分けられます。
「原音探求」の場合には録音現場エンジニアの意図に忠実な再現が最終目標になり、音質の評価に関しても「ある範囲の共通ターゲット」と言うべきものが設定できます。
狙うべきターゲットが決まっているということは、基本設計がしっかりしていないと的ハズレになる危険があります。(理由は後述します)
一方、「好ましい音」には個人差(主観評価)があり、こうであれば良いというように一元的に規定できるものではありません。

音楽ジャンルによっても音質の「好み」に傾向の違いが見られます。
クラシックの好きな方の場合は、広いDレンジ(高S/N:特に微弱音の再現性)、低歪み(アタックが割れない、嫌な音がしない)、パースペクティブ(左右の広がり、奥行き、天井の高さ・・・ホールや教会の大きさ)などが重点評価項目になります。
ジャズ愛好家の方々の場合には、臨場感〜演奏者との距離感、楽器や口から放たれた音の作る空気感など俗に言うライブ感を求める方が多いです。(録音にもこの傾向があります)
ロックやポップス系の場合は、ドラムスの腹に響く低音などのアタック感やクッキリと浮かび上がるヴォーカル・・・のように多少の歪みが含まれているほうが(強調と言った方が良いかもしれませんが)心地よい場合もあります。
これは決め付けではありません。実際の現場録音スタッフや編集エンジニアの音作りも含めての傾向です。
音を受ける側(お客様)の感性が千差万別である以上、オールマイティを求めるのは至難の業で、いかにして物量投入せずにC/Pの高いチューニングをするかがキーポイントだと教えられました。

また、ソース側のジャンル以外にも周囲の環境に応じて再生音に求められるものも変わってきます。一時期、『特機』という部署で仕事をしていましたが、コンシュマー向けとは求めるものが全く違いました。
例えば、電車のホームや車内では、周囲の騒音レベルが高いため、「多くの方々に声が明瞭に聞き取れること」が求められてきます。病院や公共施設の放送用では、騒音レベルは高くないという条件の違いがありますが、今度は「不快感を与えない」という新たな要求事項が順位を上げてきます。当時、スナック(死語でしょうか・・)などで使われていたカラオケ用スピーカーでは「自分の声が明瞭に聞き分けられること(「バックに流れる伴奏が聞き取れること」とも換言できます)という項目の優先順位が高くなります。

実際に音質を評価するOJTにあたっては、音の性質や傾向を表現する言葉の意味や同義語、対義語を教えられました。
これは共通の言語で会話をするのと同じように、基準を設けなければ正しい評価ができないからです。
これについても後述します。

国際規格で定められている音の基本要素には、ラウドネス(大きさ)、シャープネス(尖鋭感)、ラフネス(荒さ)の3つがあります。
これらの要素に対し、個別に評価するのは非常に難しいと言えます。なぜならば、相互に関連性があるためです。
たとえば、ラウドネス。
小さな音で再生した場合には、聴覚の生理学的特性により高域と低域の感度が落ちます。これは、動物には聴覚情報から外敵によるリスク回避の状況判断をしなければならないという本能があるためです。具体的には、外敵がたてる小さな音は主に中域成分で構成されるため、その感度を落とさないようにする(後述する「特定部位のニューロン機能の活性」と「周辺ニューロン機能の抑制」による)機能が備わっているためです。
逆に大きな音で再生した場合にはDレンジが圧縮されたようになり、小さな音はマスキングされてしまいます。(生理学用語で「順応」と言います:周囲の環境に応じて必要な感知機能だけを維持したり強い刺激から神経細胞を守ったりするために「働き具合を調節する」という意味です)
したがって、正しく評価できる状態を出来る限り持続するためには、常に同じ音量(大きくもなく、小さくもない)で再生することが必要条件になります。(ちょっと細工する場合もありますが・・・)
これらの周波数に関する認知機能を司るのは脳幹(脊髄から繋がっている脳の一番奥の部分)の中脳にある下丘という部位になります。聴覚情報は三半規管(蝸牛管)で活動電位として検出され、蝸牛神経から脳幹を経て下丘に伝わります。下丘ではその部位によりシナプス(ニューロンと呼ばれる神経細胞間の伝達構造)が機能する周波数が異なるために周波数を認知することができます。
シナプスの仕組みや周波数以外の認知機能については、いつかまとめて記述したいと思います。

また、聴覚には疲労による感度の低下が起きます。
2013/12/15にアップした当HPの記事にも書きましたが、聴覚神経細胞には「連続した刺激に対する順応(感度を低下させて機能を守る)」という現象が起こり、時間経過に伴って元の状態には戻らなくなります。
(実は他の細胞も同様に連続した刺激に対して順応します。特定の条件下では測定器にも劣らない感度を持つ人間の感覚器でも、時間とともに状態が変化してしまうため測定器のような再現性が無いということです)
個人差もありますが、正しい評価ができるのは訓練をしても、せいぜい10分〜15分程度と思われます。
これは評価可能時間とも言うべきものです。たぶんトレーニングのときに教えていただいたと思うのですが、正確な数値の記憶が・・・・10〜15分という値は、私や評価担当の同僚達の経験値です。
それ以上経過すると徐々に感度が低下していき、いつの間にか評価が曖昧になっていきます。急激に変化しないので、殆どの場合、本人は気がつきません。
あるとき、設計期限が迫ってきていて徹夜で音質を追い込んだことがありました。「これで良し!」と切り上げ、翌朝出社された上長に聴いていただいたところ「何だこの音は!」とこっぴどく怒られ、仕上げの微調整を別の担当者に代えられて悔しい思いをしたことがありました。

また、再生ソースについては数種類の評価ソースを決め、それ以外は聴きません。
それもベタで聴くのではなく、特定の数フレーズ(8小節〜16小節くらい)だけを再生して評価します。
なぜ、こんなことをするのか具体的な理由については教えていただけませんでしたが、多分、経験則だったのだと思います。
最近になって知ったのですが、これも大脳生理学に則ったものでした。
特定の楽器や楽音だけが含まれる数小節に絞り込んで評価することでその評価に最適な特定のニューロンだけが活性化され、その周辺の神経活動が抑制されます。
これにより評価すべき項目に関する分解能が相対的にアップします。

ここまで概要を述べてきましたが、大事なことが抜けていました。
評価は常に「比較による」ということです。聴覚は騙されやすいので、ニュートラルな評価をするためには基準との比較が必要なのです。
勿論、「記憶することで自分の中に音の基準を持つこと」もある程度は可能です。だから「好みの音」というものが大脳辺縁系にある扁桃体の記憶固定機能(多分に情動的要素が大きい)として形成されるのです。これは長期記憶になりますので消えてなくなることはありません。但し、「確定したもの」ではなく、周辺部位の影響を受けて少なからず変動するものであるのは上記の通りです。
それを基準にすることは「自分好みの音にチューニングする」ことに他なりません。それはニュートラルな評価を求めることに反します。
でも、仕事を辞めてから「これもアリだな」と思うようになりました。

話が逸れました。
スピーカーの評価をする場合には、スピーカー基準器と評価対象との比較評価になります。
それ以外のソース機器(CDプレーヤなど)やアンプ、接続ケーブルなどの周辺機器やアクセサリーを変更することはありません。
同様に、評価対象がプレーヤーであれば、それ以外の機器を固定するということです。
これは、変動要素を出来る限り抑えて、対象物の評価信頼性を上げるために重要な決め事になります。

シャープネス(尖鋭感)、ラフネス(荒さ)については、以下のような言葉の対で表現して、どの位置にあるか(傾向)を記入する方法で評価します。
oto

ラウドネスについては、測定器でいうDレンジ、S/Nに相当する評価になり、これは傾向(どちらに寄っているか)ではなく感覚的(相対的)な優劣の評価になります。
「大きくても歪まない・・・歪率」「小さくてもエッジが崩れない・・・分解能」「小さな音が表現できる・・・S/N」「音の大小で質感が変わらない・・・リニアリティ」
などの項目に対し、3段階から5段階程度の相対評価をします。
これ以外に空間表現(3Dパースペクティブ)も評価します。
左右、前後、上下の順に空間の再現性(広さ)を評価します。
これには定位も含まれ、原音を求める場合には「あるべきポジションに定位するか?」「音像の大きさや形(バランス)は妥当か?」「ピンポイントで輪郭が滲まないか?」といった項目への評価となります。
ある評論家の先生宅にお伺いして評価をお願いしたときに、「ヴォーカルが下を向いてる」「声がまとわりつく」といった表現をされたことがありました。別の言い方をすれば「音離れが悪い」となります。言葉では表現が難しいのですが、後日、キャビネットが片側だけ不正共振していてスピーカーの存在を消せなかったことが原因だと判明しました。
このように評価用語の意味を規定することで、原因の推定も可能になってきます。医者が患者の症状を聞いて診断するのに似ていますね。
あまり多くはありませんが、特定の要求のある場合には「音が前に定位するか?」「デフォルメできているか?(ヴォーカルだけがくっきりと浮かび上がるか)」・・・音離れの良さといった要素(項目)を重点的に評価することもあります。
当時のテレビやラジカセなどでは構造的に楕円や小型なのに低音を求められるためストロークの長いスピーカーが要求され、上記の「音離れ」は商品として重要な評価項目とされました。そんな場合には、上手く筐体の共振を利用したりSP周辺の筐体形状を軽くホーン構造にしたりして音造りをしました。

奥行き、そして上下の定位についてですが、2chスピーカーによる再生の場合には録音/再生の仕組みからして上下方向をあらわすことはできないと仰る方もいらっしゃいますが、人間が二つの耳で上下、前後を認識できるのは地面や壁面での反射音、耳介(広がった部分)や耳垂(耳たぶ)、外耳道の形状での反射によるF特の変化(スペクトラム)や両耳位相差の変化を(場合によっては「視覚による位置情報と連携した聴覚記憶」と比較して)感知しているためです。
2ch再生を想定して、直接音が壁や床で反射した情報を加えていれば(アンビエンス情報を踏まえた録音&ミクシングが為されていれば)、2ch記録2ch再生でもある程度の上下/遠近の認知は可能になります。(「聴取位置より後方」は意図的に音を加工(位相や遅延時間を変えて付加)しない限りは無理ですが・・・)
最近、流行しているドルビーアトモスでは天井にスピーカーを配置することによって上下(というより上方向)の表現を可能にしています。
これは仮想音源(エレメント)の位置情報に応じた情報を加味することで人間の耳を騙して再現させる方法ともいえます。(VRですね)

レゾリューションについては、「同一の楽器パートで第一バイオリンと第二バイオリンを聞き分けられるか?」などの定位の分解能と「大編成の楽曲で、それぞれのパートの音色が聞き分けられるか」といった音色の分解能での評価になります。

ちょっと話が脱線しますが、生演奏とスピーカー再生の大きな違いとは何でしょう?
生演奏ではソロの場合を除き、実音源は複数になります。
スピーカー再生では、これらを2つの音源(スピーカー)による合成音場を作り出し、擬似音源として視聴者に認知させます。
この差は音源の存在感(実在感)に影響が出てきます。
音質評価をしていた当時、月に1回以上生演奏を聴くようにしていました。クラシックの定期演奏会やジャズのライブ(ワンドリンク付き)が多かったですが、時には歌謡曲のコンサートやヘビメタも聴きに行きました。
そこで感じたのは、「空気を伝播してくる情報以外に床などの構造物を伝わってくる情報のいかに多いことか」ということです。
特に、ジャズのライブ演奏などの場合、演奏者の発した音が床から椅子に伝わってくることで演奏者の存在感が大きく付加されます。
これにはハース効果も一役かっているのだと思います。
ハース効果とは、「動物の聴覚では一番先に感知した音情報が優先される」というものです。反射の多い地形であっても一番先に届いた直接音で敵の位置を知るために備わったものなのでしょう。
db

空間伝播する音波情報より床を伝播する情報が先に届くため、音源認知(方向は別として)は床からの情報に支配されるということです。
ダブルベースなど大きな弦楽器は演奏する際にエンドピンを床に立てて演奏します。エンドピンにはテールピースという弦をまとめる部分が接続されているものが多く、結果的に発音部の固定端が床にダイレクトにつながります。
したがって、床も含めて発音源ということもできます。
音叉をテーブルなどに当てるとテーブル自体が共振し、一体になって発音源になるのと同様です。
当然、楽器には床に直接置くものは少なく、演奏をするために抱えたり捧げたり顎に挟んだりするものは上記には当てはまりませんが・・・。

もう一つ脱線しますが、2chマイクで録音したものを2chスピーカーで再生するのは理に適っていますが、実際の録音現場で単純な2ch録音することはプロの場合には100%ありません。
最近はコンシューマー向けの2chデジタル録音機が手軽に入手できるようになったので、WEB上には2chソースが散見されるようになっています。昔、DAT(デジタルオーディオテープレコーダー)によるナマ録が流行ったことがあったのを思い出しました。私は、もっと前の世代で、7inch 2トラック19cm(10inch 2トラ38cmは高嶺の花でした!特にパナソニックのRS-1500Uが欲しくて欲しくて・・・)のオープンリールくらいしか録音媒体を所有した事はありませんでしたが・・・
では、世の中に出回っている殆どのソースである「マルチマイクを使ってマルチトラック録音したものをエンジニアがミクシングした2chソース」を2ch再生した場合には、2chスピーカーの再生で良いのでしょうか?
私はエンジニアの力量(考え方)でこの回答は変わってくると考えています。
詳しくは当HPの「音場再生の限界」PDFファイルの後半部分をお読みください。

  • PDFファイル 音場再生の限界


  • 評価の話に戻ります。
    実際の評価では、毎回、上記したような項目を全て網羅して評価することはありません。
    そこまでやっても評価精度があがることが無いからです。
    殆どの場合、求める品質レベルに及第点の付けられるもの以外(劣っていると思われる項目)が重点評価項目になってきます。
    もしくは、目的に応じていくつかの項目を具体的に指定して評価する方法を採ります。

    人間の聴覚は騙されやすいので、通常は上記のように基準器との比較試聴で評価します。
    スピーカーの評価であれば、まず基準スピーカーで再生し、続いて評価対象であるスピーカーを繋ぎ変えて聴きます。
    基準⇒対象⇒基準
    という繰り返しで評価します。基準に戻るのは確認のためです。
    アンプやCDプレーヤの場合も同様です。出来る限り、評価対象以外の条件が変わらないようにするのが原則です。

    またまた脱線しますが、スピーカーを繋ぎ変えるのにはケーブルを端子から抜いて挿し変えるのとスイッチで切り換えるのとでは評価の際にどちらが良いか?と悩まれる方がいらっしゃると思います。
    結論から先に言うとスイッチでの切り換えにすべきです。
    人間の記憶能力というものは時間経過とともに直ぐに薄れてしまうものだからです。有名な実験結果に「エヴィングハウスの忘却曲線」というものがあります。これは記憶する対象が文字列ですので音とは違うのですが、短期記憶の場合には何と20分後には42%を忘却するという結果になっています。この曲線のカーブからすると数分後には1割程度の情報欠損が起きる計算になります。
    新しい記憶は大脳辺縁系にある海馬という部位で短期記憶にするか長期記憶にするかを判断され、長期記憶の場合には大脳皮質に送られます。パソコンで言うところのRAM(揮発性メモリ)とROM(不揮発性メモリ)を切り換えるようなものです。海馬には常に新しい情報が次々と入ってくるため、古くなったものは忘却(消去)される運命にあります。また、その切り換えはかなりファジーに行われます。
    したがって、試聴位置から離れて端子にケーブルを繋ぎ変える間にも時々刻々記憶情報が失われ、評価精度が下がっていくということです。
    おまけにケーブルの配線位置も微妙に変わります。
    もし、本格的に評価なさるのであれば、接点品質の良いスイッチでの切り換えがお勧めです。
    比較評価ではなく通常に試聴される際にはスイッチなど無いほうが良いのは言わずもがなです。

    長年評価をしていると、一回聴いただけで基準から外れた項目がだいたい分かるようになります。これは反復学習効果と呼ばれるもので、短期記憶情報が大脳皮質に送られて長期記憶として蓄えられます。これはニューロン間のシナプスという部分に記憶物質(神経伝達物質)が定常的に蓄えられる事によります。
    そろそろ脳の話はゲップが出そうですね。

    次は、その劣っている項目に絞って評価する段階に入ります。
    何回も対策と評価を繰り返し、対策による改善効果が安定してくると、ぱっと聴いた時に標準との差(あくまで評価項目の結果の差です)が分からなくなってきます。似てくるというべきでしょうか・・・。
    これが評価レベルに対して「ある範囲に入った」ということになります。

    試作検討をしているのに基準と同じものを作るというのでは進歩がありません。
    次のステップは、基準器を含めた「不満な部分」を改善していきます。
    改善手法としては地道な実験を繰り返すわけですが、虱つぶしにやると、とんでもない時間と労力がかかりますので、実験計画法の進化形である『田口メソッド』を利用して効率を上げて絞込みを行います。L9直行実験では9回(3水準)で実質3^4=81回の実験に、L18に至っては18回(2水準x1、3水準x7)の実験が2x3^7=4374回の実験に相当します。通常はL9を使います。
    診断実験(予備実験)⇒直行実験(L9もしくはL18直行マトリクスによる)に際して上記のような評価を行い、要因効果図から因子感度が高い(Qの高い)ものを抽出していきます(効果の大きい対策を明らかにするということです)

    本稿の最初のほうで「基本設計をキチンとしていないと的ハズレな結果になる危険がある」と述べた理由ですが、基本設計をキチンとすることで上記の因子感度を云々することができるようになるからです。(スタート地点に立てたということです)
    基本設計がキチンと為されていない場合には、本来効果のある対策でも思ったほど効果がなかったり、かえって逆効果になることもあります。たまたま良い結果に見えることもありますが、それ以上の進展は望めません。
    もぐら叩き状態になり、物量投入しても何ら効果なしという結果になりかねないのです。

    前回の第20回NHセミナー報告で取り上げた機械インピーダンスでの検証やメカニカルアースの重要性は、この基本設計に含まれるべきものです。
    振動源がメカニカルアースから浮いた状態で、どのような対策を打っても、もぐら叩きになる可能性が高いということです。

    ただし、最初に述べたように「好ましい音」というのは主観評価ですので、好ましいと感じる方もいらっしゃると思います。
    「鳥の巣」でメカニカルアースから浮いた(機械抵抗が大きくなった)状態の評価を私はNGとしましたが、前述のように次の展開で改善が望めないことも理由の一つです。
    でも、セミナーで良い音に変わったと評価した方がいらっしゃるのも事実だと思います。
    確かに、鳥の巣に乗せることで「柔らかい」「滑らかな」傾向に変化したことは私も認めます。それを良い傾向と評価された方がいたということです。
    ただ、音像にポイントを絞って評価していれば、滲んで浮き上がっているのが分かったはずです。
    「好ましい音」というのは、視聴者がどの観点にウェイトを置いて評価しているかで変わってしまうのです。
    繰り返しになりますが、人間の聴覚は特定の条件を設定した場合には、感度から言うとどんな精密測定器にも優る能力を発揮しますが、きちんとした基準、手順を設定してあげないと騙されるのです。
    そこが音質評価の難しいところだということが、お分かりいただけたでしょうか。

    最後に、次のような疑問を持たれる方がいらっしゃると思います。
    「手で持って弾いている楽器やヴォーカリストの声帯はメカニカルアースである床から浮いているじゃないか」「これじゃ良い音がでないんじゃないの?」と・・・。
    だからこそ、同じ楽器を別の演奏者が奏でた時に、同じ音色にならないのです。
    勿論、演奏者の技量や体格(楽器に付加される質量)に因る部分が大きいとは思いますが、それを差し引いても差が出るのです。
    別の例を挙げます。ピアノを演奏会場のステージに設置する時に、脚の位置が決められているのをご存知でしょうか。
    ステージの床下にはピアノの質量を支えるための補強構造が設けられていて、質量が集中する脚の部分にくるようになっています。ステージの設計強度の問題から位置が決められているのですが、指定位置から外れると音色が変わってしまいます。
    補強部分以外のステージの床は板張り構造で完全なメカニカルアースとは言えないため第二の共鳴板になってしまうのだと推察できます。
    極端な例ですが、分厚い絨毯の上に置いたらスタインウェイやYAMAHAが全くの別物になってしまうのです。

    このように考えると、日ごろ疑問に思っていたことがだんだん明らかになってくると思います。
    このように「メカニカルアース」は本当に重要な考え方なのです。

    前回の記事の中でNH-W1の機械インピーダンスによる説明が間違っていました。機械系と電気系がゴッチャになっていました。お詫びします。
    どうやら私の頭も錆付いてきたようです。
    NH-W1

    上記の内容を見やすいようにPDFにまとめました。
  • PDFファイル 音質評価について


  • また、ウェーブレット解析と音質評価についての論文があったので、以下に示しておきます。
    http://pioneer.jp/en/crdl_design/crdl/rd/pdf/18-1-1.pdf

    NHラボ椛20回セミナー参加

     2016.12.14
    本日、通院帰りに第20回セミナーに参加してきました。
    テーマは『たまごスピーカのニューレシピ』
    うさぎと亀ではありませんが、時間に余裕があったので油断して到着が遅れ14時を数分過ぎてドアを入ると、ちょうど中島先生が登壇するところ。
    慌てて席に着き、拝聴。
    始めに、人間の可聴域(レベルと周波数)と騒音、生体音、楽音の関係を視覚的にグラフ表示され、CDのサンプリング規格上限44.1kHzが妥当だったのかをお話いただきました。(グラフを写真に撮るのを失念しました・・・こんな感じだったか・・・)

    oto

    人間の可聴域は個人差が大きいのですが、一般に20Hz〜20kHz、120dB〜20dBと言われています。
    これを考慮して、CDのサンプリング周波数44.1kHzが決められた訳で、シャノンの定理により理論的に22.05kHzまでの記録再生が可能な規格になっています。
    一方、楽音には20kHz以上もレベル的には低くなっていくものの100kHz近くまでの成分が含まれています。
    昨今のハイレゾは、この帯域を再生しようという規格になる訳で、実際に試聴すると明らかに人間が違いを感じることができる点を以って先生は「44.1kHzで良かったのか・・・」と仰られていました。
    当時の技術力(特にCDへの記録密度)からするとクラシック1曲を1枚のディスクに収めることを想定した規格は妥当だったと思うのですが・・・。

    生体音というのは、体内で発生している音のことで、普段は意識していませんが心臓の鼓動や消化器の蠕動音(大きい時には「腹の虫」として認知)、呼吸音、血液の流れる音、緊張した筋肉が電位差で振動する音(耳を両手で強く押さえると分かります)などのことです。
    僭越ながら、可聴域は耳に聞こえる領域という認識で考えるとグラフのようになりますが、体表の振動を検知する感覚や骨伝導など人間が身体で感じる領域はもう少し広いと私は考えます。また、機械と違い、人間も含めて動物の選択能力にはすばらしいものがあり、空間の広さなどを認識しようとすると高域のレベルや位相に対する感度が上がったようになる現象が起きます。F特が可変だと考えても良いと思います。この能力により老化して高域成分の感度が下がってきているにも関わらずハイレゾの恩恵を受けることができるのだと思います。(当然ながら個人差があります・・・)

    実際の楽音の場合、Max.を決定してそれに対してマージンを持った設計は簡単に出来るのですが、実際にはピークを再生している時間は全体の0.5%にも達しないこと、Min.に関しては、「どこまで」という限界が無く微小音の再現性こそ重要だというお話になりました。
    その際の重要なファクタとしては振動板の支持部分が重要であると説かれ、具体例として支持系の前後変位に対するスチフネス(硬さ:コンプライアンスの逆数)は非対称であり、これが非線形歪みになることを『機械振動系のひずみ』という項目で説明いただきました。

    nl

    同様に磁気回路にも前後変位に対する非線形歪みがあること、マグネットやフレームの固有振動が歪みレベルとして問題になるレベルであることも説かれました。
    先生のお話にはありませんでしたが、ボイスコイルは円筒状のボビンに巻きつけられた構造になっていて、ダンパーとの接合部の強度バラツキや微妙な傾きにより変位が大きくなるに従って断面が楕円形に変形するための歪みも発生します。
    これら諸々の微小レベルの非線形を云々する際に重要なのは、メカニカルアースであり、音響アース(たぶん、中島先生が命名されたのでは)であるとのご説明がありました。
    以上で先生は降壇されました。

    メカニカルアースは力学的に重要な要素(基準)であり、当HPのAR-1設計初期資料にも記述させていただいているように、この扱いを誤るとどんなに物量投入してもまともな音にはなりません。

    バトンタッチした茶谷取締役は「ニューレシピ」ということで、まず宮下さん(徹底されたマニアとのことです)による改良提案の紹介からスタート。
    接点構造に纏わる改善、吸音材の排除と微小ダクトによる背圧改善、その他、コネクタ部分の半導体効果排除など細かい部分での積み重ねが良い音を作るとの説明がありました。

    物理量で効果が表現できないものもありますが、結果良ければ・・・というのもアリかな〜と感じました。
    ただ、技術者の姿勢としては・・・技術者の本分は「理論的に普遍な法則を見出だし、常に再現性を優先させる」ことであり、そのためには「何とかして物理量で記録しようとする努力」が大切と考えます。

    閑話休題。報告にもどります。
    スピーカーでの再生に重要なファクタは、@低音の吸収、A内外遮音、B残響より拡散を優先・・・ライブフロント/デッドエンド(スピーカーの後方を反射構造にして、試聴位置より後ろをデッドにする)よりデッドフロント/ライブエンドがトレンドとの説明には「ちょっと待ってよ」と言いたくなりました。「余計なものは加えない」ということからするとオールデッドがベストとも言えますが、極端な例ですが無響室で音を聞いた場合には違和感がひどく耐えられません。音がどこから来ているのかさえ分からなくなります。
    茶谷さんが言いたかったのは、「NH-W1のような無指向性のスピーカーの場合、後方への放射が再度正面の壁で反射して加算されることは良くない」ということかもしれません。
    AR-1でも改善前の初期型では後方への音漏れが正面壁に反射して悪さをしていたのを思い出しました。
    傾向としてデッドフロント/ライブエンド(後方は部屋が狭く距離が取れないならやはりある程度のデッド化が必要)が良いのではという提案であれば納得できます。
    これら重要ファクタの改善ツールとして天然木と吸音材を組み合わせたもの(ここち良い響きは残し、不快音は吸収する素材の組合せ)の紹介もありました。(天然木の響きがきれいだから共振しても良いという考え方には反対です。原音に対しては何も足さない、何も引かないがベストと考えます)

    続いてデモに移りましたが、最初の圧電スピーカー追加は取って付けたようで帯域が延びたようには感じませんでした。位相管理が必要な帯域でのチョイ足しはちょっと安易では・・・
    次のサブウーファ追加は正負位相を合わせることなくNH-W1吊り具の下にそのまま置いただけなので、波面が合わず違和感だけが目立ちました。周期の長くなる低域ほど極性合わせが重要です。場合によっては足したはずが、引き算になることもあります。特にNH-W1の低域をカットしていないので、影響は大です
    鳥の巣のような改善ツール(ミクロンウール状の吸音材と木材との組合せ)の中にたまご(NH-W1)を入れての再生は論外。音像定位は上に持ち上がり、良く言われる「地に足がつかない薄っぺらの音」になりました。先生の仰ったメカニカルアースが実践されていないのだから当然ですが・・。
    説明は以下のとおりです。要するに、ユニットがメカニカルグランドから浮いてしまうので上記のような再生音になります。
    nl nl

    最後に、DC電源の電池化による改善効果を実験で示していただきました。(車載用の鉛蓄電池を使用)
    コルグのDA部分での効果はそれなりに感じましたが、デジタルアンプでの効果はイマイチ。「雑誌付録のアンプで安物だけれど、それにしても何と足が鉄製だ!」と茶谷さんがボヤいていましたが、デジタルアンプの品位が低すぎる!柔らかい音が出せない状況で、ろくにパスコンも入っていないのでしょうからデジタルノイズがだだ漏れ状態だと思います。
    正直、このデモで電池駆動をしてみようと思った方がどれだけいらしたでしょうか??
    そもそも電池駆動にするメリットは、文字通り「電荷の池」=給電能力の高さであり、付加変動に対するインピーダンスが限りなく安定することです。ESRが低いこともノイズ吸収という意味から必要ですが、広帯域でインピーダンスが安定していることがベストです。(鉛電池などは、あながちESRが低いとはいえません)

    次にクリアサウンドポート鰍フ高松さんの講演がありましたが、アキュフェーズDF-55設計に携わっていらした方です。データを基本とした説明に終始されたので、至って気持ち良く拝聴させていただきました。
    講演の中で、フォステクスCW-250Aのように「スーパーウーファはMFBでないとアタックが遅れてきて使い物にならない」というニュアンスの発言がありましたが、これには同感です。
    振動系マスの大きなスーパーウーファでは、慣性力(静止し続けようとする、動き出したら停まらない)が悪さをします。アンプが駆動してから動き始めるまでに遅延が生じるし、動き出したら停まらないのもダンピングの悪さになります。停まらずに動くということは、逆起電力の影響が長時間続くということです。
    振動系の動きをフィードバック制御するMFBのメリットはマスの制動(Qダンプ)であり、私がCW-250Aユーザーとして満足している点はまさにその部分ですので。
    フィルタ設計をなさっていただけに、fc前後での位相回りがどの程度か熟知なされており、感服いたしました。

    最後にNH-W1ユーザーS氏からのご意見で締めくくり。
    その中で「キャビネットだけを提供いただけないか」との要望がありましたが、私はユニットの提供のほうが興味があります。
    なにせスライドリングマテリアルを利用した始めてのユニットですから。

    時間を過ぎていましたが、LPからDSD5.6MHzに焼きなおしたソースでの再生を飛び入りで聞かせていただきました。
    床に直に置いての再生でしたが、メカニカルアースの効果絶大でした。良い録音のものはやはり良いな〜と単純に感じてしまいました。
    NHラボの皆様、ご登壇された方々、楽しませていただき、ありがとうございました。

    NHラボ椛19回セミナー参加

     2016.10.19
    本日、休みを取ってセミナーに参加してきました。
    初めての参加でしたが、三軒茶屋の産業プラザで午後2時からの開催・・・テーマは『たまごdeサラウンド』
    NH-W1(ホワイト)を5台使ってサラウンド再生をするというデモ主体のセミナーでした。
    中島平太郎さんの講演は、NHK技研からSONYに移って9日目に発表されたというSQ方式の4chステレオの話に始まり、1999年7月に開催されたJAS-AA懇談会の5chマルチチャンネルステレオの資料説明、両耳時間差とレベル差の関係が周波数により極端に変化するために的確なサラウンドの制御ができていないことの説明に続き、制御には正面では生じない左右耳への到達時間差が影響を与えること、音像の質が両耳であるがゆえに試聴位置により変化すること、音像の拡がりも試聴位置により変化することなど補正しきれない問題が山積であることをお話しいただきました。
    以前、お会いした時よりもだいぶお歳を召していらっしゃいましたが、まだまだ現役(なんと御歳95歳!)。セミナーには、SONY時代の弟子の方々(といっても私より年長)がかなりの数参加されていたようです。
    続いて茶谷取締役が『サラウンド収録とサラウンド再生』と名打っての講演をされました。パイオニアの沢口さん、亀川さんの資料を配布いただきましたが、内容に関してはご本人も仰っていたように十分に理解していらっしゃらないようで、質問は控えさせていただきました。
    当ホームページには2015年2月に関連情報記事(音場再生の限界)を掲載していますので閲覧いただけると幸いです。

  • PDFファイル 音場再生の限界


  • 最初のデモは、シンフォレストの『森林浴サラウンド』から上高地をNH-W1x5台+スーパーウーファで再生。
    まず感じたのは、スピーカーの存在感が殆ど無いこと。これは形状によるメリットと分かってはいるものの、試聴されている方たちには実感がわかないため、NH-W1に合わせた小型の平面バッフルをゴムベルトで固定できるようにしたものを「お面」のように被せて再度音出し。
    バッフル効果で2R空間への放射となるため低域で6dBアップするものの、バッフルのサイズに応じた回折効果により周波数特性にはピークディップが生じます。(提供された軸上30cmのf特にはバッフル無しに対して750Hz,3kHzにディップ、1.5kHz,4.5kHzにピークが見られます。音速を340m/sとすると750Hzの1波長は約45cmとなり半波長が22cmくらいになりバッフルのサイズに近いのではないでしょうか。1.5kHzは1波長が約22cmになります)
    これはタイムドメイン領域では位相の干渉になり、『不自然さ』に直結します。
    人間の耳の位相感度は中域(500Hz以上)から徐々に上がるため、川のせせらぎに不自然さが伴っているのが確認できました。バッフルの影響で位相歪が発生しているためにスピーカーの存在を顕著にしてしまい、音場はスピーカーの内側に限定されてしまいます。
    周りからは「なんだか狭くなった?」といった声が聞けました。実験としては成功ですね。(拍手)
    話は逸れますが、NH-W1は振動板表面にスライドリングマテリアルという特殊ポリマーを塗布しています。これはポリマー繊維間に構成されている架橋部分が動くことにより大きく伸び縮みできて、且つ、内部応力が生じにくいものということです。イメージとしてはダンピングに使われるブチルゴムやソルボセインを想起させますが、繊維〜ポリマーというところから「引っ張っても破れない強度&復元性」を持ちながら「しなやか」で「ロス」を有する材質・・・というところでしょうか。架橋部分が動くことで内部応力になるべきエネルギーを熱に変換してしまう・・・要は内部損失(tanδ)が通常のポリマーより大きいということですね。防弾チョッキにも使われるケブラーとは別の意味で興味深い材料です。
    「スライドリングマテリアル」で検索すると http://www.asmi.jp/tec2 が出てきますので、詳細はそちらを参照願います。分かりやすい図がありますので、ぜひ見て下さい。
    表面に塗布することで音質にどれだけの効果があるか未知数(説明では高域の質感改善)ですが、tanδが大きいというところからしてMarkAudioのMAOPに似た効果があるのではと思います。
    後半は、クラシックの再生。ムジークフェラインザールやコロッセオでのオペラなど3曲のさわりを数分ずつ。遠近感の表現力はAR-1と共通するものが感じられました。
    最後にSACD「The Nordic Sound - 2L Audiophile Recordings」での音出し。非常に音場が広く、他のソースと一線を画します。
    2Lのマイクセッティングは9chマルチが基準のようですが、以下のサラウンド寺子屋塾 http://surroundterakoya.blogspot.jp/2015/05/893d.htmlに写真が載っています。

    2時間という短時間でしたが、得るものは多かったと思います。

    カメラ・グリップを作りました

    Grip Grip

    2015.5.03
    趣味で写真を撮っていますが、愛機OM-D EM-5にPROシリーズのような重いレンズを付けると取り回しに不安があり、HAKUBAのLH KGP-02グリップホルダーを使っていました。
    それでも安定性に不満があり、純正のグリップが欲しかったのですが、OLYMPUS HLD-6は定価\35,000。中古でも2万円弱と手が出ません。
    そこで、自作を考えました。
    製作編は以下のPDFファイルを参照してください。


  • PDFファイル OM-D EM-5用グリップの製作
  • K2インターフェイス XL-Z711について

    2015.3.7
    またまた昔話。
    今から25年以上前の話です。
    CDプレーヤー戦国時代、家電大手が群雄割拠していた時代でした。
    16bitという限られた情報量でどこまで音楽性を表現できるか・・・デジタル信号処理なのにどうして音質に差が出るのか・・そんな疑問に答えるようにK2インターフェイスが日本ビクターから登場しました。
    K2インターフェイスがはじめて搭載されたモデルXL-Z711。
    技術的な内容を中心に説明してみました。
    詳しくは、以下のPDFファイルをご覧ください。

  • PDFファイル K2インターフェイスについて
  • 音場再現の限界

    2015.2.14
    エンジニアの友人とニアフィールド再生のメリット・デメリットの話をした夜、何気なく3年前のSTEREO誌をぺらぺらとめくっていると、付録「究極のオーディオチェックCD2」の記事が目に入りました。
    急に聞きたくなり、CDを再生しました。
    スポットマイクだけをトラックダウンしたものを再生して聴いてみると、確かに定位は良い。でも・・・
    そこで、つらつらと録音側の現状を書いてみました。
    音を聴くという行為の生理学的な要素についても整理してみました。
    結論は、「音場を再現する」という意識で録音側のスタッフが録音に臨まなければ、音場の再生は難しいということがはっきりしました。
    良いソースを選んで、ライブラリーにしていくしかありませんね・・・。
    詳しくは、以下のPDFファイルをご覧ください。

  • PDFファイル 音場再生の限界
  • スピーカーユニットの製作工程

    2015.1.27
    スピーカーユニットはどうやって作るの?と友人に聞かれ、30年前を思い出しながら作り方をまとめてみました。
    いざ、書き始めると、あれはどうだったっけ?、ここはどうやって作るんだったっけ?と躓くことばかり。
    記憶というものは徐々に曖昧になり、あるところをクリアすると、その先が一気に開けたりするものだというのを実感しました。
    神経細胞相互の伝達に「シナプス」というものが介在していて化学物質により電位を形成することで記憶を司ると学生時代に学んだことを思い出し、電位差で状態を維持して記録するあたりは脳もメモリと同じなんだなぁと妙に感動してしまいました。
    構成部品数は、Alpair-6Pを見る限り30年前とほどんど変わっていませんが、編組線の引き出し方法が変わってきていて、この部分でのリニアリティが上がっているのが分かりました。
    Alpair-6Pの歪感の無さはフレームが樹脂製であることも一因と思います。
    エッジとダンパーを介して2つの経路で駆動による振動が伝わっていて、混変調を起こす要素があるフレームが金属では良い音は望めません。
    以前、音楽信号で駆動した状態でフレームに聴診器を付けて音を聴いたことがありますが、ピーキーな金属的音だったと記憶しています。
    骨伝導が耳で聞く音と異なるのと同じだと思いますが、フレームの振動が振動板から放射される音波に少なからず影響を与えているのは確かだと思います。

  • PDFファイル ユニットの構造と組み立て方
  •