誤解に満ちた1/fゆらぎの世界

スポンサーリンク

前章では1/fゆらぎについて概念的な解説を行いましたが、いよいよ本題である音楽のゆらぎについて探究していきます。その前に1/fゆらぎをめぐるさまざまな誤解について問題提起をしておきます。これまであまり語られなかった部分なので、できるだけ具体的にわかりやすく説明したいと思います。

実はかなり怪しい1/fゆらぎ

これまで1/fゆらぎという言葉自体は知っていましたが、どうしても心に引っかかることが一つだけありました。これが海の波の周期や心拍数のゆらぎというのであればイメージがはっきりわかります。もしそれを分析しようとするなら、単位時間当たりの波の回数や心拍数を数えてやればデータ化することができます。そしてあとはフーリエ変換を行ってスペクトルを求めてやればいいだけの話です。

ところが、音楽のゆらぎといった場合、いったい何がゆらいでいるのでしょうか? この疑問がずっと頭を悩ませ続けました。このコラムを始める前に、インターネットを検索して1/fゆらぎに関する参考文献をたくさん集めてみました。ところが、ある奇妙な事実に気付いてしまったのです。それは、どの文献を見ても「何が」ゆらぐのか?という主語が抜け落ちているということです。たいていの文献には、「1/fゆらぎとはスペクトル強度が周波数の逆数に比例するようなゆらぎである」ということは書いてあります。しかし音楽のゆらぎといった場合、「何が」ゆらぐのか?という根本的な疑問に答えてくれる文献は皆無でした。音楽療法系のサイトへ行くと、よく「モーツァルトの音楽は1/fゆらぎを持っています」とか、「美空ひばりの歌声は1/fゆらぎを持っています」ということが書いてありますが、では何がゆらいでいるのか?という質問に明確に答えられる人はおそらくいないのではないかと思います。そこから突然アルファ波に話が飛んでしまうと論理が飛躍しすぎてついていけません。どうもこの手の議論は物理的な考察をスキップして1/fゆらぎという言葉だけが一人歩きしてしまっているような印象を受けます。

典型的な誤解例

音楽のゆらぎについてインターネット上の文献を調べていくと、あるパターンがかなりの割合で見つかることに気付きました。それは音のスペクトルを解析して1/fゆらぎと称している例です。しかしこれには強い違和感を覚え、なぜそれが音楽のゆらぎになるのかどうしても理解することができませんでした。

ここで音というものについて簡単に振り返っておきましょう。物理的に言えば、音というものは空気の振動に他なりません。例えば、太鼓の皮をドンと叩くと、衝撃で空気の密度に変化が生じ、その波動が空気中を伝わって耳の鼓膜を振動させると音として知覚されるわけです。空気が1秒間に振動する回数を周波数といい、単位はヘルツ(Hz)で表します。周波数が大きいほど高い音として認識され、小さいほど低い音として認識されます。人間の耳に聞こえる音の周波数は個人差もありますが、一般的には20~20000Hz程度と言われています。

この音を録音するためには、マイクを通して電気信号に変換します。マイクの中には磁石とコイルが入っていて、空気の振動によりコイルが動かされると電磁誘導により微弱な電圧が発生します。これがすなわち音の波形です。パソコンに音を取り込んでやると、音の波形を数値の変化として見ることができます。例えばピアノの真ん中のラの音は440Hzと決められていますが、その波形を観察すれば1秒間に440回振動しているわけです。しかしここで大事なことは、われわれ人間はラの音を聞いて「いま空気が440回振動している」などと認識することは絶対にないということです。ラの音はあくまでもひとかたまりのラの音でしかないのです。

われわれはフルートの音とヴァイオリンの音を聞き分けることができます。それは同じ音の高さであっても、波形が違うからです。波形が違うということは、スペクトルに分解すると周波数成分の含まれ方が違うということです。以下にWaveSpectraというフリーソフトを使って表示したフルートの音の波形とスペクトルを示します。

フルートの波形とスペクトル

フルートの音は割と柔らかい音ですから、波形もそれなりに単純で丸みを帯びたものになっています。またスペクトルを見るとピークの立ち方が比較的少なく、高周波に向かって急速に減衰していくことがわかります。次に同じ高さでヴァイオリンの音の波形とスペクトルを示します。

ヴァイオリンの波形とスペクトル

こちらはフルートに比べるとかなり複雑な波形で、山と谷がいくつも見られます。またスペクトルを見るとピークがたくさん立っており、かなり高周波領域まで広がっていることがわかります。

一般に楽器の音は本来の周波数の他に、その2倍、3倍、4倍・・・といった整数倍の周波数にもスペクトルのピークが現れます。これを倍音と呼び、倍音の含まれ方によって音色が決まるわけです。これはちょうど光のスペクトル分布によって色が決まるのと同じ理屈です。

さてここで大事なことは、こういったスペクトルはある瞬間で切り取られたものであるということです。それは音楽というものは時間とともに常に変化していますから、ある瞬間を切り取らなければすべての音が入り混じってしまって何のスペクトルだかわからなくなることを考えれば当然といえるでしょう。ちょうどある瞬間にカメラのシャッターを押してフィルムに焼き付けたものと思ってください。つまりスペクトルは音楽の進行とともに時々刻々と変化しているのです。こういったほぼ一瞬と考えられる短い時間におけるスペクトルを短時間スペクトルと呼び、それはある瞬間に鳴っている音の周波数成分を表します。

具体的にパソコンで音のスペクトルを求めるには、取り込んだ音のデータに対してフーリエ変換という手法を用います。しかしフーリエ変換は非常に時間のかかる計算なので、実際には高速フーリエ変換(FFT)というアルゴリズムを用いて計算します。このFFTには少しだけ制約がありまして、それは一度に変換できるデータの数が2,4,8,16,32,64,128,256・・・といった2のべき乗になっていないといけないということです。この数が多いほど精度が高くなるので、実際には2048とか4096くらいのデータ数で変換を行います。これは時間に換算するとどのくらいになるかというと、普通のCDのサンプリングレートは44100Hzですから、1秒間に44100個のデータがあることになります。たとえばFFTのデータ数を2048とすると2048/44100 = 0.0464秒、つまり約46ミリ秒くらいになります。人間の感覚では十分「一瞬」と考えられる時間ですね。データ数を多くするほどFFTの精度は高くなるのですが、あまり多すぎてもいけません。データ数を多くすると今度は時間の幅が長くなりますから、その間の音の変化がわからなくなってしまうためです。

前置きが長くなりましたが、音のスペクトル分布を求めて1/fゆらぎと称している例ではどうやって解析しているのかを以下に図示しましょう。

誤ったゆらぎ解析の例

通常のCDでは1秒間に44100個のデータが記録されていますので、これを曲の頭から短い区間に区切っていきます。ここではFFTのデータ数が2048個であるとして、曲を2048個ずつのサンプルに切り刻んでいきます。3分の曲だったとしても、3×60×44100÷2048 = 3876個もの区間ができるわけです。そして、そのそれぞれの区間ごとにFFTを行ってスペクトルを求め、最終的にそれらをすべて積み重ねて曲全体のスペクトルとします。そしてそれを両対数グラフで表して、傾きが-1になっていたら1/fゆらぎを持っているとするわけです。

ではこうやって求めたスペクトルは何を表しているのでしょうか? 先ほど解説したように、一つ一つの区間はある瞬間に鳴っている音のスペクトルに対応しますから、ある時はフルートのスペクトルだったり、ヴァイオリンのスペクトルだったりするかもしれません。そしてそれらをすべて積み重ねたスペクトルは、結局すべての瞬間のスペクトルを平均化したものに過ぎません。これは非常に大ざっぱな見方をすれば、曲の中で使われている楽器のスペクトルを全部足し合わせたものに他ならないことがわかるでしょう。

この方法を使った文献では音楽のジャンルごとにスペクトル分布の傾向を調べ、クラシック系の音楽は1/fゆらぎに近いのに対して、ロック系の音楽は1/f0ゆらぎに近いという結論を導いたりしていますが、上記の考察から言いますと、これはゆらぎとは異なるまったく別のものを評価していると言わざるを得ません。楽器の特性から考えますと、管楽器や弦楽器などの自然楽器は高域成分がなだらかに落ちていくのに対し、ハイハットやベースが強調されたいわゆる「ドンシャリ」系の音は高域と低域が強調されてスペクトルがフラットになります。ですから上のような結論が出てくるのはむしろ当たり前といえるのです。それは全体的な音の周波数特性を表しているだけで、決して音楽のゆらぎではないことは明らかです。

この方法が明らかに矛盾しているのは、次のようにして考えるとよくわかります。もし2048個ずつのサンプルに区切る際に、曲の先頭からではなく順序をバラバラにしてかき混ぜたとします。でも最終的に足してしまえば結果はやはり同じになるはずですね。これは音楽的に言えば音符の並びをぐちゃぐちゃに入れ替えても元の曲が1/fゆらぎだったら必ず1/fゆらぎになるということです。そんなことをしたらどんな名曲もただの雑音になってしまいますね。つまり音の流れというか、時間というものが全く考慮されていないからこうなるのです。中には音符の並びのパターンが1/fゆらぎに影響を与えると言及しながら、最終的には音のスペクトルを求めているという完全に論理が破綻しているものまで見られました。しかも専門家と思われる人までもがこの種の誤解をしていることに驚きを禁じ得ませんでした。

最も本質的なもの、それは時間

上記のような誤解がなぜ生まれてきたのかというと、それは音楽が「波形」そのものだからではないかと推察しています。つまり音の波形をフーリエ変換すれば即スペクトルになるという短絡的な発想から生まれたものだと思います。しかし波形をフーリエ変換してみても音の周波数特性しか出てこないことは明らかです。これは言ってみれば音を波形という非常にミクロな視点で見ていることに相当します。初めに述べたように、われわれ人間は音を波形の変化としては認識しません。こうした非常に短い時間に起こる波形の変化をゆらぎとして捉えているのではないはずです。瞬間瞬間に切り取られたスペクトルをいくら積み重ねてみても、そこに時間の要素はまったく含まれていないことは明らかです。

ゆらぎという言葉の裏には「時間的なもの」というニュアンスが含まれているように思います(実際は空間的なものも含まれますが)。ちょうどロウソクの炎がゆらゆらと揺れている場面をイメージしてください。われわれが感じる「ゆらぎ」とはこういった時間とともに変化するものを指すのではないでしょうか? そうだとすれば、時間的には数分の1秒から数十秒といったレベルの周期で「何か」が揺れているものをゆらぎと感じ、それが1/fになっていると心地良く感じるのではないかと考えると自然に理解することができます。ここから音をミクロに見るのではなく、もっとマクロな視点で見ていく必要があるという考え方に行き着くのです。

1/fゆらぎの意味がわからない方は下の記事もお読みいただけると幸いです。
1/fゆらぎの本当の意味
前記事「音楽のゆらぎの正体」は本コラムの中で最も言いたかった核心部分なのですが、残念ながら私の力不足で誰にでもわかるように説明し切れていないと思います。時々音楽のゆらぎに関して質問のメールをいただくのですが、正しく理解できている方はほとんど...

コメント

  1. oooo より:

    音楽系の波形編集をやっていますが、私も音楽で言う1/fゆらぎは何か信憑性に欠けると思っていました。炎の揺らぎやさざなみと音楽が比べられるのか。なので読ませていただいて合点がいきました。知り合いにも「あの歌手は1/fゆらぎの声を持っている?」と聞かれることがありますが、シンプルに「わからない」と言うようにしていますwですので、これからもわからないと答えますw

  2. 管理人 より:

    率直に言って99%の方は誤解していると思います。音のスペクトルを解析してゆらぎと称している例があまりにも多いです。
    そもそも何をもって音楽のゆらぎとするのか? その定義自体が非常に曖昧ですね。
    定義次第で音楽のゆらぎはいくらでも変わります。