ミスマッチ陰性電位とカクテルパーティー会場
事象関連電位(何らかの刺激に伴い頭皮上で記録される電位、認知や思考などに関連するといわれる)の中で、ミスマッチ陰性電位(mismatch negativity:MMN(4))というのがあります。これは、同じ音刺激が連続して規則的に聞こえる間に(標準刺激)、時々聞こえてくる周波数、強度、持続長などがちがう逸脱音(偏奇刺激)に反応して、150~200ミリ秒後に陰性電位が記録されるものです。まず100ミリ秒前後で一次聴覚野の上側頭平面に情報が届き、そのあとすぐに前帯状皮質で記録されるもので、注意の転換に関係しているといわれます。この電位測定の際、被験者は他の画像を見るように言われるなど、音を無視するように指示されます(音に対して非注意の状態となります)。そして逸脱音が提示されると、その音に反応してこのMMNが生じます。これは、それまでの連続した規則的な(定常)音が記憶されている際に(記憶痕跡がつくられているといわれます)、逸脱音はその記憶情報と比較照合され、今までのものとは異なる(ミスマッチ)と認識されて(聴覚変化の識別)、MMNが出現すると考えられます。このMMNは自動的で、注意によらない前注意的な反応と考えられています(非注意条件でも注意条件でも同じように誘発され、注意に依存しないということです)。
ここで、カクテルパーティー会場で誰かと会話している状況を考えてみますと、聞こえてくる種々雑多な音声を、ある意味で定常的な状態と考えると、その中で急に耳に入る「自分の名前」は、定常状態とは異なった状況として、またある意味で何らかの変化として感知することとなると思われます。この「自分の名前」を言われたはじめの時点では、それに全く注意が向いていない状態と考えられますので、最初の一文字目からリアルタイムに聞こえることは理論的には考えにくいので、「自分の名前」がすべて発音され、それが鼓膜から聴覚皮質に到達し(はじめから注意を向けていれば、ここではっきり聞こえるわけですが、注意を向けていない場合はここではまだはっきりとは聞こえないはずで)、前帯状皮質からMMNが生じ、これは前注意的(自動的)な処理過程(注意の転換)で、この直後に(またはほとんど同時に?)注意的な処理過程に進む(おそらくは前頭前野背外側部などが関係してくるのではないかと思われます)といわれているわけですが(二段階仮説)(これによって受動的注意が能動的注意に移行するといわれています)、この際の上位機構が聴覚情報処理を調整しているとのことです(このことは感覚情報保存に伴って聞こえるということではないかと考えています)。まとめますと、非注意状態での聴覚情報→MMN(自動的な注意の転換)→上位機構による(感覚情報保存に伴う)聞こえと注意処理過程(意識をもった能動的注意)への移行、ということになると思います。また、感覚情報保存がされているのは聴覚野ではないかとは考えますが、まだはっきりわかっていないと思います。この場合のカクテルパーティーでの状況に関しては次のことがいわれています。「多様な音が混じり合って聞こえてくる騒々しいパーティー会場の中で自分の名前を呼ぶ者がいると、その声は他の音よりも明瞭に聞こえてきます。聞こえてくる情報が周囲の声や雑音よりやや小さくても記憶や受動的注意の働きによって自分に重要な情報に対して能動的注意を向けることが可能になります」。私はこの中で、他の音よりも明瞭に聞こえてくるということに関しては、感覚情報保存でいったん保持された音声が、タイムラグのあとで聞こえてくる際に明瞭に聞こえるということと考えています(タイムラグといっても、MMNの直後ということですと、ほんの100―200ミリ秒後程度と思われます)。
また自分の名前だけではなく、近くの人の話し声の内容に関しても、気になる話題(フレーズやワードなど)が聞こえてくることがあるように思います。このときも、誰かと会話している最中であれば、はじめの一語から注意を向けて聞いているわけではないので、リアルタイムに聞こえるというわけではなく、ある程度意味をもつ内容として発話されてから、それに急に注意が向いて聞こえるということになるのではないかと思いますが、その場合も同様の機序で、注意転換後のタイムラグのあとに聞こえてくるということではないかと思われ、感覚情報保存が関与していると考えています(この場合もその気になったフレーズが何となく他の音声よりもはっきりと聞こえるような印象をもっています)。
MMNは、進化の過程において、敵が近づいてくる音(通常とは異なる音)に対してすばやく注意を向けるという機能に関係していると考えられているようです。
再び両耳分離聴課題について
ふだん、いろいろな音声が聞こえる際、それらが全く同時ということでなければ、次々と注意を転換、移動していって、それらの音声を意味処理していけるわけです。意識をもっての注意の転換には百数十ミリ秒程度かかり、意味処理には200ミリ秒程度はかかるといわれています。ここで、さきほどの両耳分離聴課題では、片方の耳からの追唱にかなりの注意資源を使わなければならないと考えられ、非注意の耳からの情報に対しては、意識をもっての注意転換後に意味処理をすることは、おそらく時間的にもできない状況と思われます(もちろんそちらの耳の情報には注意を向けないことが課題の条件ですが、仮に注意を向けたとしても、追唱を優先させるならば、意味処理まではできない状況と思われます)。
このことから、両耳分離聴課題の結果を考えますと、200ミリ秒以上かかるといわれる意味処理が必要な情報には気付かないということではないかと思われ、気付かれた内容はもっと短時間で知覚できるような内容と、(c)(d)のように瞬時に感覚的に(?)わかるような、知覚できるような内容ということではないかと思います。さきほど申しましたように、自分の名前(e)は、自動的な注意の転換後に認識されるということと思います。これは、MMNの出現後に認識されると考えられ、100〜200ミリ秒程度かかると思われますが、おそらく自分の名前の認識は速い(?)のではないかとも思います。(g)の結果は、電気ショックで条件付けられた単語(例えば都市名)と関連したカテゴリの単語(都市名)が、意識にはのぼらなくても認識はされているということを意味していますが、これも「自分の名前」と同様に、定常状態からの自動的な変化検出(電気ショックと関連した危険性の察知)という過程が起動した、自動的な注意の転換(MMNの出現)を経て認識されたというようなことではないかと思っています。この場合の単語の認識には、ふつうなら170〜200ミリ秒程度かかりそうな印象ですが、もしもその単語(都市名)が、関連カテゴリとして意味プライミングまたは直接プライミングを受けていれば、その単語の情報処理は速くなると考えられます(プライミング〔効果〕は記憶のところで出てきます)。また、その単語は、非注意状態のため、感覚情報保存によりタイムラグを伴って認識はされることとなると思われますが、もしそれが意識にのぼらないとすれば、同時に行われる追唱課題の遂行のほうに注意が向いているために、意識にのぼってこないということと思われます。これによって認識はされても意識はされない状態となります。また(f)に関しては、追唱する内容は(ある程度は)意味処理もされているものと考えられ、一方の耳からの情報だけを追唱しているわけですが、もう片方の耳から関連した単語が入力されると、意味処理の過程にその単語が組み込まれてしまう(一緒に認識されてしまう)ということではないかと考えられます(組み込まれた時点ではその単語が逆の耳からのものであることは認識されていないのでしょう)。この単語の認識には注意の転換の過程は必要なく(意味処理自体、言語的にもある幅をもっているため、その中に属する単語、関連語であれば、逆の耳からのものであってもその処理過程に自動的に入り込めるということと思います)、また意味プライミング効果もあると思われ処理が速いためにすぐに認識される(聞こえる)ということと思われます(同じような意味内容のものは認識が速いと考えられます)。その後、その単語が逆の耳からのもので追唱する必要がないという認識がなされてから追唱が続行されるので、その分の時間がかかってしまうということと思われ、このため追唱に影響してしまうということと思います。
感覚情報保存によって聞こえのずれが生じると考えられる他の状況
また私の経験ですが、仕事中手を洗っていて、手に注意が向いている際に、近くで職員がやや大きな声で何か言ったのですが、はじめそちらに注意が向いていなくて何か言ってるな程度の認識だったわけですが、すぐ次の瞬間に注意を向けると、その声のはじめから(注意が向いていなかった最初の部分から)聞こえてきたということがありました。これは、注意を向ける前のよく聞いていなかった部分が感覚情報保存の状態となっていて、注意を向けた瞬間に、保存されていたその声の内容がはじめから聞こえてきて理解できたというものと考えられ(しかも声としてやや大きめに感じました)、これによって最初から聞こえたような状態となったのです。このとき、その聞こえのわずかな遅れ、タイムラグに気付いたのですが、それはほんの200ミリ秒弱程度の遅れと思われました。
感覚情報保存に伴う音声の遅れが明らかな状況
さきほどの経験をもとに、次のような状況も考えられると思います。誰か(Aさんとします)が何かに非常に集中しているような場合、例えば精密な作業など、間違えたらたいへんなことになってしまうような、かなりの集中度が必要な状況の場合に、たまたま近くにいた同じ職場の人で、Aさんの作業にあまり関係がない人(Bさんとします)が、Aさんに何か話しかけたとします。この場合、Aさんは、おそらくそのBさんの発言を聞いている余裕などはないでしょうし、その話を聞いて理解する気もないでしょうが、Bさんが何か言ったかな程度の感覚といいますか、何らかの音声としてはそれが聞こえた、耳に入ったとします。この場合、音声としては聞こえても、その話の内容、意味まではわかっていない、理解していないという状態が一瞬生じると考えられます。このあとで、Aさんがどれほど自分の行為に集中しているかにもよるのですが、次の瞬間に、その発言の意味するところが急にわかる、頭に浮かんでくるということがあると考えられます。Aさんの集中の度合いによるというのは、例えばAさんが本当に真剣にほぼ100パーセント作業に注意を集中していて、周囲を完全に無視しようとするような状況であれば、はじめからBさんの声自体がほとんど聞こえていないことになるかもしれませんが、もしも注意の度合いが70パーセントくらいで、少しは周囲の状況を認識できる、話の内容を理解できる程度の余裕があるとすれば、Bさんの発言が音声としてだけ聞こえたその直後に、急にその話の内容の意味が理解される、意味が頭に浮かぶ、という現象が起きることがあると思われます。これは、その話にあまり注意が向いていない場合、はじめは単なる音声としてだけ聞こえてから、次の瞬間に(その声と同時に)その話の内容と意味が意識にのぼる、理解されるということで、この間に一瞬の時間的な遅れが生じることがあると思われます。このときは、本人もそのタイムラグを認識できるはずです。この場合も、刺激が聴覚皮質に到達し、情報処理された時点で聞こえていて、このときは音声としてだけ聞こえたということですが(ただこのとき音声だけといっても、ある程度の処理された情報、例えばそれがBさんの声であることなどはわかっているはずです)、注意がかなり他に向いてしまっているために、内容の理解までには至っていない段階ということです。このとき注意の度合いにもよりますし、その話を聞く気があるかどうかにもよるとは思いますが、次の瞬間にその意味内容が(音声とともに)急に頭に浮かぶということです。この際、はじめに音声として聞こえ、そのあとで意味内容が頭に浮かぶということで、その間情報は保存されています。これも感覚情報保存、エコイックメモリーの機能と考えられます。一般に、エコイックメモリーは4秒間以内くらいといわれています。
このように、声が聞こえてからその意味がわかるまでのタイムラグが生じる場合というのは、他のことにかなり注意が向いているときなどの特殊な状況と考えられますので、ふだんの生活ではあまりないように思いますが、しいていえば、机に向かって仕事にかなり集中しているようなとき、後ろから誰かに何かを言われて、うるさいなと感じて一瞬無視しようとしたときなどに起きるかもしれません。
ふだんの聴感覚についての追加
さきほどのように、ふだんいろいろな音声が聞こえてくる状況だとしても、それらが全く同時に聞こえてくるのでなければ、次々と注意を転換していって、順次それらを聞きながら意味処理していけるわけで、これによって音声内容を一つまた一つと連続的に次々と知覚していけるわけです。また、はじめは注意が音声以外に向いていて、最初の一語目からリアルタイム(発話と同時)には聞いていないという状況での聴覚情報に対しては、感覚情報保存によって、いったん聴覚情報が保存、保持されていて(聴覚での感覚情報保存は4秒間程度までといわれます)、注意の転換後に聞こえるという現象があることをお話ししました。この際、その情報(フレーズ、文など)の長さにもよると思いますが、注意の転換後に(能動的注意を向けてから)、その文の途中からリアルタイムに聞こえるようになった場合は、その時点よりも前の文の内容が、感覚情報保存に伴って聞こえてきて、あたかもはじめから注意して聞いていたかのような状態となると考えています。例えば、他に注意が向いている際に「最近の若い方は了解のことを〝リ〟って表現するのですよ」という発話がされたとして、注意の転換後に、途中の「了解のことを……」からリアルタイムに聞いたとした場合、その前の「最近の若い方は」の音声が感覚情報保存の状態となっていて、その音声も(すぐに)認識され(聞こえ)、文のはじめから聞こえていたように感じるということです(ただこのように遅れて聞こえる状況があったとしても、実際にはほんの数百ミリ秒間から、長くても数秒(1〜2秒?)間程度のことと思いますので、ほとんど気付かれないようにも思います。また、途中で音声に注意を向けなければ、仮に感覚情報保存がされていたとしても認識はされないということです)。また他には、自分が何となくぼうっとしているようなときで、誰かが近くで何かを言っているような状況のとき、「ねえ、聞いてる?!」と突然声の調子を変えて刺激された瞬間、その直前の(何となく)耳に残っていた音声が(はっきりと)聞こえ(てき)たという経験はないでしょうか。これも感覚情報保存による聞こえと考えられます。
また一般に、もしも聞こえた音声が数秒間耳に残るような感じがあったとすれば、感覚情報保存によるものかもしれません。
聴覚ではこのように感覚情報保存の時間がやや長いと考えられていて、聞こえにおいての時間的な遅れ(ずれ、タイムラグ)を認識できることがあるのです。その音声への注意が向いていない度合いが強いほど、情報保存後に聴感覚が意識されるまでに(聞こえるまでに)時間がかかるように思います。ただ、前の音声が保存されて遅れて聞こえてきた場合、もしも次の音声と重なってしまうようなことがあると不自然なのですが、このようなことは経験されないように思います。視覚では感覚情報保存は視覚持続という現象となるわけですが、聴覚の場合の感覚情報保存は、持続するということではなく、(厳密には再び)聞こえるということとなります。
再び聴感覚と注意について
目の前にいる人が何かを言っている場合は、視覚的にも注意を向けながら聞けるので、音声ははじめから聞こえることになります。目の前にいる人でなくても、誰かが今から何かを話すということがわかっていれば、あらかじめそちらに注意を向けておいて、はじめから聞くことができます。また、前から話が続いているなら、それに注意を向け続けていれば、その話の続きはリアルタイムに聞こえてきます。もしも、「たった今から、聞こえてくる音声(人の話し声)を、すべて逃さずに聞き取ってやろう!」とすべての音声にギンギンに注意を向けてかまえている姿勢でいるのであれば、少しでも音声が聞こえれば瞬時にそれに注意を向けることは可能とは思いますが、ふつうはそのような姿勢にはなっていないでしょう。さきほど申したように、はじめからその音声に注意を向けている状態でなければ(カクテルパーティーのような特殊な状況でなくても)、音声への注意というのは、厳密に順番を考えるなら、まず聞こえてから注意が向けられるということになるでしょう。つまり厳密には、[a]まず聞こえてから、[b]聞こうとする意図が起きて、[c]そして続けて聞く、ということになるわけです(これは、認識としてのはじめはボトムアップ的ということです)。ふだんの日常での聞こえというのは、このようなことが多いと思いますので、[a]「まず聞こえてから」というところで(はじめから注意して聞いているわけではないので、非注意の間に発話された部分が)感覚情報保存の状態となっていて、それが聞こえるということが、(ある程度の頻度で)起きているのではないかと思うのです。ただそうだとしても、ふだんこのことには気付かないように思います。
この節では聴感覚に関して、視覚と同様に、意識化(聞こえ)に相応の時間がかかっていると思われること、聴覚では感覚情報保存の時間がやや長いことがあり、音声に注意が向いていない場合に、いったんその音声情報が保存されていて、注意の転換後に聞こえるという感覚情報保存に伴う聞こえの遅れ、タイムラグを感じられる状況があることなどをお話しいたしました。ふだん、さまざまな音声が聞こえる状況においては、それらの音声に次々と注意を向けていきながら、それらを聞いているということになると思います。
また、今までの感覚全般についていえることですが、さまざまな外界の刺激を感覚として知覚する場合、感覚受容器から脳の感覚皮質に情報が到達し、記憶情報との照合を経てから感覚意識が生じるまでに、一般に100~200ミリ秒程度はかかるわけで、その時間だけ意識として遅れると日常の文脈として合わない場合があるかもしれませんが、その感覚意識が、刺激情報が感覚皮質に到達してから、速い時点で感じられたということになれば、外界の事象に遅れることなく文脈に沿うことができるわけです。
- 4)誘発電位測定マニュアル2019 日本臨床神経生理学会編集 2019年 診断と治療社
| 「意識」と「認識の過程」 【全7回】 | 公開日 |
|---|---|
| (その1)意識のゆりかご─意識はどこで生まれるのか | 2025年10月31日 |
| (その2)視覚 | 2025年11月30日 |
| (その3)視覚 | 2025年12月26日 |
| (その4)聴覚 | 2026年1月30日 |
| (その5)聴覚 | 2026年2月27日 |



