Восприятие Средний

Ухо как спектроанализатор: парадокс Фурье

Глаз не может отличить чистый жёлтый свет от смеси красного и зелёного. Ухо мгновенно слышит разницу между чистым тоном и аккордом. Почему у зрения нет «тембра»? Базилярная мембрана, метамерия и закон Ома для акустики.

Длительность
1–2 часа
Бюджет
0 ₽
Возраст
13–99 лет
Сложность
Средний
#восприятие #Фурье #метамерия #тембр #базилярная мембрана #колбочки #акустика #оптика #нейронаука #психофизика

Схема носит иллюстративный характер и может содержать упрощения. Если вы заметили неточность — воспользуйтесь кнопкой обратной связи.

Парадокс

Возьмём два источника жёлтого света:

  1. Монохроматическое излучение с λ = 580 нм (чистый жёлтый)
  2. Смесь красного (λ ≈ 700 нм) и зелёного (λ ≈ 530 нм)

Глаз не отличит их. Они выглядят абсолютно одинаково.

Теперь возьмём два звуковых сигнала с тоном 440 Гц:

  1. Чистая синусоида 440 Гц
  2. Скрипка, играющая ноту Ля той же высоты

Ухо мгновенно слышит огромную разницу — это называется тембр.

Вопрос: почему у зрения нет аналога тембра?

Три колбочки против двадцати тысяч

Зрение: трёхмерная проекция

Сетчатка содержит три типа колбочек:

  • S (short) — чувствительны к ~420 нм (синий)
  • M (medium) — ~530 нм (зелёный)
  • L (long) — ~560 нм (красный-жёлтый)

Каждая колбочка суммирует весь поступающий свет в одно число — интенсивность в своём диапазоне. Полный спектр света (бесконечномерный объект) проецируется в трёхмерный вектор (S, M, L).

Разные спектры, дающие один и тот же вектор (S, M, L) — метамерные пары. Мозг не имеет информации для их различения.

Именно поэтому работают RGB-мониторы: они излучают только три узкие полосы длин волн, но создают иллюзию любого цвета.

Солнечный «жёлтый»:  непрерывный спектр 560-600 нм
Монитор «жёлтый»:    только 700 нм (R) + 530 нм (G)
→ одинаковые (S, M, L) → неотличимы для глаза

Слух: двадцать тысяч каналов Фурье

Базилярная мембрана — спиральная структура внутри улитки (кохлеи) длиной ~35 мм. Её жёсткость и ширина меняются по длине: у основания жёсткая и узкая, у верхушки — мягкая и широкая.

Это создаёт механический частотный фильтр:

  • У основания резонируют высокие частоты (~20 000 Гц)
  • У верхушки — низкие (~20 Гц)
  • Каждая точка вдоль мембраны — отдельный «канал»

На мембране расположено около 20 000 волосковых клеток — каждая сигнализирует о своей частоте. Мозг получает не суммарный сигнал, а полный частотный спектр.

Это аналоговое преобразование Фурье — Georg von Békésy получил за его открытие Нобелевскую премию по физиологии (1961).

Скрипка Ля (440 Гц):
  440 Гц  →  базилярная мембрана фиксирует пик
  880 Гц  →  второй пик (первый обертон)
  1320 Гц →  третий пик
  ...
→ мозг слышит: «скрипка», а не просто «тон 440»

Флейта Ля (440 Гц):
  440 Гц  →  сильный пик
  880 Гц  →  слабый пик
  другие  →  почти ничего
→ мозг слышит: «флейта» — тот же тон, другой тембр

Закон Ома для акустики

В 1843 году Георг Симон Ом (да, тот самый) сформулировал акустический закон Ома:

«Ухо анализирует сложный звук на простые синусоидальные компоненты и воспринимает каждую из них отдельно»

Это одна из немногих ситуаций, когда биологическая система явно реализует математический алгоритм — теорему Фурье — физически.

Гельмгольц в 1863 году подтвердил это экспериментально, подбирая наборы резонаторов к разным инструментам.

Почему эволюция сделала именно так

Зрение: пространство куда важнее спектра. Трёх рецепторов достаточно для различения большинства биологически значимых объектов. Добавление большего числа цветовых каналов потребовало бы огромного увеличения числа нейронов при малой выгоде.

Кроме того: в природе основным источником «спектральной информации» служит освещение (Солнце, облака), а не цвет объекта. Метамерия — не баг, а фича: мозг компенсирует изменения освещения, сохраняя восприятие цвета объекта постоянным (цветовое постоянство).

Слух: частотная структура звука — главный носитель информации о источнике. Голос человека, шорох листьев, рычание хищника — всё различается именно по спектру. Не иметь частотного анализа означало бы не слышать речь.

Эволюция «решила» иначе: вместо цветового постоянства — тембровое распознавание.

Следствия, которые нас окружают

Почему монитор работает

RGB-монитор эксплуатирует метамерию: три «неправильных» спектра обманывают три колбочки. Для глаза разница невидима. Для спектрометра — огромна.

Почему оркестровка имеет смысл

Если бы ухо не делало Фурье, мы не слышали бы разницу между флейтой и гобоем на одной ноте. Оркестровка — это работа с тембрами. Она работает именно потому, что ухо анализирует гармоники.

Кохлеарный имплант

Устройство обходит повреждённую улитку: микрофон → цифровой банк фильтров → 12–22 электрода вдоль улитки. Каждый электрод соответствует частотному каналу. Это прямая техническая реализация того, что делает базилярная мембрана.

Синестезия «цвет — звук»

Некоторые люди «видят» цвета при прослушивании звуков. Но цвет — всегда один, а не спектр: мозг проецирует трёхмерное зрительное пространство на звук, а не наоборот. Синестет никогда не «слышит» спектр цвета.

Почему MP3 работает

Алгоритм сжатия MP3 эксплуатирует то, что ухо делает Фурье: он отбрасывает частотные компоненты ниже маскировочного порога. Громкий звук маскирует тихие в той же полосе частот.

Квантовый и наноуровень: где физика становится экстремальной

Глаз: один фотон

Палочка сетчатки содержит молекулу родопсина — белок с хромофором 11-цис-ретиналь. При поглощении одного фотона ретиналь меняет форму (цис → транс-изомерия). Это запускает ферментный каскад, усиливающий сигнал в ~10610^6 раз за миллисекунды.

Пороговое восприятие достигается при ~5–7 фотонах на сетчатку — остальное теряется ещё до фоторецепторов (поглощение хрусталиком, рассеяние). Гект, Шлаер и Пиренн подтвердили это психофизическим экспериментом в 1942 году: испытуемые сообщали о вспышке, если на сетчатку попадало от 5 до 14 фотонов.

Отдельный фоторецептор реагирует на один фотон — это и есть квантовый предел фотодетектирования.

Для сравнения — лабораторные однофотонные детекторы:

ПриборЦенаУсловия
Лавинный фотодиод (APD)$10 000–100 000комнатная температура
Сверхпроводящий детектор (SNSPD)от $100 000охлаждение до 1–4 К
Фотоумножитель (ФЭУ)от $1 000шумнее, КПД ниже
Палочка сетчатки0 ₽37°C, без питания

Квантовая эффективность родопсина ~50–70% — сравнима с лучшими охлаждаемыми детекторами.

Принципиальное отличие: лабораторный детектор выдаёт сигнал от каждого фотона. Глаз — нет: одиночный фотон не доходит до сознания, маскируясь тепловым шумом. Для осознанного восприятия нужно 5–7 фотонов в малом пространственно-временном окне — это биологическая защита от ложных срабатываний.

Ухо: суб-атомные колебания

Волосковые клетки улитки несут пучки стереоцилий высотой ~5–50 мкм. Их отклонение открывает механо-чувствительные ионные каналы.

При пороговом уровне звука (0 дБ СПД ≈ 20 мкПа) стереоцилии отклоняются примерно на 0,3\mathbf{0{,}3} нм — это ~3×10103 \times 10^{-10} м, меньше диаметра атома водорода (~0,53 Å = 0,053 нм… нет, 0,3 нм ≈ 3 ангстрема ≈ 6 радиусов атома водорода).

Ещё важнее — энергетика. Мощность порогового звука на барабанную перепонку:

Pthreshold1016 ВтP_{threshold} \approx 10^{-16} \text{ Вт}

Это порядка единиц kBTk_BT в секунду — уровень теплового шума. Ухо работает буквально у термодинамического предела измерений.

Как ухо умудряется выделить полезный сигнал из теплового шума такой же мощности? Частично — через активное усиление: наружные волосковые клетки действуют как пьезо-усилители, совершая обратное механическое движение и усиливая колебания мембраны до ×100. Это и есть источник отоакустической эмиссии — улитка сама излучает звук.

Таким образом: глаз и ухо работают у физических пределов, заданных квантовой механикой и статистической физикой. Это не случайность — это результат ~500 млн лет эволюционной оптимизации.

Граница применимости

Слух не идеальный спектроанализатор:

  • Ниже ~50 Гц частотное разрешение резко падает
  • Длительность звука менее ~20 мс: ухо не успевает выделить частоту (принцип неопределённости Гейзенберга для времени-частоты!)
  • Маскировка: сильный звук «скрывает» слабый в той же полосе

Зрение тоже не абсолютно метамерное:

  • Палочки (ночное зрение) — один тип рецепторов; ночью мир серый
  • Тетрахроматы (~2% женщин) имеют четвёртый тип колбочек и различают то, что другим кажется одним цветом

Таким образом: ухо — приближённый Фурье-анализатор, глаз — приближённый трёхмерный проектор.

Опыт: почувствовать разницу

Специально: пещера или штольня

Пещера — идеальная лаборатория для обоих опытов: абсолютная темнота (нет ни уличного освещения, ни приборов — ноль фотонов) и практически полная тишина (нет города, вентиляции, ветра).

В оборудованной туристической пещере с гидом — безопасно и доступно. В необорудованных штольнях — только с опытными взрослыми: скользкие камни, перепады высот, CO₂ в тупиках, риск заблудиться.

Там темновая адаптация происходит по-настоящему за 20–30 минут, и тиннитус слышен максимально отчётливо. Рекомендую как экскурсию с классом в оборудованную пещеру с заданием: «Первые 5 минут — не шевелитесь и не говорите. Что вы услышали и увидели?»

Кто хочет идти дальше — спелеология. Секции есть во многих городах, принимают с 12–14 лет. Это не только физика восприятия, но и топография, геология, командная работа и навыки безопасности под землёй.


Опыт 0: почувствовать квантовый предел дома

Темновая адаптация и авертированное зрение. Зайдите в тёмную комнату и подождите 30 минут — зрачок расширяется, родопсин восстанавливается. Смотрите чуть в сторону от слабого источника (свеча за несколькими слоями ткани). Дело в том, что центр сетчатки заполнен колбочками, а палочки сосредоточены вокруг — авертированное зрение переключает вас на палочки, и слабый объект «появляется».

Фосфены в абсолютной темноте. Закройте глаза и накройте их ладонями в полной темноте. Через 30–60 секунд увидите случайные вспышки и пятна — это тепловая изомеризация родопсина, молекулярный тепловой шум. Мозг интерпретирует его как свет. Именно этот шум и задаёт нижний предел зрения.

Тиннитус-тест. Зайдите в самое тихое место (подвал, глухая комната). Наденьте беруши. Через 10–20 секунд услышите тихий звон или шум. Это не болезнь — это усиление слуховой системы на фоне пустого входного сигнала. Мозг привык компенсировать уличный шум, и в тишине «слышит» своё усиление.

Отоакустическая эмиссия (не дома, но любопытно). Здоровое ухо само излучает звук: внешние волосковые клетки активно колеблют мембрану, усиливая слабые тоны. Сурдологи измеряют эту эмиссию миниатюрным микрофоном. Новорождённым проверяют улитку именно так — в роддоме, в первые часы жизни.


Опыт 1: метамерия на мониторе

Откройте инструмент разработчика браузера. Найдите два CSS-цвета с одинаковым визуальным результатом, но разными RGB-значениями (метамеры на мониторе не существуют в чистом виде — но вы можете сравнить #7d7d00 с #808000).

Затем — возьмите лист жёлтой бумаги. Взгляните на него под лампой накаливания и при дневном свете. Цвет кажется «одинаковым» несмотря на принципиально разный спектр освещения. Это цветовое постоянство — мозг компенсирует метамерию.

Опыт 2: тембр на слух

Найдите онлайн-генератор сигналов (или воспользуйтесь аудиоредактором). Послушайте поочерёдно:

  • Синусоиду 440 Гц (чистый тон)
  • Прямоугольный сигнал 440 Гц (богатый обертонами: 440, 1320, 2200… нечётные)
  • Пилообразный сигнал 440 Гц (все обертоны: 440, 880, 1320…)

Высота звука (ощущаемая частота) — та же. Тембр — радикально разный.

Опыт 3: кто слышит обертоны

Попросите кого-нибудь сыграть на любом инструменте одну ноту. Другой человек называет «цвет» звука: тёплый, холодный, металлический, деревянный. Эти ощущения — прямое следствие распределения энергии по гармоникам.

Такого эксперимента для цвета нет: нельзя попросить кого-то назвать «тембр» жёлтого цвета — потому что этой информации в сигнале нет.

Связь с нарративной осью

Парадокс глаз–ухо — это вопрос о том, сколько измерений использует биологическая система для представления физического сигнала.

Свет — бесконечномерный (непрерывный спектр). Глаз сжимает его в 3D. Звук — тоже бесконечномерный. Ухо сохраняет ~20 000 измерений.

Почему такая асимметрия? Потому что в природе значимая информация в свете и в звуке распределена по-разному.

Стоячие волны на струне: гармоники — именно то, что слышит ухо как тембр → Розовый шум: спектр мощности — визуализация того, что ухо анализирует автоматически → Смешение цветов: RGB: метамерия в действии — почему три цвета заменяют весь спектр → Фигуры Хладни: двумерные гармоники — тот же принцип разложения на моды

Что почитать

Книги

  • Альберт Бреглман. Auditory Scene Analysis (1990) Фундаментальная работа о том, как ухо разделяет звуковые потоки — именно потому, что оно делает Фурье.
  • Георг фон Бекеши. Experiments in Hearing (1960) Нобелевская премия 1961 — за открытие механизма базилярной мембраны как частотного анализатора.
  • Рудольф Арнхейм. Искусство и визуальное восприятие (1954) есть на русском Почему зрение организовано иначе, чем слух — с точки зрения гештальтпсихологии.

Статьи

  • Ohm G.S.. Über die Definition des Tones (1843) — Annalen der Physik Акустический закон Ома: ухо анализирует звук по Фурье. Та же фамилия — другой закон.
  • Helmholtz H.. Die Lehre von den Tonempfindungen (1863) — Vieweg Гельмгольц объяснил тембр через обертоны и ввёл механическую модель резонаторов уха.
Обратная связь
Тип обращения
Ваша оценка
Сообщение
Подтверждение
Загрузка...

без персональных данных