Экспертное исследование формата GSM. Статья обновлена в 2023 году.

Экспертное исследование формата GSM

Экспертное исследование формата GSM

Исследование фонограмм на предмет наличия/отсутствия на них признаков монтажа или изменений, внесённых в процессе записи ли после неё, является одной из основных диагностических задач судебной фонографии.

Для примера будем использовать простую схему представления эксперту фонограммы:

1. Запись производилась не оперативными работниками, а частным лицом, не имеющим доступ к закодированному трафику у провайдера, предоставляющего данную услугу связи. При этом чаще всего используется диктофон, поднесённый к сотовому телефону. (По реальной экспертизе, в 2003 году, оперативными работниками отслеживались и записывались на аудиокассету переговоры GSM на стационарной аппаратуре (вероятно у провайдера), при этом на фонограмме отсутствовала пакетная передача сотовой трубки).

2.Производится компьютерный монтаж фонограммы. После монтажа через акустический канал или через флешь-память, или через оборудованный для записи вход диктофона происходит запись на диктофон.

3.Аудиокассета представляется в качестве вещественного доказательства и исследуется экспертом.

4.Вопросы типовые:

  • Является фонограмма оригиналом?
  • Имеются ли на фонограмме признаки изменений, произведённые в процессе записи или после?
  • Имеются ли на фонограмме признаки компьютерного монтажа?

Немного о самом формате GSM:

Школа фонографистов 13-25 октября в г. Москве на базе ЛСЭ Минюста России:

=============================================================

GSM является цифровой системой связи, в которой входной речевой сигнал абонента с помощью устройства в самом телефонном аппарате переводится в цифровую форму. Речь абонента разбивается на порции, длительностью в 0.02 сек. Для каждой порции с помощью специального алгоритма определяются основные параметры сигнала (параметры модели речевого тракта диктора), которые кодируются и в сжатом виде передаются в канал связи корреспонденту. Алгоритм кодирования речи описан в рекомендациях стандарта GSM (RPE-LPC/LTP- кодирование с регулярным импульсным возбуждением, линейным предиктивным кодированием и долговременным предсказанием). (См. ETSI-GSM М. Mouly, М-В. Pautet. The GSM System for Mobile Communications. 1992. - p. 701. A. Mehrotra. Cellular Radio Performance Engineering. Artech House. Boston-London. 1994. - p. 536. P. Vary. GSM Speech Codec. Conference Proceedings DCRC, 12-14 October. 1988.). Речевой сигнал на приемном конце вычисляется (как принято говорить, «синтезируется») по переданным параметрам. При этом структура восстановленного сигнала сильно упрощена по отношению к исходном звуковому сигналу (объем данных о речевом сигнале сокращен примерно в 5 –10 раз). Общее качество речевого сигнала в телефонном канале стандарта GSM и узнаваемость диктора по отношению к стандартному телефонному каналу ухудшаются. Это может заметить любой пользователь такой телефонной связи. Это доказывают и объективные измерения.

Указанный алгоритм сжатия имеет в своем составе детектор "тон-шум". Все известные на сегодняшний день детекторы тона имеют выраженный дефект: ложное детектирование тона в интенсивных шумовых сигналах. Вследствие этого шипящие звуки устной речи и многие акустические сигналы шумового характера "озвончаются". В алгоритме используется так называемая «постфильтрация» - заглаживание специальным фильтром всех дефектов восстановленного (синтезируемого) речевого сигнал на выходном конце. Как видно из вышесказанного, идентификация диктора по физическим признакам речи, диагностика акустического окружения и лингвистический анализ фонетических признаков речи в таком сигнале значительно затруднены. Основная проблема имеет принципиальный методологический характер и заключается в том, что исследованию подлежит синтезированный речевой сигнал, из которого алгоритмом кодирования исключены многие существенные идентифицирующие диктора, обстановку и канал связи особенности. Без решения вопросов достоверности воспроизводимого сигнала и границ допустимости его искажений специально для сигнала переговоров в GSM канале экспертное исследование не может быть полным.

Для увеличения числа свободных каналов связи согласно стандарту GSM используется так называемая Прерываемая передача речевого сигнала (Discontinuous transmission). Прерываемая передача представляет собой метод, основанный на факте, что за все время разговора человек говорит менее 40% времени. В телефонах стандарта GSM во время любого разговора в каждом телефонном аппарате работает специальный блок: Детектор Активности Голоса (Voice Activity Detector). В паузах между репликами этот блок выключает передачу данных от аппарата абонента, а для того, чтобы пустые паузы не создавали у абонентов слухового дискомфорта, эти паузы заполняются так называемым «комфортным шумом» которые генерирует специальный генератор этого «комфортного шума». Паузы заполняются шумом, спектральный состав которого близок к белому, а аудиторное восприятие отдаленно напоминает шум льющейся воды, или же наводки аналогового сигнала тональной телефонии. Таким образом, каждая фонограмма в GSM канале является «смонтированной» из реплик абонентов, между которыми производится вставка искусственного сигнала «комфортного шума». Весь смонтированный сигнал, то есть, и места стыков – монтажных переходов между передаваемым речевым сигналом и синтезируемым шумом сглаживаются специальным, так называемым «постфильтром».

Таким образом, речевой сигнал на выходе процедуры кодирования/декодирования по алгоритму GSM всегда имеет участки разрыва непрерывности передачи речевого сигнала в паузах между репликами абонентов и заполнение этих участков прекращения передачи полезного сигнала однородным искусственным сигналом «комфортного шума». Данная специфика речевого сигнала переговоров c использованием сети GSM вводит новые проблемы при обнаружении следов монтажа фонограмм. Если кто-либо выполняет монтаж новой фонограммы на основе одной или нескольких фонограмм переговоров абонентов, ведущих разговоры по сотовой телефонной сети GSM, то при размещении монтажных переходов в паузах между репликами разговора обнаружение таких точек монтажного перехода является сложной экспертной задачей, требующей особых методов исследования. (Тимко Е.В., Усков К.Ю. Проблемы криминалистического исследования цифровых фонограмм, Труды Киевского НИИ судебных экспертиз, 2001 г., текст статьи доступен в сети Интернет: http://expert.ua) Причем выполнить такой монтаж несложно, как с помощью компьютерных комплексов цифрового монтажа фонограмм, так и с помощью современных высококачественных аналоговых магнитофонов, применяя режим временной остановки записи. Еще более эта задача может осложниться, если смонтированная фонограмма была вторично пропущена через телефонную сеть, что может добавить в нее естественный непрерывный шум телефонного канала.

Дело в том, что на участках речевых пауз по самой природе цифрового кодирования по алгоритму GSM имеется не реальный звуковой сигнал, а искусственный сигнал «комфортного шума». В случае использования для монтажа фонограмм, в которых переговоры велись абонентами в одной и той же относительно тихой окружающей звуковой обстановке с одних и тех телефонных аппаратов обнаружить на участках монтажных переходов «простые» признаки монтажа обычно не представляется возможным. Дело в том, что между репликами стандартной фонограммы в GSM канале имеются участки вставки искусственного комфортного» шума. Отличить участки, вставленные самим алгоритмом кодирования GSM при передаче от искусственно вставленных в процессе монтажа фонограммы участков шума вместе с последующими репликами довольно трудно. Во всяком случае, в местах таких монтажных переходов отсутствуют щелчки, скачки уровня и частотного диапазона шумов, импульсы включения/выключения аппаратуры записи, обрывки слов или фраз, нарушения логического единства разговора. Процитируем мнение известных специалистов в области монтажа фонограмм из Киевского НИИ судебных экспертиз (Тимко Е.В., Усков К.Ю. Проблемы криминалистического исследования цифровых фонограмм, Труды Киевского НИИ судебных экспертиз, 2001 г., текст статьи доступен в сети Интернет: http://expert.ua): «Традиционные методики исследования на предмет монтажа фонограмм малоприменимы к указанной технике. В первую очередь это связано с тем, что при восстановлении фонограммы с целью сглаживания производится пост-фильтрация восстановленного сигнала. По этой причине, а также вследствие неадекватности передачи импульсных сигналов вмешательство в файлы фонограмм проявляет себя только на контекстно-зависимом (лингвистическом –С.К.) уровне».

Так как же формат GSM 6.10 искажает информацию, а так же возможно уничтожает все следы монтажа?

Для этого проведём эксперимент.

1. Создадим файл 20 сек белого шума уровнем (-6dB т.е.16345 отсчётов). В двух местах вставим паузы по 5 сек.

2. Отдельно сгенерируем 75Hz уровнем 200 отсчётов длинной 30 сек и наложим на первый файл. 75 Hz будем считать сигналом. Отношение сигнал к шуму по амплитуде =20Lg10(200/16375)=-38 dB, а по спектральной плотности см. рисунок видим его полное отсутствие:


Рис 1.

при разрешении окна в 32767 и усреднении спектра на шумовом участке 5сек. Наш сигнал практически не виден т.е. его уровень по спектральной плотности ниже шума.

Исследуем фазу сигнала 75 Hz см. рисунок №2:


Рис 2.

Фаза достаточно линейна, прекрасно визуализируется.

Сохраним файл в формате GSM 6.10 и исследуем его на том же интервале:


Рис 3.

Появился шум на участках, где был раньше только наш сигнал, но сигнал 75Hz остался в неизменном виде.

Фазовая характеристика нашего сигнала см. рис №4:


Рис 4.

осталась точно такой же (полная копия), как и на втором рисунке до переконвертации.

Таким образом, сам формат GSM 6.10 никаких сюрпризов нам не дал. Ничего страшного с нашей гармоникой он не сделал, только в полтора раза амплитуду поднял и всё. И теперь если на каком то этапе произойдёт вставка, удаление и т.д. на разрыве фазы мы сразу это заметим.

И так, для этого нам необходимо наличие непрерывных гармоник, которые проникли в канал записи в момент записи исходной фонограммы.

И это будет относится и к тем участкам, на которых используется действительно шумовая подставка комфортного шума.

Мы сейчас провели исследование только формата сжатия речи.

2. А теперь реальная экспертиза - март 2004 г.


Рис 5.

Фонограмма представляет собой запись разговора двух мужчин с использованием сотового канала на диктофон, поднесённый к трубке. Аудитивно, явно прослушивается разница двух дикторов и особенности акустического канала записи одного диктора и акустические особенности диктора, записанного после воспроизведения его речи сотовой трубкой. Исследование спектра выявило следующие особенности:

- Наличие спектральных полос, начиная примерно с частоты 650 Hz с интервалом 212.019 Hz. При исследовании фазовых составляющих было выявлено, что они все являются гармониками кратными 212.019 Hz, и при этом полное отсутствие двух первых гармоник. Исследование фазы гармоники 636Hz показало её достаточную линейность и возможность исследования на разрыв (вырезание, удаление) или на наложение (интерференция).

- Была выявлена особенность перехода в режим паузы: после прекращения разговора одним фигурантом, в канал продолжается передаваться сигнал с его стороны в течении 0.42, 0.83 или 1.25 сек. Как видно пост-передача сигнала кратна 0.42 сек. (возможно эта задержка связана с точным определение отношения сигнал\шум на передающей стороне после прекращения разговора).

- Исследование паузы показало наличие строгих временных интервалов передачи пакетов синхронизации (назовём эту передачу во время паузы синхронизацией) и полная привязка всех пакетов, включая пакеты синхронизации к временному интервалу 4.71 мсек (212.019 Hz). Является ли это стандартом для всех каналов GSM? Мнение что нет, но есть необходимость это в дальнейшем проверить. Это возможно в каких то допустимых пределах рядом с этими цифрами, но то что они закварцованы – просматривается линейность фазы и просматривается на этой линейности рязряд батареи питания диктофона (фаза плавно сползает по мере изменения скорости движения ленты). Пакеты синхронизации передаются строго через 12мсек. При этом через каждые три одиночных пакета передаётся пакет, состоящий из 9 одиночных пакетов см. Рис №6:


Рис 6.

Подведём промежуточную синтезирующую часть:

1.В канале GSM всё закварцовано и привязано к строгим временным отсчётам (имеется кварцевый генератор частот и временных интервалов).

2.Нам теперь известны:

- 212.019 Hz основная частота передачи пакетов и синхронизированные к этой частоте пакеты синхронизации (через каждые 12мсек во время паузы).

3.Задержка перехода в режим паузы: 0.42, 0.83 или 1.25 сек (хвосты передачи перед паузой кратные 0.42 сек).

4.Пакеты синхронизации передаются строго через 12мсек. При этом через каждые три одиночных пакета передаётся пакет состоящий из 9 одиночных пакетов. Если канал только что перешёл в режим паузы и сразу появился речевой сигнал – то выход из паузы может быть не кратен 12мсек, но фронт его совпадает с частотой 212.019Hz.

Таким образом, мы набрали часть букета признаков, которые может исследовать эксперт.

Продолжим исследования и приглядимся к частоте 864 Hz. (четвёртая гармоника от основной)


Рис 7.

Вторичная фазовая модуляция с периодичностью 0.56 Hz (выставлена сетка с интервалом 0.56 Hz). При этом фаза исследуемой частоты прекрасно просматривается в периодах паузы (синхронизации) что явно видно на рисунке. Таким образом, мы начинаем набирать признаки диктофона, на который производилась первоначальная запись (с этой скоростью вращается один узлов подающий или приёмный, или лента в кассете неравномерно вращается (трёт об край корпуса с такой периодичностью)). Данный признак является медленно меняющимся по времени воспроизведения и при том только в одну сторону (лента накручивается, диаметр катушки меняется), без интерференции (один из значимых признаков однократной записи т.е. один из признаков оригинала) что даёт нам хорошее поле для микроскопического анализа по всей фонограмме. Таким образом, на данной вторичной фазовой модуляции в дальнейшем исследовании, мы сможем восстановить скорость движения магнитной ленты и возможно отследить разряд батареи диктофона.

Да, но мы забыли посмотреть наши постоянно исследуемые составляющие 24,45,50,74,75, 80,85,90,100,150, 200,250,300 Hz. По логике вещей их там не должно быть (запись на диктофон).

Рис 8.

Оказывается 50 Hz присутствует, да ещё и огромной величины - 87dB, точно знаем что это не наша, а вот 219Hz- наша гармоника (используемый при оцифровке на рабочем месте эксперта диктофон выдаёт именно эту частоту), мы её не исследуем. Но откуда же взялась составляющая 50Hz, будем потом разбираться.

Замеряем линейность фазы 50Hz рис №9:


Рис 9.

1.Амплитуда просто громадная =1.1 отсчёт (см рисунок выше).

2.Фаза плавная, линейная, без разрывов.

3.Отсутствует интерференция (в случае наложения).

4.Попытка отследить близко расположенную 50Hz +\- 3Hz составляющую не привело к успеху (то же хороший признак).

4.Из канала GSM эта помеха ну никак не могла попасть, а на ленте есть.

5.Встаёт вопрос сделать запрос следователю о подробностях производства записи (такое впечатление, что сотовая трубка была запитана от сети, рядом расположили диктофон и произвели запись. Если подтвердиться то это будет возможно оригиналом, но про "категорический" если подтвердится - ещё рано, были случаи наличия 50Hz на оригинале и после монтажа они появлялись и отсутствовали).

6.Посмотрим левее на усреднённом спектре рис №8, там какие то всплески то же есть.


Рис 10.

7.Обнаруживаем 2.6, 4.5, 5.86, 8.9, 10.8, 14.1, 17.9Hz. Сейчас так же с ними будем разбираться: в какой момент они появились, и как они кратны плавно изменяющейся частоте вращения катушек ленты, и к изменению фазы 50Hz.


Рис 11.

4.4, 8.8 Hz между собой сфазированы. см рис №11. При этом частота увеличивается в процессе воспроизведения (фаза набегает)


Рис 12

5,86, 10,856, 14.47423, 18,09234 так же сфазированы между собой. При этом частота остаётся фиксированной (фаза строго линейна).

При сравнении с поведением 50Hz, было выявлено полное отсутствие синхронности поведения частоты и фазы исследуемых гармоник.

Исследование амплитудных характеристик всех гармоник показало их равномерность, постоянство на протяжении всей фонограммы.

Первое впечатление - что то сделано не то. Почему есть гармоники независящие от времени воспроизведения, а вторые явно привязаны к натяжению ленты. И при этом 5,86, 10,856, 14.47423, 18,09234 не кратны друг другу. Предложение такое: последние 4 гармоники являются результатом интерференции двух а может трёх частот, имеющих общую стабилизацию частоты (опорный генератор), и разностные между ними или от их разностных кратных составляющих попали в канал записи. Во время оцифровки ранее никогда не наблюдалось их. (Мысли в слух:"Купил источник бесперебойного питания, коммутатор свой заменил, попробую кА я по старинке без ИБП"). Переоцифровываю заново фонограмму, - результат отличается – сразу исчезли 5,86, 10,856, 14.47423, 18,09234 (Придётся в дальнейшем не забывать его отключать во время оцифровки). Теперь остались только две: 4.4 и 8.8 – вот они то и являются родными записывающего устройства, которым производилась запись (а мы в процессе их исследования должны ещё раз убедится что они родные именно канала записи исходной фонограммы).

С целью исследования синхронности передачи пакетов была полностью скопирована и наложена на себя фонограмма с периодически меняющимся сдвигом с целью выявления признаков явных вставок или удалений. Исследовались начало фронтов пакетов по всей фонограмме:


Рис 13.

Вот теперь только начинается полное исследование поведения данных трёх гармоник, сопоставление их, совмещение каждого всплеска аудитивно прослушивая фонограмму. Исследование 50Hz, поиск интерференции с другой такой же или близко-расположенной, кратной и т.д. Не забудем внимательно посмотреть на шумовую спектральную составляющую по всей фонограмме и усреднённую АЧХ обоих дикторов по фрагментно.

После завершения исследования:

1.Наличие 50Hz после получения дополнительной информации о процессе производства записи оказалось допустимым.

2.При исследовании 50Hz оказалось отсутствие интерференции с другой такой же или близко-расположенной частотой, детальное изучения хвостов алиазинга, что является хорошими признаками отсутствия оцифровки и пребывания ранее фонограммы в оцифрованном виде.

3.Не обнаружено частот кадровой развёртки мониторов - то же признак хороший отсутствия оцифровки и пребывания ранее фонограммы в оцифрованном виде.

4.Была полностью восстановлена скорость движения магнитной ленты в процессе записи (признак который я не представляю как можно умышленно подделать).

5.Исследование начало фронтов пакетов по всей фонограмме показало абсолютную синхронность фронтов пакетов и кратность их временному интервалу 12 мс.

6.Детальное исследование частоты 864Hz показало, что в моменты паузы, когда в канал передается только короткая синхронизация, а частота 864Hz сфазирована с синхронизацией, то эта гармоника прекрасно восстановилась ДАЖЕ В ПАУЗАХ (если вспомнить что в паузе через три одиночных идёт один пакет с девятью одиночными, а они привязаны и сфазированы с опорной, в паузах то же присутствует и прекрасно визуализируется).

Синтезирующую часть теперь намного легче написать эксперту: (уверенность, подтверждённая произведённым исследованием).

Для примера произведём монтаж, что бы его увидеть на трёх гармониках одновременно и на этой же фонограмме, при этом вырежем кусочек по паузам передачи (как говорилось как произвести монтаж в начале статьи) и вставим на другом месте то же в паузу передачи:


Рис 14.

На 3м.13сек был вырезан кусочек и вставлен на 4м.53сек. При этом мы на первом месте обнаруживаем разрыв по трём гармоникам. На месте вставки - двойные разрывы (см вертикальные марки). Если внимательно присмотреться и убрать первую марку, где мы вырезали, то по асимптотическому поведению это место вырезки можно всё равно приблизительно найти.

Вот теперь я предлагаю заново прочитать статью о проблемах исследования на монтаж приведённую в начале статьи.

Отзывы и предложения, кто с чем не согласен, дополнения, изменения Ваш личный опыт, интересные моменты. Буду рад Вас услышать. e-mail: illidiy@orel.ru