Исследовал теорию случайного блуждания. Вот, написал статью на эту тему:

Согласно гипотезе эффективного рынка (ГЭР), вся существующая информация немедленно и в полной мере отражается на курсовой стоимости ценных бумаг. Что в свою очередь, делает бесполезным анализ имеющейся информации, с целью поиска недооцененных или переоцененных активов.

Таким образом, подтверждение или опровержение ГЭР, является крайне важным в вопросе выбора инвестиционной стратегии. Известные эксперименты, когда цирковые обезьянки формируют портфель превышающий доходность портфелей профессиональных управляющих, являются подтверждением малой эффективности попыток переиграть рынок. Все «каналы», «линии поддержки и сопротивления», «головы и плечи» - любимые инструменты рыночной публики, являются лишь игрой случая. Или все-таки рынки не так уж эффективны и рациональны, как это утверждает теория и состояние «оракула из Омахи» не является лишь результатом случайного везения?

Допустим, что ГЭР соответствует действительности. В этом случае, движение котировки за день Х, не зависит от движения в день Х-1. Вся информация (новости, отчеты и т.д.) была учтена в котировках в день Х-1 и таким образом, не может влиять на последующие движения. Другими словами, рынок не будет падать сегодня, по той причине, что он падал вчера. Вчерашняя информация уже учтена, и текущее движение цен определяется свежим потоком новостей.

Следовательно, мы можем выяснить, насколько часто имело место падение после падения и сравнить со случайным распределением этих же данных. Например, пусть у нас есть десять торговых дней, в четыре из которых цена росла (относительно предыдущего дня) и пять дней снижалась:


Рис. 1.


Если мы возьмем доходности ряда (отношение соседних цен закрытия) и перемешаем их случайным образом, мы получим новый график:


Рис. 2.


Как бы мы не перемешивали данные, количество дней роста и падения всегда будет одинаковым (4 и 5). А вот количество дней, когда было падение после падения, будет разным. В первом случае, было 3 случая падения после падения. А после перемешивания, только 2. Таким образом, если мы повторим эксперимент перемешивания большое количество раз, мы получим среднее для данной выборки количество падений после падений и отсюда можем вычислить стандартное отклонение. К примеру, пусть в среднем количество падений после падения будет равно 2,5. А стандартное отклонение равно 0,5. Так как выборка подчиняется нормальному распределению, в 68,2% случаев, количество падений после падения будет попадать в диапазон одного стандартного отклонения, т.е. от 2 до 3 (2,5 ±0,5):



Рис. 3.


В 95,4% случаев мы уложимся в рамки 2-х стандартных отклонений (т.е. в диапазон от 1,5 до 3,5). И наконец, в 99,7% случаях мы окажемся в переделах 3-х стандартных отклонений (от 1 до 4). Таким образом, если ГЭР верна, то вероятность того, что в исходной выборке количество падений после падений меньше 1 или больше 4, менее 0,3%.

Другими словами, если мы проанализируем 1000 выборок, то количество выборок с аномально частым падением после падения должно наблюдаться не более чем в 3 случаях.

Проведем эксперимент на искусственной выборке. Сгенерируем ряд, имитирующий движение цены на интервале 600 000 значений. Разобьем временной ряд на 6 000 отрезков по 100 значений в каждом и проверим, насколько часто встречаются аномальные всплески количества падений после падений. В результате опыта, было зафиксировано 18 аномальных выбросов (более 3-х стандартных отклонений), что составляет 0,3 процента от 6 000 и в точности соответствует теоретическому расчету.

Чтобы окончательно убедиться в верности логики, внесем искусственное изменение в случайно сгенерированный ряд состоящий из 25 000 чисел. В середине выборке переставим несколько значений таким образом, чтобы число падений после падения аномально выросло. Т.е. на небольшом участке, вместо истинно случайного блуждания, будет искусственный всплеск количества падений после падения (изменение отмечено голубой линией):



Рис. 4.

Далее, перемешаем эти данные тысячи раз и вычислим арифметическое среднее количества случаев падений после падения и стандартное отклонение. Сравним с исходной выборкой (которая была до перемешивания) и отобразим полученные данные в графическом виде:


Рис. 5


Рисунок требует комментария. Точка в левом верхнем углу треугольника отображает результат тестирования первой сотни данных из ряда. Если результат укладывается в 3 стандартных отклонений, то точка окрашивается серым цветом. Если количество падений после падений аномально высоко (более 3-х отклонений), то выборка кодируется красным цветом. Синим цветом кодируется аномально редкое количество падений после падений.

Точка правее кодирует результат тестирование следующих 100 значений (от 50 до 150) и т.д. до конца выборки, с шагом 50.

Точка чуть ниже левой верхней кодирует состояние более широкой выборки, в 150 значений. Самая нижняя точка кодирует результат тестирования всей выборки целиком (25 000 значений).

Как мы видим, в целом количество аномалий довольно редко. Искусственная перестановка в центре ряда, дала аномальный выброс, окрашенный красным цветом. По мере того, как расширяется выборка (100, 150, 200 и т.д.) значимость перестановки начинает убывать и красный цвет уступает место серому. Так как дополнительные 30 падений после падений это аномально много для 100 значений, а для 1 000 уже нет.

Теперь мы можем приступить к исследованию реальных рынков. Возьмем временной ряд дневных цен закрытия индекса Dow Jones (26.05.1896 – 19.05.2010):


Рис. 6


Картина в корне отличается. Количество аномалий огромно. Аномалии редкого падения после падения имели место в начале 30-х, 2002 и 2009 годах. Это может показаться странным, ведь рынок падал в эти годы. Однако следует отметить, что редкое падение после падений означает и редкий рост после роста.

В середине века наблюдается аномалия иного рода, рынок часто падал после падения (часто рос после роста).

В полной выборке (28 550 значений) падение цены имеет место в 13 478 случаях. А падений после падений в 6 629 случаях, т.е. 49,18%. Тогда как среднее (полученное путем перемешивании 10 000 раз) для этой выборки составляет 47,21%. Стандартное отклонение равно 0,311. Таким образом, разница составила более 6 стандартных отклонений! Вероятность случайного совпадения тут ничтожно мала. Таким образом, мы видим, что движение цены явным образом отличается от случайного блуждания. Проверить расчеты можно скачав xls-файл с данными.

Рассмотрим другой ряд данных, часовые закрытия индекса S&P500 за период 2002 – 2010:


Рис. 7

Следует отметить, что до 2003 года торговых часов было меньше (с 10:30 до 16:30), чем сейчас (с 00:30 до 23:30) и поэтому даты не симметричны.

Итак, на рисунке 7 мы видим, что аномалии характерны для рынка и на более мелком масштабе. Таким образом, рынок не так эффективен и рационален, как предполагает ГЭР. Движение цен не соответствует случайному блужданию, что в свою очередь означает, что рынок можно обыграть и технический/фундаментальный анализ имеет смысл.

Оригинал статьи тут.