Данные, метод и словарь терминов
Зачем понадобились новые данные
Все прежние проверки на истории «угадывали» исход рынка по последней цене и восстанавливали цену входа из обрывков. Значит, стратегии проверялись на выдуманных результатах, и любой вывод оттуда ненадёжен. Поэтому сначала был собран фундамент настоящих данных.
Источники (только чтение, без сделок)
Polymarket даёт два бесплатных источника правды:
- Gamma (рыночные данные) — факт исхода: по закрытому рынку видно, какая сторона выиграла. Проверено вручную на известных рынках (выборы 2024 и др.).
- CLOB (биржа) — реальная дневная история цены каждого рынка.
Связав их, получаем настоящий исход + настоящую цену входа за несколько дней до расчёта — то, чего раньше не было.
Что собрано
- 10 054 рынка с реальными исходами; дневная история цены есть у 98%.
- По годам: 2024 — 791, 2025 — 4 226, 2026 — 4 880.
- По категориям: спорт — 5 633, политика — 2 134, крипта — 1 300, развлечения — 659, прочее — меньше.
- Чистая выборка по полным годам (2024–2025) для проверок: 5 007 рынков.
Как считалась прибыль
Для каждого рынка берётся реальная цена «да» за выбранное число дней до расчёта (это цена входа), затем — фактический исход. Прибыль на $1: если ставка выиграла, получаешь 1∕цена долларов (минус вложенный доллар); если проиграла — теряешь доллар. Спред (см. словарь) вычитается из цены входа, чтобы учесть реальные издержки. Никакого угадывания исхода — только факт.
Честные оговорки
- Цена из истории — это срединная цена, а не цена продажи в стакане. Мы вычли спред 2–4 п.п., но на тонких рынках аутсайдеров он бывает шире. Перед реальной торговлей нужно сверять реальный стакан на фактическую цену продажи и глубину.
- Вся выборка — 2024–2026, политически бурный период. Найденное искажение может слабеть по мере того, как рынок учится. Нужна проверка вперёд.
- Высокая дисперсия. Короткая серия сделок может дать долгую просадку.
- Бумажный режим. Это проверенная на истории гипотеза, а не доказанный доход. Реальные деньги заблокированы до отдельного одобрения.
Словарь терминов
- Преимущество — устойчивый статистический перевес, дающий положительную ожидаемую прибыль сверх честной цены.
- Аутсайдер — исход с низкой ценой (рынок считает маловероятным). Фаворит — исход с высокой ценой.
- Цена «да» — стоимость доли, которая платит $1, если событие случится; численно ≈ вероятность по мнению рынка.
- Срединная цена — середина между лучшей ценой покупки и продажи.
- Цена покупки / цена продажи — лучшие заявки в стакане: по цене продажи ты покупаешь сразу, по цене покупки — продаёшь сразу.
- Спред — разрыв между ценой покупки и ценой продажи; издержка входа.
- Вход по рынку — покупка по готовой цене продажи (мгновенно, гарантированно). Вход лимиткой — своя заявка на покупку с ожиданием исполнения (дешевле, но без гарантии).
- Неблагоприятный отбор — лимитку исполняют чаще в невыгодных для тебя ситуациях (цена идёт против тебя).
- Риск незаполнения — лимитку могут вообще не исполнить, и сделка пройдёт мимо.
- Доля выигрышей — процент сделок, закрывшихся в плюс.
- Прибыль на $1 — средняя прибыль (или убыток) на каждый вложенный доллар.
- Держать до расчёта — не продавать раньше, дождаться объявления исхода.
- Доверительный интервал 95% (метод бутстреп) — диапазон, в котором с надёжностью 95% лежит истинная средняя прибыль; считается переигрыванием выборки. Если весь интервал выше нуля — прибыль статистически значима.
- Проверка на отложенных данных — оценка на периоде, не использованном для настройки, чтобы убедиться, что преимущество не подогнано.
- Искажение «фаворит–аутсайдер» — известный эффект: цена занижает шансы аутсайдеров и завышает шансы фаворитов. В наших данных он оказался не симметричным, а направленным: в политических событийных рынках недооценена именно сторона «да» («событие случится»).
- Событийный рынок — вопрос вида «случится ли X к дате» (помилование, шатдаун, перемирие, отставка), в отличие от выборного (кто победит / маржа).
- Направленная недооценка «да» — систематическое занижение цены исхода «событие произойдёт»: ставящие переоценивают вариант «ничего не изменится».
- Связанный многоисходный рынок — событие с несколькими взаимоисключающими исходами (одна нога «да», остальные «нет»).
- Проверка на истории — прогон стратегии на прошлых данных.
- Бумажный режим — расчёты без реальных сделок и денег.
Инструменты (код в репозитории)
Сбор данных, расчёт прибыли, перебор гипотез с проверками значимости, симуляция способов входа и сборка этого сайта — отдельные модули проекта. Сырые данные (10 054 рынка) хранятся локально и не публикуются.