Правила

  1. Надо ли решать все задачи или можно выбрать одну?
    Финальный рейтинг онлайн соревнования будет определяться по результатам решения двух основных задач из каждой группы и количеству баллов на вашем счету. Если вы участвуете в соревновании в одиночку, то вам придется решать обе основные задачи, а дополнительные задачи помогут набрать побольше баллов.
    Если вы не хотите решать обе основные задачи, то выход один - объединиться с кем-то в команду. Тогда вы можете решать одну задачу, а другие члены команды - вторую.

  2. Какие метрики используются в задачах?
    Во всех задачах используется MAPE (Mean Absolute Percentage Error). В задаче о прогнозе наработки атактики - средний MAPE по колонкам. 

  3. Какое соотношение private и public?
    Public в задачах о каучуке и ПЭТФ - ~50%, в промышленных задачах - ~55%. Напоминаем, что private во всех задачах - 100%. Снова расскажем, почему так:) Целевые переменные во всех задачах - временные ряды. Если использовать обычное разбиение без пересечений, то ошибки на private и public будут мало связаны друг с другом. А мы не хотим вас шейкапить слишком сильно:)

  4. Есть ли ограничения на использование внешних данных?
    Ограничений нет, но если вы используете какие-то дополнительные данные для тренировки моделей, нужно в чате сообщить об этом. Привычное по Kaggle правило.
    Обратим внимание, что речь идет о данных, не об информации вообще. Можете не сообщать, что вы прочли учебник по химической технологии. Хотя всем нам будет радостно узнать, что вы настолько серьезно подошли к соревнованию:)

  5. Можно ли смотреть в будущее?:)
    С чего бы вдруг?:) Если серьезно, то во всех задачах исходными данными являются временные ряды. Поэтому, например, фраза “нужно предсказать на час вперед” имеет конкретный смысл: для предсказания таргета для времени 14:05 можно использовать только данные для времени 13:05 и раньше. Конкретные горизонты будут указаны в подробных условиях к задачам.

  6. Будет ли валидация кода?
    Конечно. Все участники или команды, которые претендуют на участие в оффлайн этапе должны будут предоставить свой код. Мы будем проверять п. 3, использование незадекларированных внешних данных и воспроизводимость. Пожалуйста, убедитесь, что ваш код воспроизводит ваше лучшее решение.

  7. Зачем нужны дополнительные задачи, если они не участвуют в финальном рейтинге онлайн этапа?
    Во-первых, это задачи, которые компании СИБУР нужно решать, в них есть реальная ценность. Во-вторых, за работу над дополнительными задачами вы тоже сможете заработать баллы, а баллы в рейтинге учитываются.

  8. Что-то еще?
    Конечно. Мы подготовили вам много сюрпризов. Например, часть информации о задачах будет доступна только за баллы. Более того, вы даже не будете знать, какую именно часть покупаете, придется просто поверить, что она вам поможет. А может и не помочь, все зависит от вас.