Показать ещё Все новости
Как оценивать матч по продвинутой статистике. Гид для «чайников»
Сергей Титов
Комментарии
Немного о том, как оцифровать конкретный матч через продвинутую статистику, которую чаще используют на дистанции.

«Если сравнивать футбольную аналитику с традиционной медициной, мы сейчас находимся на уровне пиявок и кровопусканий», – говорит Марк Брункхарт, основатель статистической компании Match Analysis. Футбольной аналитике далеко до бейсбольной, она находится только в стадии зарождения, но уже сейчас открыты мощные возможности для оцифровки игры № 1. Всё чаще игру команды оценивают не по забитым голам, а по ожидаемым забитым голам, но чаще продвинутую статистику используют на дистанции. Оценить конкретный матч сложнее из-за суженных рамок оценки, небольшой выборки.

Матчем для оценки продвинутой статистики стала игра «Севильи» и «Реала», она во многом показательна. Результаты на дистанции отражаются на итоговом счёте конкретного матча, который при этом не вытекает из логики игры. Конкретных футболистов продвинутая статистика помогает оценить и по одному матчу, но тоже не без погрешностей.

xG – Expected Goals

Что это? Вам уже точно прожужжали уши xG, так что, наверное, вы уже знаете – это система вычислений, оценивающая отдельно каждый удар по воротам в зависимости от различных факторов: позиция, с которой нанесён удар, часть тела, точка, откуда сделана передача, и т. д. Недостатки системы хорошо известны, например, не оцениваются опасные атаки, не завершённые ударом по воротам. В настоящее время это самый близкий к реальности способ оценки игры команды на дистанции – xG-вычисления по одному конкретному матчу редко дают пищу для размышлений.

Существует уже достаточно xG-моделей, я выбрал для анализа модель 11tegen11 – чтобы не было цифровых расхождений с другими показателями. Сразу важно понять, что xG лучше и качественнее трактуют ход команды по сезону, чем один отдельно взятый матч. Например, «Севилья» по подсчётам xPoints SciSports была самой перебирающей очки командой испанской Примеры – на 6 очков больше, чем должно быть в реальности. Вариантов два: либо такова модель игры (чаще такая трактовка применима к командам, обожающим счёт 1:0, вроде «Ювентуса»), либо место в таблице обусловлено во многом везением.

Глядя на xG, можно понять, что «Севилья» именно перебирает очки и в дальнейшем такое везение должно закончиться. Андалусийцы нанесли за матч всего 5 ударов из штрафной площадки, ни один из них не оказался «жирным», хотя бы как у «Реала», а голевым стал самый неопасный удар «Севильи» за весь матч от Стевана Йоветича издалека – на карте вы легко найдёте этот удар. Проблема в том, что xG не учитывает некоторых теневых показателей, не зависящих от бьющего игрока. В случае с голом Йоветича налицо ошибка Кейлора Наваса, потерявшего ворота, но ни одна xG-модель не учитывает положения вратаря. Алессандро Флоренци забивал «Барселоне» от центральной линии, но разве этот удар действительно «весил» 0,01 xG, учитывая ошибочное положение тер Штегена в воротах?

Вероятно, в будущем модель будет отрегулирована, станет учитывать человеческий фактор, но пока можно оценивать только игру бьющих. И в контексте конкретного матча утверждать, что «Реал» не заслужил того, чтобы прервать свою 40-матчевую серию.

xG-Plot

Что это? Графика, объясняющая динамику изменений xG по ходу матча – с поминутно расписанной статистикой «веса» ударов по воротам. Частично она развеивает недовольство людей, считающих, что xG-динамика команд зависит от многих факторов и один из ключевых – быстрый гол, позволяющий играть «от печки». В таких матчах общий коэффициент Expected Goals у команды, пропустившей на старте матча, часто будет больше, а итоговый счёт 0:3 не в её пользу будет соотноситься в первую очередь с везением. XG-Plot помогает понять природу таких матчей, конкретно одиночный случай он описывает лучше, чем xG.

Обычно xG-Plot оправдывает победившую команду с маленьким xG, но в данном случае графика показывает победу «Севильи» нелогичной и аномальной. Окей, матчи, когда команда с меньшим весом ударов, чем у соперника, не проигрывает, являются нормой – 11tegen11 обсчитал 43 матча на выходных, из них лишь в 22 побеждала команда, чьи удары были «увесистее» (51,2% побед, вытекающих из xG). Но, пропустив от Криштиану Роналду, «Севилья» нанесла всего 1 удар по воротам… и забила 2 мяча. Спасибо Серхио Рамосу.

Шансы «Севильи» на победу при таком xG равнялись 7%, и команда умудрилась её добиться – но в данном случае нельзя говорить, что «Севилья» прибавила или задавила «Реал». Скорее, это комплимент защите «сливочных», не позволивших сопернику ни разу за полчаса пробить из штрафной площадки, и очередное подтверждение слов Йохана Круиффа: «Случайность логична». Футбол – спорт низкой результативности, и везение здесь значит слишком много.

Packing

Что это? Packing – это сумма соперников, оказывающихся за линией мяча либо в результате передачи вперёд, либо после удачной обводки. По этому показателю можно считать как игроков, отдающих передачи (так проще понять влияние центральных полузащитников на атаку), так и тех, кто получает эти передачи, – это помогает понять игру форвардов в открываниях между линиями. Impect – это разновидность показателя Packing, учитывающая исключительно отрезанных защитников. Внимание: статистику Packing очень сложно встретить в открытом доступе – она высчитывается исключительно вручную и требует больших временных затрат.

9 главных тактических идей года

Главное, ради чего нужен Packing, – оценивать игру актёров второго плана, крайних защитников и опорных хавбеков: продвинутая статистика помогает понять их участие в атаке, хвалить Хаби Алонсо и Серхио Бускетса за вклад в игру, незаметный на первый взгляд. Packing не предсказывает будущего, это в первую очередь качественный инструмент для оценки игроков. Главный матч испанских выходных как раз идеально показывает, зачем нужна такая статистика.

Во-первых, Packing заставляет поговорить о Стивене Н’Зонзи. Роли в нынешней «Севилье» чётко разграничены, Packing тоже наглядно это показывает – если вклад Иборры, выходящего в составе от случая к случаю, в атакующую игру минимален и он отрезает своими передачами меньше соперников, чем центральный защитник Рами, то Н’Зонзи на втором месте среди игроков «Севильи» по количеству отрезанных соперников. Более того, по количеству отрезанных в момент приёма мяча (оценка уже принимающего, а не пасующего) Н’Зонзи тоже в тройке лучших среди андалусийцев, уступая только самым динамичным игрокам команды, Витоло и Насри.

Во-вторых, бросаются в глаза неприлично слабые цифры Тони Крооса. На Евро-2016 Кроос отрезал соперников своими передачами чаще, чем кто-либо другой, а против «Севильи» делал это реже, чем Модрич и Касемиро. Здесь дело не в слабости Крооса, а в осознанной тактике Хорхе Сампаоли – Тони стал главной целью «Севильи» в прессинге, к нему постоянно приклеивался кто-то из андалусийцев. Вездесущий Н’Зонзи был самым активным и здесь. Как результат — «Реалу» пришлось строить атаки по-другому, гораздо чаще обычного через Серхио Рамоса (его Packing – лучший в матче, четырежды его передачи отрезали семь или больше соперников).

В комплексе эта статистика говорит нам, почему Стивен Н’Зонзи оказался среди лучших игроков испанской Примеры. Унаи Эмери видел его опорником-лесорубом, Сампаоли дал больше свободы и ответственности за первый пас. Если суммировать цифры по отданным и принятым передачам, Н’Зонзи будет в тройке лучших, как и в цифрах по отдельности. Этим же может похвастать лишь ещё один человек, благодаря которому «Севилья» дышит и регулирует темп, – Самир Насри. Packing помогает понять, что интерес «Барселоны» к французу в качестве сменщика Бускетса логичен и оправдан.

Карта передач

Что это? Графика 2 в 1 – тепловая карта со средним положением каждого игрока на поле, снабжённая статистикой передач, в которой выделяются связи между игроками. Чем жирнее точка, тем чаще футболист получал мяч. Чем жирнее стрелка от одной точки к другой, тем чаще футболист играл конкретно на своего товарища по команде.

Карта передач здорово отражает тактический план каждого из наставников на игру. У «Севильи» наблюдался явный перекос на левый фланг, где активно нагнетал Серхио Эскудеро (лучший Packing в команде), куда регулярно смещался Самир Насри, где очень часто пространство между линиями находил Витоло. При этом правый край был выключен из игры, а Виссам Бен Йеддер, единственный форвард «Севильи», постоянно смещался на фланг – как за мячом, так и при действиях без мяча. Незадолго до первого гола Криштиану Роналду загубил выход 2 в 1, и как раз Бен Йеддер был одним из тех, кто судорожно возвращался назад – в момент перехвата передачи он забежал в свою штрафную.

«Реал» Зидана как минимум позиционно идеально соблюдал выбранную тактику на матч – 3-5-2 с латералями, играющими ближе именно к атаке, а не защите, и глубоко посаженным опорником Касемиро. Здесь нет таких мощных связей, как квадрат «Севильи», но по карте схема «Реала» и взаимодействие игроков выглядят вполне адекватно.

Корреляция Packing и карты передач очевидна – тремя самыми жирными точками обозначены игроки с лучшим общим показателем отрезанных соперников в момент передачи и в момент приёма: Насри, Н’Зонзи и Витоло.

Добавка

Футбол нужно оцифровывать, в дальнейшем он будет ещё сильнее завязан на цифрах и продвинутой статистике. Но нужно не допускать заблуждений. Первое: оценивать игру команды/футболиста исключительно по одному параметру. Если единственным мерилом силы команды будет xG, анализ сведётся к единственной шкале – «повезло/не повезло», что в принципе неправильно. Футбольная статистика уже сейчас позволяет рассматривать игру с разных ракурсов, и лучше оценивать их все, а не замыкаться на чём-то одном.

Второе: не нужно забывать про обычную статистику, лежащую на поверхности, – часто и она бывает показательной. Прямо сейчас «Севилья» – чемпион Испании по количеству голов с 90-й минуты, гол Стевана Йоветича стал уже шестым за сезон, забитым в решающее время. Если вспомнить про такую статистику, даже подобная победа «Севильи», неубедительная по цифрам, имеет свою логику.

В материале приведены подсчёты 11tegen11, SciSports и паблика «Пыльный чердак».

Комментарии