Не так давно в «Яндексе» прошла конференция
Data&Science, посвященная новым технологиям прогнозирования погоды и
климатических изменений на основе анализа Больших данных и машинного
обучения. Математики и метеорологи, выступавшие на конференции,
рассказали корреспонденту «РР» о том, чего ждать от погоды и от ее
предсказателей
Приметы врут
— Погоду ведь предсказывали и до появления компьютеров и Больших
данных, — напоминаю я Александру Ганьшину, только что закончившему
рассказ о разработанной им технологии Meteum, с помощью которой «Яндекс»
предсказывает погоду.
— В изучении погоды было три эпохи. Первую я бы назвал «эпоха
поверий» — когда у людей не было приборов, и их прогнозы основывались на
приметах. В каждом племени был штатный шаман, который трактовал или
предсказывал погоду по костям, жертвоприношениям и так далее, а
единственным метеорологическим прибором человека были его глаза. Потом
наступила «эра барометра», когда появились первые метеорологические
приборы, в частности барометр, и все прогнозы стали основываться на его
показаниях. И третья эпоха — «космический рывок», ее можно переименовать
и в «компьютерный рывок», потому что прорывы в освоении космоса
и создании компьютеров происходили практически одновременно.
— Получается, «эпоху поверий» можно еще назвать «эпохой неверных
предсказаний»? Или все-таки на основе примет можно делать хорошие
предсказания?
— Конечно, нельзя сказать, что приметы ни на чем не были основаны.
Все-таки опыт наблюдений накапливался и передавался из поколения в
поколение. И тем не менее, как недавно выяснилось, в целом приметы не
работают. В «Яндексе» было замечательное исследование, посвященное тому,
насколько приметам можно верить. В каждом месяце выбрали по одной
примете и на архиве метеорологических наблюдений за 36 лет проверили,
работают они или нет. Половина примет позволяли делать верные
предсказания чаще неверных, а вторую половину скорее следовало бы
трактовать наоборот, но в любом случае это предсказания с низкой
достоверностью. Из всех примет «Яндекс» выделил только три с достаточно
высокими показателями достоверности сразу во многих российских городах,
от Москвы до Владивостока. Первая — «На Самсона (27 июня) дождь — семь
недель то ж», вторая «На Мокия (24 мая) мокро — все лето мокро. На Мокия
сухо — все лето сухо». И третья — «На Благовещение (7 апреля) день
тихий, теплый — лето буде такое же. На Благовещенье дождь или пасмурная
погода — лето будет дождливое».
— Скоро сможем проверить!
— Для Москвы есть еще две приметы, которые позволяют предсказать
погоду с вероятностью больше 50%: «На Сретенье (2 февраля) снежок —
весной дожжок» и «Анна-Зимоуказательница (25 июля) — светлая и теплая
погода предвещает холодную зиму, а если идет дождь, зима будет снежной и
теплой». Сделать верное предсказание с вероятностью свыше 80% позволяет
лишь одна примета: «На Самсона дождь — семь недель то ж», и только
в двух городах, Санкт-Петербурге и Нижнем Новгороде. Но общий вывод
вполне однозначен — приметы не работают.
Эра барометра
— На самом деле первым метеорологическим прибором был флюгер, —
рассказывает Александр Чернокульский, старший научный сотрудник
Института физики атмосферы им. А. М. Обухова РАН. — Люди прежде всего
научились определять направление ветра. Потом появились барометры,
термометры и другие приборы. Но все они предполагали наличие какого-то
наблюдателя, который будет каждый раз подходить и записывать показания. А
нам нужно, чтобы наблюдения были непрерывными. Так появились
приборы-самописцы: термограф, барограф. К концу XX века мы перешли в
цифровую сферу, появились автоматические метеостанции. Они сами проводят
измерения и отправляют данные в интернет.
— Можете немного прояснить, что происходит с этими данными? Компьютер решает какие-то уравнения?
— В том числе и уравнения. Важной вехой в истории прогнозирования
стали численные прогнозы погоды, которые строятся не по картам, а с
помощью численных решений уравнения гидродинамики. Впервые ее в начале
прошлого века применил британский математик Фрай Льюис Ричардсон. Он и
его команда делали прогноз на шесть часов, который пытались рассчитать с
помощью логарифмических линеек. Они считали в течение нескольких
недель, прогноз к этому времени уже устарел и к тому же оказался
неправильным. Но с развитием компьютерной техники этот метод становился
все более успешным. Одно из первых применений компьютера было как раз
для прогнозирования погоды, наравне с расчетами по ядерной физике. В
основе математической модели погоды лежит уравнение Навье-Стокса, одно
из нерешенных в аналитическом виде великих математических уравнений.
Решите его и получите миллион долларов! Сейчас уравнение решается
подстановкой чисел, то есть у нас есть только приближенные решения.
Другой важный момент в прогнозировании с помощью компьютеров — это
система усвоения данных. Нам ведь мало разработать математическую модель
погоды, надо в нее подставить свежие данные, которые мы получаем с
помощью радиозондирования, самолетов, метеостанций и так далее.
— А какие данные собираются метеорологами для составления
современного прогноза погоды? Наверное, главное для предсказания погоды
на завтра — это сегодняшняя температура?
— В Гидрометцентр России в сыром виде приходит около 20 млн чисел в
день. Но не все данные одинаково полезны. Температура на поверхности
Земли дает лишь около 7% уменьшения ошибки предсказания. А самые важные
для составления прогноза данные дает измерение профиля влажности — того,
как меняется содержание водного пара в атмосфере с высотой. Эти данные
уменьшают ошибки прогноза на 26,8%.
Прогноз с точностью до дома
— Интересно, нас ждут новые прорывы в прогнозировании или
предсказание погоды с помощью компьютеров и наблюдений из космоса
постепенно достигнет совершенства? — возвращаюсь к Александру Ганьшину
с новой порцией вопросов.
— Ждут! Думаю, следующий этап можно будет назвать «эра искусственного
интеллекта», потому что будущее прогнозов — за машинным обучением.
— У «Яндекса» на этот счет есть свои планы?
— Обычно модели считаются на суперкомпьютерах, где несколько блоков
объединены скоростными шинами. Получается расчетный блок с тысячами
ядер, это позволяет справиться с таким объемом данных. Но в «Яндексе»
это невозможно. У нас есть дата-центры, но они соединены сетью, скорости
которой не хватает, чтобы расчеты проходили без задержек. Так что мы
делим нашу зону покрытия (Россию, Казахстан, Украину и Беларусь) на
счетные области и проводим расчеты для каждой области на разных
компьютерах. Чтобы при таком разделении по серверам получить
согласованные данные, мы используем специальную систему шедулинга —
программу, которая говорит нам, в каком порядке нужно запускать расчеты.
Так мы получаем возможность считать прогноз погоды на разных серверах
в сети, а не суперкомпьютерах. И поскольку «Яндекс» традиционно силен
машинным обучением, полтора года назад мы запустили Meteum — технологию
гиперлокального прогноза для конкретной координаты с учетом особенностей
данной местности. Этот метод комбинирует преимущества традиционных
математических моделей и машинного обучения.
— Заявляется, что Meteum — технология предсказания погоды с точностью
до дома. Что это значит, ведь погода не меняется от дома к дому?
— Для составления такого гиперлокального прогноза нужны не только
данные с приборов — а это около 80 метеорологических спутников,
1500 станций радиозондирования, 10 тыс. профессиональных станций,
22 радиолокатора — но и информация о подстилающей поверхности
(компоненты земной поверхности, осуществляющие тепло- и влагообмен с
атмосферой и оказывающие влияние на ее состояние. — РР). Ведь, например,
погода в городе и у озера может отличаться. Так что мы используем
«Яндекс.Карты» для уточнения информации о подстилающей поверхности и
считаем прогноз для конкретного места, в котором находится пользователь.
Затем, поскольку разные модели прогноза погоды могут ошибаться
по-разному, мы берем информацию нескольких поставщиков прогноза погоды и
пытаемся выявить закономерности в том, как ошибается каждая модель. Для
этого используется технология машинного обучения Матрикснет. С ее
помощью составляется комбинация из прогнозов, которая наиболее точно
соответствует данным метеонаблюдений. Этим же объясняется точность
технологии до дома — машинное обучение использует координаты
и метеостанций, и самих пользователей. С изменением координаты меняется
даже набор параметров для составления прогноза. После того как мы
обучили эту модель на большом объеме данных, в нее подается информация о
текущем состоянии атмосферы, и Матрикснет составляет точный прогноз для
вашего дома.
— Почему «Яндекс» не делает долгосрочные прогнозы?
— Долгосрочный прогноз погоды тяжело сделать из-за накапливающихся
ошибок в расчетах и неопределенности в начальных условиях. Для каждого
вида прогноза применяются свои вычислительные модели. При прогнозе на
два часа используются технологии, которые мы реализуем с помощью
нейронной сети. При прогнозе на десять суток мы запускаем Матрикснет,
а на месяц — это уже статистический анализ с учетом климата. Уже через
десять дней текущие коммерческие прогнозы начинают проигрывать
климатической информации по уровню достоверности. Именно поэтому при
прогнозе на больше чем десять дней мы опираемся на климатологию.
Завтра ветер переменится
Чтобы разобраться, чем анализ погоды отличается от исследований
климата, мне приходится снова обратиться к климатологу Александру
Чернокульскому.
— При прогнозе погоды используется численная модель атмосферных
процессов, в которой задаются начальные условия на основе поступающих от
приборов данных, а при моделировании климата начальные условия как бы
забываются, — объясняет он. — Важны только граничные условия: количество
парникового газа в атмосфере, приходящая солнечная энергия, извержения
вулканов и так далее. Кроме того, модель климата включает в себя не
только атмосферу, но и сушу, океаны, аэрозоли, углеродный цикл, динамику
растительности и многое другое. Для анализа климата очень важно, чтобы
сохранялись длительные однородные ряды измерений, чтобы все делалось так
же, как сто лет назад. Метеостанции выглядят архаично, потому что
меняются только некоторые приборы, например, осадкомер, а в целом —
ничего, вплоть до расположения будок и того, как открываются двери. Мы
можем говорить об изменениях климата, только если все меряем одинаково
в течение многих лет.
— И что показывают измерения — противники теории глобального потепления посрамлены?
— Как известно, два последних года стали самыми теплыми за всю
историю наблюдений. Растет температура, меняются многие компоненты
земной системы: температура воздуха над сушей, температура поверхности
океана и воздуха над ним. Основное беспокойство вызывает рост уровня
океана. Сокращается площадь морского льда в Арктике, растут температура
тропосферы и влажность воздуха, сокращается площадь снегов в северном
полушарии. Еще растет количество осадков и меняется функция
распределения осадков. Это значит, что сейчас, например, в каком-то
месте выпадает 100 мм осадков за 20 дней, а в будущем эти же 100 мм
могут выпадать за два. Это примерно то, что нас ждет. Вообще есть два
крыла у климатологов: одни, скептики, говорят, что не происходит ничего
страшного, а другие, «алармисты», говорят, что мы умрем уже завтра.
Истина, конечно, где-то посередине. И есть несколько сценариев, как
могут развиваться события. Находятся они между двумя крайностями.
Первая — мы прямо сейчас одумаемся и перестанем сжигать углерод,
вторая — мы вообще ничего не будем менять. В последнем случае
температура в России может вырасти на 8–10 градусов к концу этого века.
— И человек однозначно виноват в этих изменениях?
— Да, человек виноват. Уточняется лишь вопрос, насколько велик его
вклад. Миллионы лет назад углерод копился в недрах нашей планеты
и потому был изъят из атмосферы. Сейчас мы активно возвращаем его в
атмосферу в виде метана и, главное, СО2, активного парникового газа.
С учетом общего круговорота углерода мы добавляем немного, но этого
вполне достаточно, чтобы внести дисбаланс в климатическую систему и
усилить парниковый эффект. Тому, что человек влияет на климатическую
систему, есть несколько доказательств. Например, беспрецедентный рост
содержания парниковых газов в атмосфере. Такой скорости роста не было за
последний миллион лет. Есть и другие важные доказательства. Например,
проводился такой эксперимент: в климатическую модель, которая в целом
хорошо воспроизводит климат нашей планеты, подавались граничные условия
без антропогенного влияния. И оказалось, что неучет влияния человека не
позволяет воспроизвести современное потепление, а учет — позволяет.
— Как эти изменения климата скажутся на нашей жизни?
— Если говорить конкретно о нас, то плюсы, конечно, очевидны.
Россия — северная страна, нам повышение температуры, скорее, на руку. Мы
будем тратить меньше энергии, будем меньше есть, носить более легкую
одежду, меньше обогревать дома. Однако придется увеличить расходы на
кондиционирование. При правильном планировании могут увеличиться объемы
сельскохозяйственной продукции. Но есть и минусы: растет интенсивность
конвективных процессов, вместе с температурой увеличивается и влажность
воздуха. Эти два фактора вместе могут привести к тому, что станет больше
сильных ливней и гроз. А много гроз — это рост риска возникновения
лесных пожаров из-за молний. Может увеличиться количество воздушных
смерчей. Поскольку сократится снегонакопление зимой, вырастет
температура летом и произойдет перераспределение осадков, за сильными
дождями будут следовать периоды засухи. Другой важный момент:
температура растет быстрее всего в Арктике, она теплеет в два раза
быстрее, чем в целом на планете. С одной стороны, летом растает лед
и откроется морской путь, с другой — из-за уменьшения температурного
перепада «экватор–полюс» ослабляется западный перенос, который приносит к
нам циклоны из Атлантики, а с ними и комфортную температуру. Сейчас
циклоны ослабляются, уходят к северу. Грубо говоря, их заменяют
антициклоны, причем блокирующие, такие как летом 2010 года, когда было
рекордно жарко, или такие морозные, как в этот Новый год. В ближайшем
будущем при общем росте температуры подобные очень холодные периоды
по 10–15 дней не исключены и очень вероятны. Погода становится «более
нервной», как говорил академик Обухов еще в конце прошлого века.
Еще модели показывают, что муссонная активность на Дальнем Востоке
становится более интенсивной. Из-за этого может повториться наводнение
на Амуре, схожее с тем, что произошло в 2013 году. Растет температура
поверхности Черного моря. С одной стороны, комфортнее купаться,
с другой — это ведет к росту риска сильных ливней, как, например, было в
Крымске.
— Смогут ли люди в будущем сами создавать погоду?
— На самом деле люди уже сейчас воздействуют на погоду. Скажем,
в Армении и на юге России активно используют противоградовые установки,
а в Саудовской Аравии специально усиливают осадки. Хотя надо понимать,
что атмосфера находится в балансе: если дожди пройдут в одном месте, то
уже не пройдут в другом где-то поблизости. На самом деле воздействовать
на погоду целенаправленно — это очень энергоемкое и ресурсоемкое дело,
так что это вопрос денег и энергозатрат. Вот от града огромные убытки,
поэтому от борьбы с ним есть польза… А чаще всего менять погоду просто
незачем, хотя можно, конечно, на 9 мая разогнать облака.