Интервью · Общество

«Понятно, что пока это — "ручная" история»

Еврочиновники потребовали от Google борьбы с пропагандой Кремля. Как бигтех может держать объективную сторону — объясняет создатель «Яндекс.Новостей» Лев Гершензон*

Ирина Тумакова*, спецкор «Новой газеты»

Фото: Дмитрий Азаров / Коммерсантъ

18+. НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И (ИЛИ) НАПРАВЛЕН ИНОСТРАННЫМИ АГЕНТАМИ БОРУХОВИЧ (ТУМАКОВОЙ) ИРИНОЙ ГРИГОРЬЕВНОЙ И ЛЬВОМ МИХАЙЛОВИЧЕМ ГЕРШЕНЗОНОМ ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННЫХ АГЕНТОВ БОРУХОВИЧ (ТУМАКОВОЙ) ИРИНЫ ГРИГОРЬЕВНЫ И ГЕРШЕНЗОНА ЛЬВА МИХАЙЛОВИЧА.

Заместитель председателя Еврокомиссии Вера Юрова обратилась к компании Google и другим технологическим гигантам с просьбой помочь независимой белорусской и российской прессе и, наоборот, сдерживать «пропаганду Минска и Кремля». В первую очередь речь шла о белорусских СМИ в изгнании, потому что именно их журналисты обратились в Еврокомиссию с жалобой: публикации с критикой президента Лукашенко не достигают аудитории «из-за поисковых алгоритмов, используемых Google, Meta** и другими». Что касается российских журналистов, то и раньше многие, в том числе и «Новая», писали о загадочной работе алгоритмов «Гугла». Первым об этом заговорил создатель и бывший глава «Яндекс.Новостей», основатель новостного сервиса The True Story Лев Гершензон. Пока, как пишет Financial Times, Google ответил в том духе, что создает свои продукты, вообще «не принимая во внимание политические взгляды», а Meta не ответила вовсе. Как могли бы действовать IT-гиганты и насколько это для них затруднительно — объясняет Лев Гершензон.

Лев Гершензон. Фото: соцсети

— О чем именно Еврокомиссия просит IT-компании? Что должны сделать Google и Meta, если согласятся пойти навстречу, в каких действиях это должно выражаться?

— Пока у нас есть только Financial Times со словами об этом. Юрова говорит: «Борьба с дезинформацией и содействие свободе СМИ — это две стороны одной медали. Мы хотим, чтобы крупные технологические компании занимались и первым, и вторым».

Если говорить о Google, то это и поиск, и Google Discover, то есть рекомендации. Мы с вами говорили об этом полгода назад, что-то с тех пор поменялось, но несильно. Рекомендации перестали предлагать какие-то пропагандистские, подцензурные издания, но на их местах не показывается более адекватный, с нашей точки зрения, правдивый, релевантный контент независимых изданий. И Юрова говорит: надо не только бороться с распространением фейков и пропаганды на ваших платформах, но нужна и позитивная повестка, надо показывать больше достоверного контента от независимых источников, которые государством нечестно, несправедливо притесняются, в том числе и технически, с помощью блокировок, административными мерами, лейблами «иноагентов» и нежелательных организаций, уголовным преследованием. В принципе, простая очевидная мысль.

— Сама мысль как раз понятна. Но о чем Юрова просит «Гугл» с чисто технической точки зрения? Он должен поменять свои алгоритмы? Или должен нанять больше сотрудников, которые «руками» все это будут делать?

— Я с Верой Юровой это не обсуждал…

— Представьте, что вы — «Гугл». Вы понимаете, что должны сделать?

— Конечно, 

ни «Гугл», ни другие технологические компании ни в коем случае не должны становиться политическими активистами.

Они не должны из каких-то моральных, этических соображений поддерживать российскую оппозицию или какую-нибудь другую. Но они должны учесть, что, например, в авторитарных режимах есть такая особенность: государства вливают в поддержку своих пропагандистских каналов огромные финансовые ресурсы, превышающие на порядки те ресурсы, которые тратят на поддержку независимой прессы всякие европейские и американские фонды. И у таких государств есть не только финансы, у них есть рычаги, силовые методы, вроде тех же самых блокировок или фактических запретов на ведение бизнеса.

В такой ситуации имеет смысл модифицировать, дорабатывать алгоритмы и ранжирование новостных и прочих запросов, особенно алгоритмы рекомендательных систем, чтобы эти реалии они тоже учитывали. Об этом, мне кажется, Юрова тоже говорила: заблокированный ресурс — это технически не равно ресурсу недоступному или некачественному.

Фото: Валерий Шарифулин / ТАСС

Есть другая, может быть, более хитрая история, о которой я тоже многократно говорил. Государство, в данном случае — 

Кремль, администрация президента, через свои карманные платформы — «Яндекс», «ВКонтакте» может на нужные им ресурсы направлять огромный трафик, показывать их десяткам миллионов пользователей, обеспечивать миллионы переходов в день, с тем чтобы контент этих ресурсов выглядел популярным в глазах, например, роботов «Гугла», их алгоритмов,

потому что у них есть браузер Chrome, и они достаточно хорошо могут видеть популярность, посещаемость каждого ресурса. Это можно учесть, если более внимательно смотреть, например, на источники трафика.

Наконец, вещь, про которую опять-таки я говорю с самого начала, то есть уже ровно год: в случае с новостным контентом очень важно начать как-то оценивать, пусть вероятностно, качество и достоверность материалов. Когда платформы говорят, что они борются с распространением фейков, это, мягко говоря, звучит странно или даже лицемерно. Потому что эти фейки становятся такими опасными только благодаря тому, что массово распространяются как раз этими самыми платформами.

— То есть замкнутый круг?

— Просто нужно не бороться с фейками, а ввести и тут какие-то критерии, которые будут применяться автоматически. Современные технологии, искусственный интеллект и прочие средства для этого точно есть в таких мощных компаниях, как Google или Meta.

— Я ведь о критериях главным образом и спрашиваю. Мы понимаем, чем руководствуется Кремль, когда кого-то блокирует. Но условный «Гугл» — технологическая компания, то есть, по сути, машина, железяка. Как она должна делить СМИ на «хороших русских» и «плохих русских»?

— Ну, на эту провокацию я не поддаюсь, последней вашей фразы я не слышал…

— Нет, подождите, я серьезно. Как «Гугл» должен определять, что, например, условные «Новую газету» или «Живой гвоздь» он должен оптимизировать, потому что они «хорошие», а условную «Комсомолку» пессимизировать? По каким критериям машина должна это распознавать?

— Это некорректный вопрос. Здесь две стороны: нужно оценивать качество источника и какие-то качественные характеристики материала. Второе гораздо сложнее.

Представим себе, что некая конкурсная комиссия выдает премии. Чтобы оценки не были совсем субъективными, есть группа экспертов, каждый из которых оценивает предмет по определенным критериям, а потом все приходят к общему мнению. Как устроена работа технологических компаний по настройке алгоритмов ранжирования? Какие там критерии? С этими вопросами «Гугл» сталкивается и работает над ними с самого своего основания. «Гугл» — это в первую очередь поиск, и перед ним стоит задача ранжировать, то есть упорядочить по запросу сотни тысяч или миллионы потенциально релевантных страниц.

Фото: Дмитрий Духанин / Коммерсантъ

Скажем, по запросу «спецоперация в Украине»: что мы ставим на первое место — РИА «Новости», телеканал «Звезда» или «Би-би-си»? И по любым запросам это — основное, что делает поисковая система. Есть масса разных подходов, но от основного пока никто не отказался: человеческие инструкции. Есть люди, которые вручную оценивают разные материалы, их релевантность и какие-то другие характеристики в контексте конкретного запроса. А программисты и инженеры, используя эти ручные оценки, настраивают свои алгоритмы.

— Сначала оценки все равно дают люди?

— Да. Когда говорится, что это технологическая компания, что действуют алгоритмы, в этом есть опасность такого лицемерного подхода. Да — алгоритмы. Но критерии качества определяют люди. Что касается алгоритмического подхода, технологические компании могут себе позволить какие-то оценки обобщить и автоматизировать, чтобы алгоритмы уже эмулировали поведение людей, оценивая запросы в других ситуациях, и строили ранжирование и рекомендации.

— Правильно ли я поняла: чтобы выполнить просьбу Еврокомиссии, в «Гугле» должны собраться менеджеры, сформулировать задание, а потом вгрохать кучу денег в разработку новых алгоритмов или в изменения старых?

— Да, это важный момент. Он кажется очевидным, но чтобы решить проблему, ее надо сначала признать.

— Ключевые слова здесь «вгрохать кучу денег».

— Все относительно. Баснословные деньги для какой-нибудь компании — это ничто для «Гугла». Сейчас «Гугл» проиграл, например, процесс по поводу монопольного положения его Андроид-маркета и должен заплатить там 700 миллионов долларов штрафа. С одной стороны, сумма кажется астрономической. С другой — компания «Гугл», точнее, ее Андроид-маркет, эту сумму зарабатывает за 20 дней.

— И есть еще момент: в России «Гугл» соглашается платить гигантские штрафы, этих денег ему наверняка тоже жалко, лучше бы потратил на алгоритмы.

— Ну, что значит — соглашается? Его никто не спрашивает. У него действительно через суды изъяли со счетов огромные суммы штрафов, в частности — за то, что YouTube заблокировал определенные каналы. За блокировку канала «Царьград» он заплатил миллиардные штрафы в рублях. Но в это же время тот же «Гугл» на протяжении девяти месяцев ежедневно обеспечивал тому же «Царьграду» по 500–800 тысяч переходов, и «Царьград» отлично монетизировал это с помощью рекламы. Если не ошибаюсь, 

служба судебных приставов получила с «Гугла» около 30 миллиардов рублей, это от 300 до 500 миллионов долларов в зависимости от времени и курса. А на все вместе независимые русские медиа западные фонды потратили за весь 2023 год 30–35 миллионов долларов. Просто сравните.

А можно еще посмотреть, сколько тратит Кремль на поддержку своих медиа.

— Много тратит.

— Миллиарда полтора долларов. То есть для того чтобы решить эту проблему или хотя бы улучшить ситуацию с этими рекомендациями, «Гуглу» нужны не какие-то космические средства — сильно меньше, чем заплаченные им штрафы. Я не хочу давать рекомендации «Гуглу», он с этим справится лучше, чем я, но алгоритм должен хотя бы учитывать не популярность ресурса среди пользователей, а его авторитет среди коллег — то, насколько часто и охотно другие издания на него ссылаются. Не все со мной согласны, но я все равно верю, что это вещь базовая.

Еще один момент. Кажется, сейчас нет классификатора, который бы автоматически позволял определять какие-то качественные показатели текста: например, наличие в нем ссылок на какие-то первоисточники, появление эмоциональной речи, которая понижает качество информационных текстов, призывов к чему бы то ни было. Понятно, что такие классификаторы не будут работать со стопроцентной точностью, но чем их больше и чем они лучше, тем точнее может быть картина.

И главное, речь не должна идти о бане, о полной блокировке ресурсов.

— А только о понижении или повышении в выдаче?

— У нас есть такое смешение понятий, которое уводит разговор в сторону от содержательной части. Ранжирование и рекомендательные системы — это не бинарная история, это не означает, что ресурс либо есть в выдаче — либо его нет. Просто какие-то серьезные и важные статьи сейчас малозаметны, а вышла какая-нибудь агитка на «Царьград ТВ» — и ее платформы показали пятистам тысячам человек.

— То есть в случае, скажем, с поиском мы говорим о том, что пользователь увидит на первых страницах, а до чего может и не долистать?

— Если речь идет о ранжировании в выдаче, то именно так. Если мы говорим о рекомендациях, о Google Discover, то от этого зависит, сколько человек увидит какой-то материал, сколько кликнут и перейдут на него по ссылке. То есть клики уже от пользователя зависят, но количество кликов напрямую зависит от количества показов, от того, сколько человек увидели ссылку.

Грубо говоря, требуется построить некоторый комплекс классификаторов, которые способны определять: вот здесь есть некачественный материал, здесь — хейт-спич, здесь много эмоциональной оценочной лексики, а ссылок на источники мало. Такие материалы не нужно, опасно распространять. Это мое личное мнение.

Представьте себе, что вы создали некий детектор фейков. И говорите: в таком-то материале с вероятностью 60% фейки содержатся. Речь не идет о том, что такой материал должен быть просто уничтожен. Но уж точно он не должен быть показан большому количеству неподготовленных пользователей.

— Вы боролись за это больше года, и теперь мы видим, что «Гугл» начал уже что-то делать в этом направлении. Например, перестал показывать на первых местах ссылки на «Комсомольскую правду», перестал оптимизировать ее в рекомендациях. Как это повлияло на посещаемость таких ресурсов?

— В октябре 2023 года статья на эту же тему вышла в Bloomberg. Об этом многие писали, включая и «Новую газету», но Bloomberg — самое авторитетное западное издание из писавших о проблеме. И после этого в «Гугле» произошли определенные изменения.

Действительно, из рекомендаций пропали «Комсомольская правда» и «Царьград ТВ». Их не пессимизировали, а они полностью исчезли. Это как раз история про бан. До этого, в мае, практически в один день из рекомендаций пропали и материалы «Коммерсанта». Для любого человека, который имел дело с IT, понятно, что это «ручная» история.

В ноябре вместе с «Комсомольской правдой» и «Царьград ТВ» из рекомендаций пропали материалы РБК. И я даже не знаю, как это комментировать. Удивительно, что «Гугл» в течение многих месяцев вообще рекомендовал «Царьград ТВ», потому что владелец «Царьграда» Константин Малофеев находится под санкциями с 2014 года. Какие-то морально-этические вопросы — это все не важно для больших корпораций, а вот нарушение американских санкций — это серьезно.

При этом содержательно ничего не поменялось. Какие-то издания выкинули из рекомендаций, но с точки зрения ситуации с информированностью и с пропагандой отсутствие в рекомендациях материалов «Коммерсанта» и РБК — это очень плохая история. 

Здесь «Гугл» опять-таки помог Кремлю. Он выкинул не только «Комсомольскую правду», но и те максимально качественные, хоть и подцензурные материалы, которые как-то могли пропаганду уравновесить.

Падение трафика РБК: было 120–250 тысяч посетителей в день, а осталось стабильно около 45 тысяч. Это значит, что РБК не стало в рекомендациях Google, остались только переходы из результатов поиска в мобильном приложении

Насколько я знаю, пропало еще много вполне приличных региональных изданий.

Еще один важный момент: за этот год ни одного внятного содержательного ответа или комментария от сотрудников «Гугла» по этой проблеме мы не услышали. И нет никакой прозрачности в том, по каким принципам «Гугл» в этом смысле работает, кроме общих слов о том, что они учитывают интересы пользователей, борются с фейками и так далее.

— А на сами издания, которые, как вы говорите, выкинули, как это повлияло?

— С помощью Liveinternet можно увидеть: где-то как раз в ноябре «Комсомольская правда» суммарно потеряла примерно треть пользователей. У них было 6–8 миллионов пользователей, осталось в районе четырех с небольшим миллионов в день.

Падение аудитории «КП». На графике видно, что падение началось в сентябре и продолжилось в начале ноября, но позже «КП» отыграла, хоть и немного, за счет других источников

— Не так уж много они и потеряли.

— Скорей всего, эти же пользователи прибыли на «Царьград ТВ», на который приходится какое-то космическое количество переходов, миллионов по пять в день, из бывшего «Яндекса», а ныне «ВКонтакте».

— То есть российские технологические компании как-то компенсируют потери тем, кого обидели американские? В Кремле, скажем, видят, что какой-то драгоценный для них ресурс выпал из «Гугла», и могут что-то подкрутить в «Яндексе», чтобы там его рекомендовали активнее?

— Да, бывшие «Яндекс.Новости» и «Яндекс.Дзен», которые доступны по прежним адресам, но формально принадлежат «ВКонтакте», сейчас управляются вручную. У них есть очень короткий список источников, материалы которых выбираются в качестве заголовков, они-то и получают основной трафик, основное количество переходов.

— А «Коммерсанту» и РБК тоже так компенсируют потери?

— Может быть, «Коммерсантъ» что-то дополучил. У РБК и так трафик из рекомендаций «Гугла» был небольшой, у них достаточно большая доля собственного, более ядерного трафика, поэтому, я думаю, для них это просто неприятная история, но не настолько критичная.

— Знаете ли вы случаи, чтобы «Гугл» уже как-то помог независимым российским СМИ, заблокированным, начал их поднимать вверх в выдаче?

— Я о таком не слышал. С некоторыми представителями независимой прессы я разговаривал, хоть и довольно давно, они все говорят, что никто не понимает принципов «Гугла», иногда ситуация становится лучше, иногда хуже. А количество переходов у них заметно меньше, чем было до блокировок в России. Косвенно это подтверждается тем, что на блокировки в России «Гугл» тоже реагирует.

Фото: Эмин Джафаров / Коммерсантъ

— Если «Гугл» не выдает ссылки на то, что в России заблокировано, то есть на страницы, которые человек откроет, а там выскочит предупреждение Роскомнадзора, то он, может быть, логично считает, что пользователи — народ в основном неискушенный, нет смысла давать ссылку на ресурс, который все равно заблокирован?

— Это, конечно, имеет и разумное объяснение. Но, как можно интерпретировать слова Юровой, как раз эти ресурсы важно показывать.

— Есть ли у «Гугла» средства, чтобы не просто показать заголовок в заблокированном издании, а еще и обойти блокировку, показать материал, как-то дать понять, что прочесть его стоит?

— В том-то и дело, что свои инструменты для этого у «Гугла» есть. Юрова об этом не говорила, а я скажу: 

при желании «Гугл» мог бы этот контент показывать с помощью своих технологий обхода блокировок. Но даже показ заголовка тоже имеет смысл, потому что соотношение показов и кликов достаточно хорошее, может быть, процентов 20–30. Это значит, что на пять показов приходится примерно один клик.

А значит, эти пять показов тоже имеют смысл. Человек читает заголовок, там содержится информация — как правило, журналисты стараются выбрать для заголовка что-то важное. Но это может идти вразрез с политикой компании, которая требует показывать только то, что само откроется.

Как убедить «Гугл», чтобы он использовал обход блокировок, чтобы показывал полные тексты? Нужно ли это «Гуглу»? Здорово, что уже хотя бы идет разговор на уровне Еврокомиссии, что эта тема хотя бы поднята.

Это важно: технически для «Гугла» в этом никаких проблем нет. Более того: «Гугл» уже ограбили в России, он из России ушел, эвакуировал сотрудников, его юрлицо в России обанкротилось. Формально «Гугл», который все время повторяет, что не нарушает законы страны, в которой работает, в России уже многократно нарушал эти законы, его за это судили, ему назначали и получали с него штрафы. Поэтому я не вижу никаких препятствий, чтобы показывать те ресурсы, которые в компании будут считать качественными.

— В какой степени эти показы зависят от самих заблокированных СМИ? Насколько я знаю, журналисты должны как-то учитывать алгоритмы «Гугла», подбирать слова для заголовков, чтобы попадать в рекомендации. Может, из-за блокировок и сами издания перестали на это обращать внимание?

— Действительно существуют всякие документы, как оптимизировать контент по принципам Google Discover. Но вы действительно считаете, что в каком-нибудь издании, условно «Хибины.ком», все сделали лучше, чем в РБК? Конечно, для всех изданий очень важно, насколько ты оптимизирован, насколько хорошо тебя видят в поисковых и рекомендательных системах. Это очень заметная доля их аудитории. Конечно, все будут следовать рекомендациям. Но я повторю то, что уже сказал: сейчас эта логика попадания российских ресурсов в рекомендации «Дискавери» совершенно непонятна и непрозрачна. Какие-то инструкции есть, но вопрос в том, насколько они актуальны, насколько фактическая сторона соответствует тому, что в них написано.

Усложнение алгоритмов, которое мы предлагаем, было бы очень хорошо и для «Гугла», это повысило бы качество его сервисов. И не только в России, не только для русского языка, это общие принципы. Речь идет не только о рекомендательных сервисах, но и о поисковой выдаче.

— Хорошо бы знать, что думают об этом в самом «Гугле».

— В «Гугле», как мы видим, пока нет до этого дела. Поэтому теперь вопрос о том — какого уровня последствия должны им грозить, чтобы они начали что-то делать.

* Включен Минюстом РФ в реестр иноагентов.

** Признана в РФ экстремистской организацией ее деятельность запрещена.