Сбылись прогнозы и по профильному образованию: Нью-Йоркский университет открывает специальность по изучению науки о данных, в Абу-Даби строится университет искусственного интеллекта Сбылись прогнозы и по профильному образованию: Нью-Йоркский университет открывает специальность по изучению науки о данных, в Абу-Даби строится университет искусственного интеллекта Фото: © Zou Zheng / Xinhua / www.globallookpress.com

177 слайдов о состоянии дел в IT-индустрии

Два известных инвестора в ИИ-ориентированные стартапы — Натан Бенайх и Ян Хогарт — выпустили отчет о развитии искусственного интеллекта (ИИ) и машинного обучения в мире (State of AI Report 2020). Такое исследование они публикуют уже третий год подряд, но в этот раз оно самое масштабное — состоит из 177 слайдов с подробной аналитикой развития ИИ за последний год. Презентация разбита на пять больших разделов: исследования (технологические прорывы и их возможности), таланты, индустрия (области коммерческого применения ИИ и его влияние на бизнес), политика (регулирование ИИ, его экономические последствия и зарождающаяся геополитика ИИ) и прогнозы.

Вместе с тем прошлогодние предсказания сбылись почти все. К примеру, исследователи прогнозировали, что компании, занимающиеся так называемой обработкой естественного языка (NLP (Natural language processing) — подраздел информатики и AI — посвященный тому, как компьютеры анализируют человеческие языки), заработают $100 млн за год — платформам Gong.io и ASAPP удалось привлечь каждой вдвое больше. Скептическая оценка потенциала беспилотных автомобилей (ни одна компания не преодолеет больше 15 млн миль — около 24 млн км) тоже подтвердилась, ближе всего к данной планке подошла Waimo — дочерняя компания холдинга Alphabet, который владеет несколькими компаниями, ранее принадлежавшими Google Inc, и самой Google Inc в том числе.

Сбылись прогнозы и по профильному образованию: Нью-Йоркский университет открывает специальность по изучению науки о данных, в Абу-Даби строится университет искусственного интеллекта. Частично реализовалось предположение о квантовом прорыве Google (когда их квантовый процессор Sycamore выполнил целевое вычисление за 200 секунд, что, по их оценкам, заняло бы у самого мощного классического суперкомпьютера в мире 10 тыс. лет). А вот прогноз о том, что как минимум одна компания серьезно изменит модель управления, сделав ставку на ИИ, не подтвердился.

Мы перевели некоторые любопытные тезисы свежего исследования и приводим новые прогнозы Бенайха и Хогарта.

Исследования и разработки в сфере искусственного интеллекта становятся одной из самых закрытых областей Исследования и разработки в сфере искусственного интеллекта становятся одной из самых закрытых областей Фото: © Xinhua / www.globallookpress.com

Исследования: ИИ понимает естественный язык лучше человека?

Исследования и разработки в сфере искусственного интеллекта становятся одной из самых закрытых областей (лишь 15% статей публикует исходный код, хотя еще в прошлом декабре эта цифра подбиралась к 25%). Так что, по мнению исследователей, централизация талантов и наработок в крупнейших компаниях может стать большой проблемой.

Другое наблюдение: в самой перспективной области ИИ — обработке естественного языка (NLP) — сегодня правят бал крупные компании и громадные затраты на обучение моделей — примерно в $1 за 1 тыс. параметров. По оценкам экспертов, вероятный бюджет на обучение модели GPT3, которая была провозглашена новейшим и величайшим достижением в области ИИ, составил для выпустившей ее компании OpenAI $10 миллионов.

При этом новые поколения моделей открывают дополнительные возможности NLP: не просто улучшаются задачи перевода текста, его создания и обобщения, но становится возможным, к примеру, перенос кода на другой язык программирования и автоматическое устранение ошибок в программе. Но самое невероятное, что уже некоторые существующие тесты для NLP показывают превосходство искусственного интеллекта. К примеру, GLUE (General Language Understanding Evaluation) предназначен для сравнения производительности языковых ИИ-моделей с человеческими при выполнении ряда задач, охватывающих логику, понимание здравого смысла и лексическую семантику.

В прошлом году ИИ на один балл превзошел в GLUE базовый уровень человека в оценке понимания естественного языка, а в 2020-м обогнал уже уверенно (набрав 90,6 балла против 87 «человеческих»), приблизившись к опережению человека в более продвинутом тесте — SuperGLUE. Причем исследователи отмечают впечатляющую способность таких моделей к обобщению: даже GPT-2, натренированный на письме, способен самостоятельно дополнять изображения.

Вместе с тем мир сталкивается с некоторой стагнацией в зрелых областях машинного обучения. Для небольших улучшений производительности теперь требуются невероятные затраты: так, для снижения частоты ошибок ImageNet (база данных для отработки и тестирования методов распознавания образов и машинного зрения) с 11,5% до 1% потребовалось бы более $100 миллиардов.

Еще одна научная закономерность, выявленная исследователями, — серьезное проникновение ИИ в биологию и химию. Публикации, связанные с ИИ (например, глубокое обучение, NLP, компьютерное зрение) ежегодно растут на 50% с 2017 года. Глубокое обучение (deep learning) позволяет создавать модели, обученные идентифицировать поврежденные клетки с помощью флуоресцентной микроскопии — они применялись и для изучения COVID-19. Скрининговая маммография на основе искусственного интеллекта снижает количество ложноположительных и ложноотрицательных результатов (по исследованиям клиник в США и Великобритании). При этом для полноценного применения ИИ в медицинской диагностике, по мысли исследователей, не хватает обучения моделей причинно-следственным связям. Пока машины просто проводят корреляцию между симптомами и заболеванием, но этого недостаточно. А в химии ИИ помогает синтезировать молекулы и искать лекарства, а также прогнозировать свойства соединений.

Отдельное продвижение зафиксировано в сфере компьютерного зрения: оно предсказывает, когда объект может выйти из поля видимости, превращает обычные изображения в стерео и выравнивает уровни на съемках камеры 360 градусов. Более того, ИИ может обучиться управлять автомобилем по видеороликам, предсказывая, как будет развиваться дорожная ситуация в зависимости от действий водителя.

Главный тренд, на который обращают внимание Бенайх и Хогард, — переманивание ИТ-компаниями университетских профессоров, специализирующихся на ИИ Главный тренд, на который обращают внимание Бенайх и Хогард, — переманивание IT-компаниями университетских профессоров, специализирующихся на ИИ Фото: © Sebastian Gollnow / dpa / www.globallookpress.com

Таланты: утечка профессоров и продолжающееся лидерство Штатов

Главный тренд, на который обращают внимание Бенайх и Хогард, — переманивание IT-компаниями университетских профессоров, специализирующихся на ИИ. С 2004 по 2018 год Google, DeepMind, Amazon и Microsoft наняли 52 штатных профессора из Университета США. Университеты Карнеги-Меллон, Вашингтон и Беркли потеряли 38 профессоров за данное время. По мнению исследователей, это уже отражается на отрасли: отъезд ученых коррелирует с сокращением предпринимательской деятельности выпускников 69 университетов США. В то же время вузы готовы платить профессорам огромные деньги: так, технологический университет Эйндховена (Нидерланды) обязуется потратить 100 млн евро в течение пяти лет на создание нового института, который будет сосредоточен на использовании интеллектуальных алгоритмов в машинах, таких как роботы и автономные автомобили. На эти деньги вуз планирует нанять 50 профессоров. Университет искусственного интеллекта им. Мухаммеда бен Заида (Mohamed bin Zayed University of Artificial Intelligence) в Абу-Даби, в попечительский совет которого входит и один из известнейших экспертов в области ИИ Кай-Фу Ли, получил в 2020 году 2,2 тыс. заявок на обучение, а Университет Сорбонна в Абу-Даби открыл собственную степень бакалавра в области математики и анализа данных для искусственного интеллекта. Стэндфорд учит машинному обучению в 2 раза больше студентов, чем в 2012–2014 годах.

Активно работает в данном направлении и Китай: в прошлом году почти треть авторов работ, принятых на NeurIPS (конференции, считающейся ключевой в области машинного обучения), получили степень бакалавра в Поднебесной. Впрочем, потом половина из них все равно едет в США. Штаты утечкой мозгов не страдают: 85–90% иностранных студентов, получивших кандидатскую степень в американских университетах, остаются трудиться в стране. Они предпочитают устраиваться в большие компании, хотя сами американцы после окончания обучения гораздо чаще выбирают стартапы или продолжают академическую деятельность. И что самое интересное: почти 70% исследователей, работающих в Америке, получили образование за ее пределами, в основном в Китае, ЕС и Индии.

Авторы приводят репрезентативный анализ данных Indeed.com — он показывает, что число объявлений о вакансиях, связанных с ИИ, в США почти в три раза превышает спрос на них. При этом руководители 1 872 предприятий по всему миру сообщают о крупнейшем за последний год сокращении рабочей силы из-за ИИ в автомобильной, монтажной и телекоммуникационной сферах. Ожидается, что за ними последуют увольнения в отраслях транспорта, ЖКХ, розничной торговли и финансов.

Компании, разрабатывающие беспилотники, только с июля 2019 года сумели привлечь почти $7 млрд инвестиций Компании, разрабатывающие беспилотники, только с июля 2019 года сумели привлечь почти $7 млрд инвестиций Фото: Сергей Савостьянов / ТАСС

Индустрия: прорыв в медицине и стагнация беспилотников

Первая новость в индустрии машинного обучения, по мысли авторов исследования, — запуск в Японии первой фазы клинических испытаний препарата, созданного на основе искусственного интеллекта. Лекарство предназначено для лечения пациентов с обсессивно-компульсивным расстройством и создавалось в течение 12 месяцев совместно компаниями British Exscientia и Japanese Sumitomo Dainippon Pharma. Параллельно Exscientia заключила сделку с немецким концерном Bayer на 240 млн евро — вместе компании занимаются поиском новых лекарств для лечения рака и болезней сердца с помощью ИИ. Спустя 29 месяцев после оценки более 1 тыс. комбинаций иммунологических лекарственных препаратов на предмет потенциальных синергетических эффектов с биспецифическими малыми молекулами Exscientia обнаруживает новую, первую в своем классе небольшую молекулу, которую теперь  Sanofi (международная французская фармацевтическая компания) будет изучать с точки зрения дальнейшего использования для создания лекарств. Крупные фармкомпании подтверждают результаты открытий новых препаратов, основанных на ИИ, а профильные стартапы увеличивают количество раундов, привлекая десятки миллионов евро. Искусственный интеллект учится анализировать съемки электронного микроскопа, сокращая время на анализ с нескольких часов до считанных минут.

Еще один важный момент — развитие беспилотного транспорта. Сегодня почти половина штатов США приняла законодательство, регламентирующее движение автономных транспортных средств, но все говорит о том, что беспилотники не стали той невероятной точкой роста ИИ, которой казались. Так, только три из 66 компаний, обладающих разрешениями на тестирование беспилотников в Калифорнии, имеют право испытывать авто без контрольного водителя в нем. Для этого организации должны получить специальное разрешение, подтвердить наличие страховки или залога в размере $5 млн и доказать, что их автомобили могут работать без водителя. Количество беспилотных поездок в той же Калифорнии выросло на 42% по сравнению с 2018 годом, но остается микроскопическим — это 0,000737% от общего трафика. Вместе с тем компании, разрабатывающие беспилотники, только с июля 2019-го сумели привлечь почти $7 млрд инвестиций. Например, беспилотное подразделение DiDi получило $500 млн от SoftBank Vision Fund, удвоило свою команду и с конца июля 2020-го запустило в Шанхае сервис вызова пассажиров, который работает на дорогах общего пользования. Впрочем, в данной сфере есть и обратные кейсы: в первом квартале этого года закрылась Starsky Robotics — первая компания, запустившая автономный беспилотный грузовик на шоссе общего пользования. По мнению исследователей, подобное открыто указывает на проблемы масштабирования контролируемого обучения. «Бо́льшая часть сегодняшнего машинного обучения для систем автоматического вождения сосредоточена только на понимании того, что находится вокруг автомобиля. Следующий шаг — смещение акцента с восприятия на прогнозирование движения», — говорится в докладе.

На предприятиях самые распространенные технологии — автоматизация бизнес-процессов и компьютерное зрение. Речь, генерация естественного языка и физические роботы — наименее применяемые. Впрочем, тоже развивающиеся: так, компания PolyAI представила голосового помощника для сферы гостеприимства в Великобритании, который отвечает на звонки, бронирует номера и помогает посетителям с особыми диетическими требованиями, а также предоставляет рекомендации по COVID-19. Отмечается, что система может понимать речь на фоне телефонных шумов и с 90-процентной успешностью поддерживает разговор в 8 реплик, обучаясь на взаимодействиях намного быстрее, чем, например, Siri.

Компьютерное зрение стали активно применять для оценки ущерба после аварий: пользователи могут сфотографировать поврежденный автомобиль и сразу получить полную оценку ремонта. Система обнаруживает незаметные доказательства подделки документов, удостоверяющих личность.

NLP используется для оценки экологического, социального и корпоративного восприятия компании в мировых новостях, которое все чаще запрашивается инвесторами. Для этого ежедневно анализируются миллионы новостных статей. ИИ подключили и к анализу контента на предмет отмывания денег и финансирования террористов: если профессиональный аналитик может изучить 120 статей в день, то автоматизированное решение — до 8 миллионов.

Машинное обучение защищает людей от фишинговых атак по электронной почте, количество которых во время пандемии увеличилось в 30 раз, — в данном направлении, например, продвинулся стартап Tessian.

В этом году на передний план выходят вопросы этических рисков в развертывании искусственного интеллекта в определенных областях, таких как полицейская, судебная, военная системы В этом году на передний план выходят вопросы этических рисков в развертывании искусственного интеллекта в определенных областях, таких как полицейская, судебная, военная системы Фото: © Arne Dedert / dpa / www.globallookpress.com

Политика: этические риски и ошибка компьютера

В 2020 году на передний план выходят вопросы этических рисков в развертывании искусственного интеллекта в определенных областях, таких как полицейская, судебная, военная системы. На указанные темы публикуется все больше исследований, обращают внимание Бенайх и Хогарт.

Так, больше половины стран мира сегодня использует распознавание лиц. Всего три страны (Бельгия, Люксембург, Марокко) имеют частичные запреты на использование данных технологий, которые разрешены только в определенных случаях. Такое внедрение системы распознавания уже привело как минимум к двум (известным) случаям ошибочного ареста людей. В мае 2019 года полиция Детройта арестовала Майкла Оливера, после того как алгоритм распознавания лиц неправильно сопоставил его с человеком на видео, но у Оливера оказались татуировки на руках, которых не было на подозреваемом. А в январе 2020-го был арестован Роберт Уильямс после того, как аналогичный алгоритм ошибочно соотнес фотографию на его водительских правах с размытыми кадрами видеонаблюдения. В жалобе задержанного утверждается, что его продержали в камере всю ночь без объяснения причин и в конце концов ему сказали, что «компьютер, должно быть, ошибся». Авторы доклада допускают, что указанные примеры, вероятно, лишь верхушка айсберга.

Расследование New York Times показало, что компания Clearview обработала миллиарды изображений, а затем передала лицензию на свою «поисковую систему по лицам» более чем 600 правоохранительным органам. Последующее расследование Buzzfeed показало, что технология Clearview также использовалась частными лицами, банками, школами, министерством юстиции США и розничными торговцами, включая Best Buy.

Большие компании сегодня ведут себя осторожнее. Так, Microsoft удалила свою базу данных, содержащую 10 млн лиц, — самую большую из имеющихся. У людей, чьи лица были в базе данных, не спрашивали согласия, они были извлечены из интернета. Amazon объявила, что на год приостановит допуск полиции к использованию собственного инструмента распознавания лиц Rekognition, чтобы «у конгресса было достаточно времени для принятия соответствующих правил». IBM заявила о прекращении производства универсальных продуктов для распознавания лиц.

В марте 2020 года в штате Вашингтон был подписан закон, который строго ограничивает использование правоохранительными органами технологии распознавания лиц. Согласно документу используемое программное обеспечение должно быть доступно независимой третьей стороне через API для оценки «точности и несправедливых различий в производительности» по таким характеристикам, как раса или пол. Закон также требует обучения и публичной отчетности по использованию систем распознавания лиц. Интересно, что внедрение закона спонсировал сенатор штата Джо Нгуен, старший менеджер Microsoft.

Microsoft удалила свою базу данных, содержащую 10 млн лиц — самую большую из имеющихся. У людей, чьи лица были в базе данных, не спрашивали согласия, они были извлечены из Интернета Microsoft удалила свою базу данных, содержащую 10 млн лиц, — самую большую из имеющихся. У людей, чьи лица были в базе данных, не спрашивали согласия, они были извлечены из интернета Фото: © Rodrigo Reyes Marin / AFLO / www.globallookpress.com

Высокий суд Лондона в прошлом году впервые рассмотрел иск, связанный с использованием системы распознавания лиц полицией (истец проиграл, но суд обязал полицию исключить возможность дискриминации). Даже в Китае профессор Го Бин из Чжэцзянского научно-технического университета подал в суд на местный сафари-парк за нарушение закона о защите прав потребителей после того, как там появилось обязательное требование регистрации «по лицу». Сафари-парк в итоге ввел альтернативу в виде отпечатка пальца. Авторы доклада отмечают, что, несмотря на повсеместное использование технологий распознавания в Китае, вопросы конфиденциальности рассматриваются все более серьезно: Лей Чаози, директор по науке и технологиям министерства образования Поднебесной, пообещал «ограничить и отрегулировать» использование систем распознавания лиц в школах. Вместе с тем Китай объявил о запрете на публикацию и распространение «фейковых новостей», созданных с помощью ИИ, и постановил, что факт использования искусственного интеллекта также должен быть четко обозначен на видном месте. В начале этого года высший законодательный орган КНР заявил, что рассматривает возможность признания технологии deepfake незаконной.

Другая проблема, над которой множество стран и штатов начинают ломать голову, — как регулировать использование ИИ при принятии решений. Суд Нидерландов остановил автоматизированную систему выявления мошенничества в сфере социального обеспечения, сославшись на то, что это нарушает права человека. Премьер-министр Новой Зеландии объявил, что они первыми в мире разработали набор стандартов того, как государственные органы должны использовать алгоритмы для принятия решений. Великобритания отказалась от общенационального алгоритма выставления оценок на экзаменах после огромного общественного протеста и свидетельств того, что он был предвзятым относительно студентов из неблагополучных семей.

Вместе с тем машинное обучение все активнее используется военными. Минобороны США заключило пятилетний контракт на сумму $800 млн с компанией Booz Allen Hamilton, который включает в себя обработку и управление данными, а также разработку и внедрение ИИ в новые и существующие программы и системы. Авторы исследования обращают внимание, что в реальную военную сферу могут перейти технологии, используемые в компьютерных играх. Так, Технологический институт Джорджии вместе с подрядчиками оборонки США участвовал в серии виртуальных воздушных боев. В итоге ИИ победил пилота-человека со счетом 5:0. А министр обороны анонсировал в 2024 году реальные соревнования между пилотами и ИИ с участием полномасштабных тактических самолетов.

Президент США Дональд Трамп подписал указ «Сохранение американского лидерства в области искусственного интеллекта», который предусматривает $1,5 млрд финансирования Президент США Дональд Трамп подписал указ «Сохранение американского лидерства в области искусственного интеллекта», который предусматривает $1,5 млрд финансирования Фото: © Kevin Dietsch - Pool via CNP / Consolidated News Photosy / www.globallookpress.com

Битва за чипы и ИИ-национализм

Внешняя политика тоже отражается на компаниях, связанных с ИИ. Так, Белый дом продлил санкции в отношении 24 китайских компаний за «поддержку закупок товаров для конечного военного использования в Китае» и еще 8 — за «нарушения прав человека <…> в отношении уйгуров, этнических казахов и других членов групп мусульманского меньшинства в Синьцзянь-Уйгурском автономном округе». В итоге компании столкнулись с нехваткой чипов и способности привлекать капитал в США посредством IPO.

Одновременно Huawei, который занял лидирующее положение на рынке смартфонов (впервые за 9 лет потеснив Apple и Samsung), тоже попал под санкции, оказавшись без чипов (иностранным компаниям, использующим оборудование для производства микросхем в США, потребуется получить лицензию перед поставкой в Huawei). Так что китайское правительство создает дополнительный государственный фонд в размере $29 млрд, чтобы снизить зависимость от американских полупроводниковых технологий и нанимает 100 инженеров TSMC — лидирующей отраслевой компании (главный поставщик чипов для Apple, AMD и других), — предложив им зарплату в 2,5 раза выше. Тем временем TSMC заявила, что потратит $12 млрд на создание завода по производству микросхем в Аризоне и планирует начать выпуск еще более совершенного 3-нанометрового чипа в Тайване. Сенат США в свою очередь предложил закон, предусматривающий выделение $22 млрд на субсидирование производства чипов в Америке (несмотря на то что более половины современных микросхем в мире разрабатывается в Штатах, только 12% производится там).

Еще один вывод исследователей — политические лидеры задумаются, следует ли блокировать приобретение ключевых стартапов в области ИИ. В июне 2020 года Германия приняла закон, позволяющий правительству пересматривать или блокировать инвестиции или поглощение компаниями, не входящими в ЕС, предприятий робототехники, искусственного интеллекта и полупроводников, причем порог иностранной собственности, при котором правительство может накладывать вето, был снижен с 25% до 10%. Одновременно Великобритания начала тщательно проверять слияния и поглощения с участием ИИ-компаний, в которых целевая компания имеет выручку более 1 млн фунтов стерлингов.

Президент США Дональд Трамп подписал указ «Сохранение американского лидерства в области искусственного интеллекта», который предусматривает $1,5 млрд финансирования. К тому же продолжает расширяться объединенный центр ИИ минобороны: с начального бюджета в $93 млн в 2019 году он вырос до $238 млн в 2020-м.

Министерство науки и технологий КНР планирует к 2023-му создать на базе 20 городов пилотные зоны для искусственного интеллекта — там поощряется применение ИИ в самых разных областях — от производства до ухода за престарелыми и инвалидами, рекомендуется проводить политические и социальные эксперименты на основе ИИ. В качестве примера называется Дэцин (город в провинции Гуандун), который сосредоточится на автономном вождении и интеллектуальном сельском хозяйстве.

NVIDIA не завершает приобретение Arm (разработчика микропроцессоров, ее технология лежит в основе чипов, которые используются в большинстве смартфонов, выпускаемых по всему миру) NVIDIA не завершает приобретение Arm (разработчика микропроцессоров — ее технология лежит в основе чипов, которые используются в большинстве смартфонов, выпускаемых по всему миру) Фото: RITCHIE B. TONGO / EPA

Прогнозы на ближайшие 12 месяцев

1. Гонка за построение более крупных языковых моделей продолжается, появится первая модель с 10 трлн параметров.

2. Нейронные сети переходят от NLР к компьютерному зрению.

3. Крупная корпоративная лаборатория искусственного интеллекта (авторы не называют наименования) закрывается, поскольку ее материнская компания меняет стратегию.

4. Китайские и европейские стартапы в области ИИ, ориентированные на оборону, в ответ на деятельность министерства обороны США, вкладывающего в стартапы, связанные с использованием ИИ в военных целях, в течение следующих 12 месяцев собирают более $100 миллионов.

5. Один из ведущих стартапов по открытию новых лекарств с помощью искусственного интеллекта (например, Recursion, Exscientia) либо выходит на IPO, либо приобретается за более чем $1 миллиард.

6. DeepMind делает крупный прорыв в структурной биологии и открытии лекарств за пределами AlphaFold.

7. «Фейсбук» совершает прорыв в области дополненной и виртуальной реальности с помощью компьютерного 3D-зрения.

8. NVIDIA не завершает приобретение Arm (разработчика микропроцессоров —  ее технология лежит в основе чипов, которые используются в большинстве смартфонов, выпускаемых по всему миру). Сделка оценивалась в $40 миллиардов.