В середине июля компания Nvidia на короткий срок стала самой дорогой компанией в мире. Стоимость акций ведущего поставщика чипов и сетевой инфраструктуры, используемых для обучения моделей искусственного интеллекта, выросла почти в три раза с января. Но ситуация оказалась нестабильной, и после достижения пика стоимость компании упала на 400 миллиардов долларов за три торговые сессии.
Эти колебания отражают неуверенность инвесторов в экономике ИИ, считают аналитики. И приходят к выводу. Важно понимать, что успех ИИ зависит от трех факторов: данных, алгоритмов и вычислительной мощности.
От чего зависят достижения ИИ?
Перспективы самообучающихся систем очевидны. С 2016 года все мы видим потрясающие приложения, которые вызвали бум ИИ. В марте 2016 года программа AlphaGo от Google DeepMind поразила мир, когда победила величайшего Ли Седоля в настольной игре для двух человек. В ноябре 2020 года алгоритм AlphaFold от того же Google решил одну из величайших задач в области естественных наук. Программа, разработанная как система глубокого обучения предсказала пространственную структуру белка. А OpenAI два года спустя запустила языкового чат-бота, способного импровизировать стихи Шекспира.
Все эти достижения являются результатом одной и той же инновации: кардинального повышения точности компьютерного предиктивного моделирования. Эту идею в своем блоге обосновал Ричард С. Саттон – канадский ученый-компьютерщик.
На протяжении десятилетий исследователи обучали компьютеры играть в игры и решать проблемы, кодируя с трудом завоеванные человеческие знания. Но все оказалось гораздо проще. Алгоритмы обучения показали превосходные результаты, когда они были подпитаны достаточной вычислительной мощностью и снабжены достаточным количеством данных. «Углубление наших открытий, – заключил Саттон, – только усложняет понимание того, как можно осуществить процесс открытия».
Вычислительная мощность VS алгоритмы
В бестселлере 2015 года «Суперпрогнозирование: искусство и наука прогнозирования» канадский психолог Филип Тетлок и его соавтор Дэн Гарднер объяснили, что тот же агностический метод полезен и для людей. В турнирах по прогнозированию систематически выигрывают методичные и непредвзятые любители. Здравый смысл плюс готовность усваивать большой объем данных более эффективны, чем глубокие знания предметной области и профессиональный опыт. Сегодняшние передовые модели искусственного интеллекта по существу автоматизируют подход суперпрогнозистов.
Этот простой рецепт – обучающиеся алгоритмы плюс вычислительная мощность плюс данные – дает потрясающие предсказательные результаты.
По оценкам некоммерческого исследовательского института Epoch AI, в период с 2012 по 2023 год вычислительная мощность, необходимая для достижения установленного порога производительности, сокращалась вдвое примерно каждые восемь месяцев. Такова экономическая эффективность, достигнутая благодаря недавним инновациям в области нейронных сетей.
Однако долгосрочную ценность этих алгоритмов определить гораздо сложнее. Цифровой код уязвим для имитации и кражи. Темпы будущих инноваций трудно предсказать. Человеческие таланты, которые сейчас сидят в лабораториях искусственного интеллекта, принадлежащих технологическим гигантам, могут легко уйти.
Второй ингредиент – грубая вычислительная мощность – является более простым предложением. Но эффективность этой модели зависит от объема используемых микросхем и электроэнергии. Прогнозируемые капитальные затраты становятся настолько огромными, что многие инвесторы начинают справедливо опасаться этой сферы. Компания AMD объявила, что рынок чипов ИИ достигнет 400 миллиардов долларов к 2027 году. Но судя по существующим тенденциям, американские исследователи предполагают, что инвестиции в ИИ достигнут 3 триллионов долларов всего через год. В то время как первый кластер центров обработки данных стоимостью 1 триллион долларов откроется через два года после этого. Кажется, что компьютерное оборудование, а не программное обеспечение, теперь пожирает мир.
А что насчет данных?
Однако в этом рассуждении есть изъян. Первые два ингредиента ИИ – алгоритмы и вычисления – ничего не стоят без третьего: данных. Более того, чем лучше данные, тем менее ценной становится вычислительная мощность.
Этот факт легко было упустить из виду. Наиболее известными приложениями ИИ являются чат-боты общего назначения, обученные работе с большими объемами трафика и непроверенного текста, взятого из Интернета. Система была заточена на количество, а не на качество. Крупнейший американский финансовый конгломерат Morgan Stanley предполагает использовать как минимум 10 000 графических чипов для обработки более 9,5 петабайт текста с помощью OpenAI ChatGPT 4.
При этом приложения искусственного интеллекта специального назначения имеют меньшую значимость, но демонстрируют, где, скорее всего, будет будущее.
Программист ICONICA Андрей Петрица:
Модель AlphaFold от Google DeepMind решила поистине грандиозную задачу биологии, над которой ученые бились порядка пятидесяти лет. И примечателен тот факт, что для этого потребовалось менее 200 графических чипов.
Это стало возможным благодаря тому, что он был обучен на тщательно отобранной базе данных из 170 000 образцов белков. Таким образом, высококачественные данные не только радикально повышают эффективность моделей ИИ, но и экономику технологии.
Компании, владеющие полезными специализированными данными, получат наибольшие выгоды от ИИ. Это правда, что в некоторой части этого пространства доминируют высоко ценимые технологические гиганты, такие как владелец Google Alphabet и Amazon.Но также технологии ИИ со специализированными данными будут интересны банкам, коммунальным предприятиям, поставщикам медицинских услуг, ритейлу и бизнесу в других сферах.
Несмотря на связанность таких атрибутов, как данные, алгоритмы и вычислительная мощность аналитики склоняются к тому, что реальная ценность революции искусственного интеллекта будет заключаться не в центрах обработки данных, а самих наборах данных.