Houmo.AI: AI-вычисления переходят на периферию облака

В этом году на Всемирной конференции по искусственному интеллекту (WAIC) в зале H1 четко прослеживаются две ключевые тенденции, определяющие развитие вычислительных технологий в Китае: «суперузлы» и чипы для периферийных вычислений, предназначенные для генеративного искусственного интеллекта. Эти направления отражают разные пути эволюции вычислительных систем в эпоху больших моделей. Давайте разберем, как эти тренды формируют будущее ИИ, и какие возможности они открывают.

Суперузлы: основа облачной инфраструктуры для ИИ

Одним из главных направлений остается развитие облачных технологий для обучения моделей искусственного интеллекта. Суперузлы становятся центральным элементом в стремлении Китая создать мощную облачную инфраструктуру для ИИ. На WAIC 2025 ведущие компании, включая Huawei и ряд крупных местных производителей чипов, представили свои разработки в области суперузлов, демонстрируя амбиции в этой сфере. Такие системы позволяют обрабатывать огромные объемы данных и обучать сложные модели, что крайне важно для дальнейшего прогресса в области искусственного интеллекта.

Периферийные вычисления: ИИ в реальной жизни

В то же время активно развивается направление периферийных вычислений для ИИ. С ростом внедрения генеративного интеллекта в повседневные приложения спрос смещается в сторону компактных чипов, готовых к выполнению задач вывода (inference) непосредственно на устройствах. Этот тренд получил новый импульс после значительных достижений в снижении вычислительных барьеров для работы с большими языковыми моделями (LLM). На конференции были представлены современные чипы для периферийных вычислений, которые уже используются в бытовой технике и промышленных устройствах, что подчеркивает их практическую значимость.

Гибридные вычисления: баланс между облаком и периферией

Совмещение этих двух тенденций указывает на то, что будущее генеративного ИИ будет строиться на гибридной модели вычислений: обучение моделей в облаке и выполнение задач вывода на периферийных устройствах. По мнению Ву Цяна, генерального директора компании Houmo.AI, в перспективе около 90% задач вывода для генеративного ИИ будут выполняться локально, на устройствах, и лишь 10% будут зависеть от облачных вычислений. Это позволит ИИ стать по-настоящему массовым явлением, проникая в каждый дом и каждую сферу жизни.

Почему периферийные вычисления становятся ключевым направлением?

Периферийные вычисления открывают новые горизонты для внедрения ИИ в реальную жизнь. Компактные чипы позволяют устройствам, таким как планшеты, компьютеры или роботы, выполнять сложные задачи без постоянного подключения к облаку. Это особенно важно в условиях ограниченного энергопотребления и необходимости компактных решений. Спрос на такие технологии растет, и рынок периферийных вычислений может в будущем превзойти по масштабам даже облачные решения, создавая пространство для новых игроков и инновационных подходов.

Houmo.AI: ставка на будущее с помощью CIM-технологий

Одной из компаний, активно работающих над развитием периферийных вычислений, является Houmo.AI. Основатель компании Ву Цян, имеющий богатый опыт в разработке чипов, в 2021 году запустил проект с целью создания чипов нового поколения на основе технологии вычислений в памяти (CIM). Эта технология позволяет устранить одну из главных проблем традиционной архитектуры фон Неймана — неэффективность перемещения данных между памятью и вычислительными блоками, что особенно критично для больших моделей с миллиардами параметров.

Преимущества CIM: решение проблем энергии и памяти

Традиционные вычислительные архитектуры сталкиваются с серьезными ограничениями по мере роста размеров моделей ИИ. Энергия, затрачиваемая на перемещение данных, часто превышает затраты на сами вычисления. Технология CIM решает эту проблему, выполняя операции непосредственно в ячейках памяти, что значительно снижает энергопотребление и повышает эффективность. Это делает CIM идеальной основой для создания чипов, способных работать в условиях ограниченных ресурсов на периферийных устройствах.

Momagic 50: новый уровень периферийных вычислений

Накануне WAIC 2025 компания Houmo представила свой новейший чип Momagic 50, созданный на основе CIM. По словам Ву Цяна, это значительный шаг вперед в архитектуре, достигнутый благодаря собственным разработкам, которые улучшают энергоэффективность и компактность. Чип поддерживает выполнение моделей с плавающей точкой непосредственно в системе CIM, что открывает новые возможности для вывода на периферии. Кроме того, он оснащен современным инструментарием компилятора Houmo Dadao, который обеспечивает совместимость с популярными фреймворками для глубокого обучения, упрощая переход клиентов на новую платформу.

Впечатляющие характеристики Momagic 50

Производительность Momagic 50 впечатляет: 160 TOPS (тера операций в секунду) при INT8, 100 TFLOPs при BFP16, до 48 гигабайт встроенной памяти и пропускная способность памяти 153,6 ГБ/с. При этом энергопотребление составляет всего 10 ватт — примерно столько же, сколько требуется для быстрой зарядки смартфона. Это позволяет запускать языковые модели с 7–70 миллиардами параметров полностью автономно, без подключения к облаку, на устройствах вроде ноутбуков, планшетов и робототехники.

Гибкость и перспективы внедрения

Momagic 50 поддерживает архитектуры x86 и Arm, что обеспечивает широкие возможности для его применения в различных устройствах. Компания Houmo активно работает над коммерциализацией продукта, уже сотрудничая с крупными партнерами, такими как Lenovo (для создания ПК с поддержкой ИИ), iFlyrec (для систем голосового управления) и China Mobile (для гибридных сетевых решений). Это подчеркивает высокий потенциал технологии в разных отраслях, от умных офисов до промышленных решений.

Будущее CIM: от ниши к массовому признанию

Технология CIM постепенно выходит из категории нишевых решений. Если несколько лет назад о ней говорили лишь отдельные компании, то сегодня она становится предметом обсуждения среди крупных игроков рынка и даже привлекает внимание государственных структур в Китае. Инвесторы также начинают лучше понимать ценность CIM для задач ИИ, что способствует росту интереса к этой технологии. Однако путь к массовому внедрению и коммерциализации остается сложным, и компании, такие как Houmo, продолжают искать оптимальные подходы к реализации потенциала CIM.

Вызовы и достижения на пути к инновациям

Разработка чипов на основе CIM требует решения множества инженерных задач, от проектирования схем до обеспечения надежности и производительности при массовом производстве. Houmo за четыре года работы накопила значительный опыт, создав собственные инструменты проектирования и решив ключевые проблемы, такие как управление мгновенными скачками тока при высокой плотности вычислений. Эти достижения стали основой для создания продуктов, которые действительно могут изменить рынок периферийных вычислений.

Заключение: ИИ на периферии как новый стандарт

Развитие периферийных вычислений и технологий вроде CIM открывает новые горизонты для искусственного интеллекта, делая его более доступным и энергоэффективным. Компании, такие как Houmo.AI, играют важную роль в этом процессе, создавая решения, которые позволяют запускать сложные модели ИИ непосредственно на устройствах. В сочетании с облачными суперузлами это формирует гибридную модель вычислений, которая, вероятно, станет стандартом будущего. Следите за новостями в этой области, ведь ИИ продолжает менять нашу жизнь, становясь все ближе к каждому из нас.

Оставьте комментарий