Если говорить о компании Unitree Robotics, то большинство специалистов в индустрии ассоциируют её с производством робототехнического оборудования. Однако на Всемирной конференции по робототехнике (WRC) основатель компании Ван Синсин представил совершенно иную точку зрения, которая заставила многих пересмотреть своё мнение о направлении развития бренда.
Новая философия Unitree: акцент на алгоритмы и данные
Во время своего выступления на WRC Ван посвятил значительную часть доклада обсуждению крупных моделей, алгоритмов и данных. Этот акцент стал неожиданностью для аудитории. Основатель компании подверг критике популярную архитектуру VLA (vision-language-action), которая лежит в основе многих современных роботизированных систем с искусственным интеллектом. По мнению Вана, текущая реализация VLA оставляет желать лучшего, называя её «довольно примитивной». Главная проблема, как он считает, заключается в недостатке качественных данных. Для эффективной работы в реальных условиях такие модели требуют огромных массивов информации, а их дефицит — общепризнанная сложность в отрасли. Многие компании пытаются решить этот вопрос, собирая данные из реального мира, создавая симуляции или разрабатывая специализированные системы для их сбора. Однако Ван уверен, что такой подход неэффективен. «Слишком много внимания уделяется базовым данным, — отметил он. — Нам нужно сосредоточиться на улучшении самой архитектуры моделей. На данный момент они недостаточно совершенны и не унифицированы».
Unitree Robotics и искусственный интеллект: скрытый потенциал
Ранее Unitree ассоциировалась исключительно с разработкой аппаратного обеспечения, а не с созданием «мозга» для роботов. Это создавало впечатление, что компания не делает ставку на искусственный интеллект. Однако в беседе с представителями СМИ на WRC Ван развеял эти домыслы: «Наша команда по разработке моделей довольно большая, хотя, конечно, она уступает по масштабам крупным игрокам в сфере ИИ». При этом он подчеркнул, что размер команды или бюджет — не ключевые факторы успеха. «Для создания технологий мирового уровня не всегда нужны огромные ресурсы. Инновации могут рождаться и в небольших командах, хотя давление на них, безусловно, выше», — добавил он.
Эксперименты с моделями: от VLA к видео-ориентированным подходам
Стратегия Unitree в области моделей остаётся гибкой. Несмотря на скептицизм по отношению к текущим решениям на базе VLA, компания активно экспериментирует с обучением ИИ на этой архитектуре. Однако Ван считает, что простое увеличение объёма данных для незрелых моделей — это тупиковый путь. По его мнению, грамотно спроектированная модель может демонстрировать высокие результаты даже с ограниченным количеством качественной информации. Более перспективным направлением компания считает видео-ориентированные модели. Ван отметил, что примерно в то же время, когда одна из крупных технологических компаний представила модель, обученную на видео, Unitree начала исследования в этой области. Суть подхода заключается в том, что модель генерирует видео, на котором робот выполняет задачу, например, убирает комнату. Затем это видео используется для обучения реального робота выполнять те же действия. Ван считает, что такой метод может превзойти VLA по скорости и эффективности, хотя и требует значительных вычислительных ресурсов из-за генерации видео высокого разрешения.
Будущее робототехники: распределённые вычисления и низкая задержка
Несмотря на высокие технические требования, Ван видит перспективы в этом направлении. Он предлагает создавать недорогие распределённые вычислительные кластеры, специально адаптированные для робототехники. «Если у вас есть 100 роботов на заводе, логично разместить внутри предприятия серверный кластер. Роботам всё равно требуется связь с минимальной задержкой», — пояснил он. Такой подход может стать ключом к масштабированию технологий и повышению их доступности.
Unitree: от шоу к практическому применению
Роботы Unitree часто ассоциируются с эффектными выступлениями, например, танцами на праздничных мероприятиях или демонстрациями на крупных конференциях по искусственному интеллекту. Из-за этого у некоторых складывается мнение, что продукция компании — это больше зрелище, чем функциональное решение. Однако Ван не согласен с такой оценкой. «На данном этапе внедрение роботов в бытовые или промышленные задачи остаётся сложной задачей. Демонстрации и表演 просто более достижимы на текущий момент», — объяснил он. При этом основатель подчеркнул, что команда, работающая над практическими применениями роботов, является самой крупной в компании. Почему же эти разработки пока не на виду? По словам Вана, создание функциональных роботов — это огромный вызов для моделей ИИ, и компания пока не достигла желаемого уровня.
Видение будущего: многофункциональные роботы и прорыв в отрасли
Ван мечтает о роботах, которые будут не просто выполнять узкоспециализированные задачи, такие как складывание белья или приготовление еды. Он видит их универсальными помощниками, способными, например, разливать чай на заводе, а затем выступать на сцене. Отвечая на вопрос о том, когда робототехника достигнет своего переломного момента, сравнимого с появлением революционных технологий в сфере ИИ, Ван дал прогноз: «Самый быстрый сценарий — 2-3 года, самый медленный — 3-5 лет. Но я уверен, что волна воплощённого интеллекта не затянется дольше десятилетия». Как может выглядеть этот момент? Ван описал сцену, где в большом зале свободно передвигаются гуманоидные роботы. Вы подходите к одному из них, даёте команду, и он безупречно выполняет задачу. Именно это, по его мнению, станет точкой перелома в развитии отрасли.
Этот материал подготовлен для публикации на сайте, чтобы рассказать о новых идеях и подходах в робототехнике, которые предлагает Unitree Robotics. Мы стремимся донести до читателей актуальную информацию о будущем технологий и вдохновить на размышления о том, как роботы могут изменить нашу жизнь в ближайшие годы.