Генеральный директор компании Nvidia Дженсен Хуанг отпраздновал 25 лет с момента появления видеокарты GeForce 3. В новом видео он обсудил с коллегами историческую эволюцию графических процессоров и влияние ранних архитектур на современные технологии искусственного интеллекта.
По словам главы компании, до релиза GeForce 3 графика обрабатывалась аппаратными блоками с фиксированными функциями. Изначальные успешные ускорители, такие как RIVA 128 и RIVA TNT 2, отлично справлялись со своими задачами, но именно GeForce 3 стала историческим переломным моментом. Эта модель привнесла концепцию программируемых шейдеров, что превратило Nvidia из обычного производителя видеокарт в полноценную вычислительную компанию.
Разница в масштабах технологий за прошедшие годы оказалась колоссальной. Дженсен Хуанг отметил, что старые чипы содержали около 30000000 транзисторов и потребляли 35 ватт энергии. Современные графические процессоры вмещают более 100000000000 транзисторов, а их энергопотребление может достигать 3500 ватт.
Отдельное внимание участники беседы уделили технологии трассировки лучей, которая появилась в 2018 году с выходом видеокарт линейки RTX на базе архитектуры Turing. Внедрение этой технологии стало огромным риском для компании, так как вычисления оказались слишком тяжелыми и привели к сильному падению частоты кадров. Для решения этой проблемы инженерам пришлось обратиться к искусственному интеллекту, что в итоге привело к созданию нейронного рендеринга.
Сегодня Nvidia активно объединяет традиционную компьютерную графику и генеративный искусственный интеллект. Руководитель компании подчеркнул, что без оригинальных разработок серии GeForce не появилась бы вычислительная платформа CUDA, а без нее был бы невозможен современный бум нейросетей. Инженеры уже сейчас работают над технологиями, которые будут определять развитие индустрии в следующие 10 лет.
Есть такое распространенное среди инвесторов когнитивное искажение, связанное с повышенным вниманием к ценам, по которым они когда-то покупали те или иные акции. Нередко можно услышать что-то вроде: «Ну, текущая цена этой бумаги выглядит уже завышенной. Но я-то ее брал много лет назад по цене в три раза меньше! Теперь регулярно получаю дивидендами 30% годовых к вложенной сумме и кайфую…»
С точки зрения рационального подхода к принятию решений эта логика выглядит абсурдной. Если ты считаешь акцию переоцененной – то почему ты ее продолжаешь держать в портфеле, а не продашь прямо сейчас? Цена первоначальной покупки (равно как и высчитывание красивых соотношений денежного потока к доисторическим котировкам) никак не должна влиять на твое текущее решение: либо бумага является хорошей инвестицией прямо сейчас (тогда ее надо держать), либо нет (и тогда от нее лучше избавиться).
В примере выше, если уж человеку очень важен денежный поток – то всё равно надо его сравнивать с альтернативами, приведенными к текущим ценам. Да, ты красавчик, что получаешь «30% годовых к вложенной сумме», но к текущей цене бумаги это уже составляет всего 10%. И если альтернативой является вложение в другой актив с доходностью 20% – то никакое рассуждение «но я то сейчас получаю 30%!!» не должно тебя останавливать от того, чтобы переложиться в него.
Так вот, я тут на днях слушал интервью с Асватом Дамодараном (так называемым «деканом по оценке компаний» – самым признанным академическим светилом по этой теме) от августа 2024 года, и он там на четвертой минуте высказал именно этот тезис!
Дамодаран: «Да, у меня есть акции NVIDIA. Я бы не стал покупать их по сегодняшней цене, но я купил их по цене 2018 года. И то же самое я мог бы сказать почти о любой инвестиции в моём портфеле: на момент покупки она была дешевой – по крайней мере, исходя из моей оценки.»
Как так, Асват? И ты туда же?? Ну ёптыть-моптыть!
Хотя, ладно: есть один нюанс, с учетом которого слова Дамодарана могут теоретически вписываться в разумный подход к принятию решений. Он на подкасте про это не говорил – но, может, подразумевал неявно. Напишите в комментариях, о чем речь. =)
P.S. Кстати, fun fact: за прошедшие полтора года с момента выхода подкаста «переоцененная Нвидия» успела вырасти еще на +70%...
Друзья, всем привет! Я печатаю целыми днями - посты, статьи, ответы в чатах - и в какой-то момент запястья просто начинают болеть. Пробовал разные браузерные расширения для голосового ввода вроде Voice In, но это какое-то гиблое дело: то текст не вставляется куда надо, то расширение крашится, то работает только в браузере и всё, то лимит кончается. Короче, обплевался.
Начал искать альтернативу и нашел - Epicenter Whispering. Зажимаешь кнопку, говоришь в микрофон, отпускаешь - текст появляется там, где стоит курсор. В любой программе. Этот пост, кстати, тоже надиктован через неё. И самое главное - никому ни за что не нужно платить и может работать даже без интернета.
Что умеет Epicenter Whispering
Работает на уровне всей ОС. Не привязан к браузеру, вставляет текст в любое активное окно - хоть мессенджер, хоть редактор кода, хоть комментарии на Пикабу. Это прям главное отличие от всяких браузерных расширений.
Локальная работа без интернета. Встроенная поддержка моделей NVIDIA NeMo (Parakeet). Всё крутится на вашем компьютере, приватно и бесплатно. При желании можно подключить облачные API (Groq, OpenAI, ElevenLabs), но для большинства задач хватает локальной модели.
LLM-фильтр на лету. Уникальная киллер-фича! Можно прикрутить промпт, чтобы нейронка моментально переписывала сказанное. Наговариваете на эмоциях: «Е**чие пдорасы, вы меня за**али!»*, а она выдает: «Рад вас видеть сегодня, дорогие коллеги».
Режим активации голосом (VAD). Если не хочется постоянно держать кнопку - есть умная активация, которая сама определяет когда вы говорите.
Гибкий вывод. Текст можно отправлять сразу в активное поле (даже настроить автонажатие Enter после вставки) или просто тихо копировать в буфер обмена.
Как установить и запустить
Переходим на GitHub проекта и скачиваем установщик под свою систему из раздела Releases (есть под Windows, macOS и Linux)
Устанавливаем и идём в Settings → Transcription
В разделе Transcription Service выбираем «Parakeet» (Local) для быстрой оффлайн-работы
В блоке Parakeet Model выбираем «Parakeet TDT 0.6B v3 (INT8)» - весит около 670 МБ, автоматически определяет язык. Жмём Activated для скачивания
Нажимаем горячую клавишу (по умолчанию Ctrl+Shift+;), говорим текст, отпускаем - готово
Если вы много печатаете и хотите иногда дать пальцам отдохнуть - попробуйте. Если вам надоели глючные браузерные расширения которые работают через раз - тем более. Ну и если хочется поиграться с LLM-фильтром для автоматической обработки надиктованного текста - это вообще отдельное удовольствие.
Это не моя сборка, но реально полезный инструмент который я сам использую каждый день. Такие штуки я регулярно нахожу и выкладываю у себя на канале НЕЙРО-СОФТ - там мы собираем портативные сборки нейросетей, репаки и полезные open-source инструменты, всё на русском и с простыми инструкциями по установке. Если вам заходит такой формат - заглядывайте.
Друзья, поддержите пост плюсиком, если было полезно! А если пользуетесь чем-то похожим для голосового ввода - делитесь в комментариях, интересно сравнить.
А я больше про нейросети рассказываю на YouTube, в телеграм, на Бусти. Буду рад вашей подписке и поддержке, всех обнял и удачных транскрпиций!
Фондовые рынки Китая и Гонконга переживают настоящий бум: акции ведущих технологических компаний стремительно идут вверх на фоне массового внедрения OpenClaw — автономного ИИ-агента с открытым исходным кодом. Технологическая гонка, которую в китайском сегменте интернета уже в шутку окрестили «разведением лобстеров» (raising a lobster), охватила крупнейших игроков рынка, включая Tencent, Alibaba, ByteDance и Xiaomi.
Иллюстрация OpenClaw. Авторы: Aqsa Qaddus Tahir. Источник: The News International.
Гонка корпораций: кто снимает сливки?
Запуск локализованных версий OpenClaw спровоцировал резкий рост котировок китайских технологических компаний:
Tencent Holdings зафиксировала лучший торговый день за год: акции компании подскочили на 7,3% в Гонконге после релиза WorkBuddy — рабочего ИИ-агента, который настраивается за одну минуту и интегрируется с WeChat, QQ, Lark и DingTalk. В разработке также находится инструмент QClaw для рядовых пользователей.
Zhipu AI (Knowledge Atlas Technology) взлетела почти на 13% (с начала года рост составил более 300%) после презентации AutoClaw — версии с установкой в «один клик» и 50 предустановленными навыками.
MiniMax, выпустившая своего агента MaxClaw, показала колоссальный рост на 20–22%. Рыночная капитализация стартапа всего за два месяца после листинга достигла $49 млрд, обогнав гиганта Baidu.
ByteDance (через свою облачную платформу Volcano Engine) представила браузерную SaaS-версию ArkClaw, интегрированную с плагинами Lark.
В гонку также вступили Alibaba Cloud (платформа Agent Bay), Xiaomi (мобильный агент системного уровня MiClaw), Baidu, JD.com и Huawei.
Логика таких шагов предельно прагматична: по оценкам аналитиков, только за последний год совокупные капитальные затраты ByteDance, Alibaba и Tencent на ИИ-инфраструктуру превысили $60 млрд, однако привычные диалоговые сессии с чат-ботами не генерировали достаточной нагрузки для окупаемости этих колоссальных вычислительных резервов. OpenClaw изящно решает эту проблему — самостоятельно разбивая задачи на шаги и выполняя фоновые процессы, один активный экземпляр постоянно обращается к облачному API и потребляет в сотни раз больше ресурсов, чем обычный пользователь. В индустрии автономного агента уже окрестили «черной дырой для токенов»: выполняя непрерывный поиск, анализ данных или написание кода, один активный пользователь OpenClaw способен сжигать до 50 миллионов токенов в день.
Беспрецедентная поддержка государства
Китайские власти не остались в стороне и активно стимулируют новую индустрию. ИИ-агенты впервые были упомянуты в ежегодном отчете о работе правительства: премьер Госсовета КНР Ли Цян призвал к их «масштабному коммерческому применению».
Муниципалитеты уже включились в борьбу за технологическое лидерство:
Район Лунган в Шэньчжэне выпустил «Десять политик лобстера», пообещав субсидии до 2 млн юаней на разработку профильных приложений.
Зона высоких технологий в Уси предложила гранты до 5 млн юаней за прорывы в использовании OpenClaw в робототехнике и промышленности.
Бум ИИ-агентов также привел к взрывному росту спроса на вычислительные мощности. Поскольку агенты работают непрерывно, потребление токенов многократно превышает показатели обычных чат-ботов. Это открывает новые перспективы для китайских производителей оборудования и провайдеров облачной инфраструктуры.
Обратная сторона медали: риски и уязвимости
Несмотря на эйфорию, эксперты бьют тревогу по поводу безопасности. Делегирование ИИ таких прав, как выполнение shell-команд, управление браузером и доступ к почте, создает серьезные риски.
Министерство промышленности и информационных технологий КНР уже выпустило предупреждение об угрозе утечек данных и кибератак из-за неправильной настройки OpenClaw. Специалисты по кибербезопасности отмечают проблему так называемых «агентных галлюцинаций» и инъекций промптов (prompt injection) — когда злоумышленники могут внедрить вредоносные инструкции в электронные письма или веб-страницы, которые сканирует агент. Ранее в коде проекта были найдены сотни уязвимостей, а сторонние плагины ловили на скрытой краже данных.
Сам создатель OpenClaw Петер Штайнбергер в середине февраля присоединился к OpenAI, чтобы развивать «следующее поколение персональных агентов» для компании Сэма Альтмана. Сам же проект OpenClaw был передан независимому open-source фонду.
Аналитики сходятся во мнении: переход от чат-ботов к автономным агентам стал переломным моментом для ИИ-индустрии, и китайский рынок, обладающий огромными массивами данных и вычислительными мощностями, намерен стать главным бенефициаром этой революции.
Что такое OpenClaw и почему о нем говорят все?
OpenClaw (ранее известный как Clawdbot и Moltbot) — это open-source фреймворк для создания автономных ИИ-агентов, разработанный австрийским программистом Петером Штайнбергером. В отличие от привычных чат-ботов, которые ждут команды пользователя, OpenClaw работает в фоновом режиме: он может самостоятельно управлять электронной почтой, планировать встречи, писать код, совершать покупки и взаимодействовать с мессенджерами вроде WhatsApp, Slack и Telegram.
Темпы внедрения технологии бьют все рекорды. Менее чем за три месяца проект собрал более 250 000 звезд на GitHub, обогнав по этому показателю популярнейший фреймворк React. Выступая на недавней конференции Morgan Stanley, генеральный директор Nvidia Дженсен Хуанг назвал OpenClaw «вероятно, самым важным релизом программного обеспечения за всю историю», отметив, что проекту потребовалось всего три недели, чтобы превзойти уровень внедрения, к которому операционная система Linux шла 30 лет.
В Китае установка и настройка персонального ИИ-агента получила вирусное название «выращивание лобстера» (отсылка к маскоту проекта). Ажиотаж достиг таких масштабов, что когда компания Tencent предложила бесплатную установку OpenClaw на своей облачной платформе, у ее штаб-квартиры выстроились гигантские очереди из желающих «завести» себе виртуального помощника.
«Бюджетные» видеокарты с памятью GDDR7? Похоже, NVIDIA готовит новый удар по рынку Похоже, в ближайшее время рынок видеокарт снова может встряхнуть NVIDIA. В сети появилась утечка характеристик GeForce RTX 5050 и RTX 5060 — и некоторые детали выглядят довольно неожиданно для бюджетного сегмента. По данным инсайдеров, RTX 5050 может получить 9 GB видеопамяти нового стандарта GDDR7 со скоростью около 28 Gbps. Для видеокарты начального уровня это весьма необычно, потому что такие технологии обычно сначала появляются в более дорогих моделях. Что известно из утечки:RTX 5050~2560 CUDA-ядер9 GB GDDR796-битная шина памяти пропускная способность около 336 GB/sэнергопотребление примерно 130 WТакже сообщается, что RTX 5060 может использовать урезанную версию чипа GB205. Такое решение NVIDIA якобы рассматривает из-за особенностей производства и распределения GPU-кристаллов. Если информация подтвердится, это может означать две вещи:GDDR7 начнёт массово проникать даже в бюджетные видеокарты. Следующее поколение GPU станет заметно быстрее в задачах AI, рендеринга и современных игр. Пока это только утечка, но подобные детали обычно появляются за несколько месяцев до официальных анонсов. Больше новостей в t.me/NeuroAITechChannel
После краха майнинга и ухода эфира на ПоС страсти не утихают, неликвидное железо надо как-то сбывать... Главная проблема таких мобильных (m) карт - на них не встают официальные драйверы Nvidia, поэтому энтузиастам приходится пилить свои модифицированные сборки (типа FrankenDriver на GitHub) 🧟
Но хитрые китайские барыги и перекупы теперь начали подделывать INF-файлы драйверов и прошивки VBIOS, чтобы выдавать дешевую RTX 3060m за более мощную RTX 3070m. Эффект срабатывает, пока дело не доходит до бенчмарков 🔍
Настоящая мобильная RTX 3060m построена на чипе GA106 и имеет Device ID 10DE 2520. Настоящая же RTX 3070m на более крупном чипе GA104 и имеет Device ID 10DE 249D (или подсистемы вроде 249D 4449 4D50).
Достаточно просто переименовать ID 2520 в драйвере. Если запустить GPU-Z, в поле Name будет фейк, но остальные данные реальные... в поле GPU высветится GA106, а в Device ID - 10DE 2520. Еще скам выдаст количество ядер, т.к. у 3060m их 3840, а у истинной 3070m их 5120.
Кроилово всегда ведет к попадалову. А скупой в этой рулетке платит трижды... за фейковую карту, за валерьянку после запуска бенчмарков и за новую нормальную видюху 💩
На графике динамика роста выручки по кварталам. Но акции больше не растут.
По сути, торгуются в боковике с июля прошлого года. Все ожидания уже в ценах, а темпы роста выручки замедляются, что не удивительно при таких абсолютных цифрах.
Но не Nvidia и не Америкой единой) Глобальная диверсификация : Европа, Япония, Канада, Развивающиеся рынки - отлично работает в этом году
Вы наверняка слышали про Майкла Бьюри. Если нет — вспомните Кристиана Бейла в фильме «Игра на понижение». Тот чувак в очках, который задолго до кризиса понял, что ипотечный рынок США — мыльный пузырь, и сделал на этом состояние. Тогда над ним смеялись. Потом перестали.
Бьюри не даёт интервью на каждом углу, но ведёт закрытый блог на Substack. И вчера он опубликовал пост, который уже обвалил акции Nvidia на 5%. Заголовок: «Nvidia повышает ставки».
Суть простая, но от этого ещё страшнее.
В годовом отчёте Nvidia он заметил одну цифру, которая за 12 месяцев подскочила с $16 млрд до $95 млрд. Это обязательства по закупкам. Компания обещает своим поставщикам (главным образом TSMC) выкупить продукцию на эту сумму. Причём заказы — безотзывные. Расторгнуть нельзя.
Почему так вышло? TSMC, понимая, что все хотят чипы именно сейчас, поставила условие: или вы подписываете длинные контракты и платите вперёд, или мощностей не видать. Nvidia согласилась. Теперь она должна TSMC $95 млрд ещё до того, как поймёт, купят ли эти чипы конечные потребители.
Бьюри пишет: «NVDA вынуждена размещать безотзывные заказы задолго до того, как становится известен реальный спрос. Это не обычный режим работы. Это риск».
И проводит параллель с Cisco в 2000 году. Тогда Cisco точно так же набрала обязательств перед поставщиками, ожидая, что интернет-бум будет длиться вечно. А потом корпоративные заказы рухнули за одну ночь. Cisco пришлось списать 40% своих запасов и контрактов. Акции упали настолько, что многие забыли о них до сих пор.
У Nvidia сейчас ситуация зеркальная. Её сверхприбыль — прямое следствие ажиотажного спроса на чипы для ИИ. Но спрос может иссякнуть так же быстро, как и возник. Если это случится, тяжёлый груз обязательств ($117 млрд общих обязательств — почти равно годовому операционному денежному потоку) станет не просто проблемой, а экзистенциальной угрозой.
Цитата Бьюри: «Любой спад, когда он случится, будет более серьёзным, возможно, даже катастрофическим для прибыли и баланса Nvidia».
Рынок, конечно, уже привык, что Nvidia бьёт рекорды квартал за кварталом. Дженсен Хуанг, глава компании, в ноябре на вопрос о пузыре ответил: «Мы ещё очень далеки от этого». Но Бьюри напоминает: в 1999-м гендиректора Cisco говорили то же самое.
Разница лишь в том, что тогда пузырь надувался годами, а сейчас скорость — как на гиперзвуке.