Как перестать бояться нейросети, и начать их повседневно использовать
Классическое программирование - это написание точных инструкций компьютеру -- что и когда делать. Но издавна была ещё другая идея -- "машинное обучение".
Вот например есть какая-то задача, есть огромный набор входных данных для неё, есть примеры правильных решений этой задачи для этих входных данных. Например, есть задача "научить терминатора искать себе мотоцикл", есть набор из миллиона фотографий, и миллион трудолюбивых миньонов тщательно вручную разметили, на каких фотках и где именно изображен мотоцикл. (Кстати, этими миньонами были и все мы, когда сайты вдруг заставляли нас "отметь на фото квадраты, в которых мотоциклы, иначе не пропущу дальше").
Сначала приходят математики, и подбирают функции-преобразователи, наиболее подходящие под задачу. Это скучные математические формулы, на входе цифры, в самой функции некие "коэффициенты", на выходе какие-то другие цифры.
Программисты решают, как именно преобразовать входные данные, чтобы скормить этим функциям, ведь функции не знают что такое "фотография", им нужно скормить что-то такое числовое, поэтому входные данные преобразуются в цифровую кашу, в некие единицы информации, они называются "токены".
Затем программисты создают заготовку нейросети, в виде кружева таких функций, но это ещё не обученная нейросеть, кружево пока что стандартное, все коэффициенты функций расставлены "от балды".
И начинается процесс жёсткого машинного обучения нейросетки.
Ей показывают входные данные (фотки), эти данные преобразуются в токены, токены протекают по кружеву функций, в итоге получаются выходные данные (ответ, где же именно на фотке мотоциклы), эти данные сверяются с правильным ответом, и если ответ нейросети неверный, ей даётся болезненный удар током и она судорожно начинает подкручивать коэффициенты своих функций так, чтобы ответы всё ближе и ближе были похожи на правильные.
Очень долгий процесс, очень затратный.
Зато, в случае когда нейросеть удалось обучить отвечать правильно на нашем наборе фоток, случается чудо -- эта нейросеть начинает уметь безошибочно находить любой мотоцикл на любом, абсолютно любом другом фото, на любом кадре с видеокамеры! Заметьте - она не хранит в себе миллион исходных фоток, она вообще даже не знает что такое "мотоцикл", более того -- она вообще не знает что такое "изображение", она просто хранит кружево настроенных функций, то есть набор каких-то коэффициентов, которые она подобрала при обучении. Этот набор не такой уж и большой, вполне вмещается в головной процессор Терминатора, ему заливают этот набор, и теперь он точно успешно найдёт себе мотоцикл.
Вот таким же макаром нейросети натаскивают на обработку разных задач и разных данных - изображений, музыки, видео, распознавания лиц и т.п., главное иметь огромный массив данных и правильные ответы, и понять, как эти данные преобразовать в токены и через какого рода функции эти токены прогонять.
Процесс натаскивания -- очень, очень затратный, нужны миллионы процессоров и гигаватты электроэнергии. Буйным цветом нейросети расцвели только недавно, когда появились такие технические возможности.
Зато в итоге, когда обучение успешно закончилось, получаем не такую уж и большую горстку коэффициентов, записываем их в айфон - и вот айфон уже умеет делать невероятные распознавания и обработку фотографий, причём сам, без обращения к интернету.
Вот одна из задач, называется LLM (большая языковая модель): собираем по открытым источникам как можно больше текстов, любых -- книги, письма, переписки в форумах, субтитры к фильмам, всё что угодно, любые примеры того, как людская раса изливает свои мысли в виде устного/письменного текста. И натаскиваем нейросеть на такую задачу -- научиться по началу текста предугадывать, как текст будет продолжен. И когда некоторые мировые компании нашли деньги на такую непростую задачу, и начали обучать нейросети на массиве текстов, то начали получаться интересные результаты - на полученных коэффициентах стало возможным запустить некий чат, который продолжал начатый разговор, и на первый взгляд вполне разумно. Любой диалог на любую тему!
Сначала чаты отвечали немного коряво, но по мере того как нейросеть дообучалась на всё больших и больших массивах данных, новые версии чатов стали отвечать на удивление гладко и умно! Это и правда впечатляет, но и немного огорчает -- значит, человечество на самом деле довольно скучное и предсказуемое, а вовсе не набор уникальных непредсказуемых личностей, как нам хотелось бы себя позиционировать.
Так всё же, нейросети разумные? Это и правда "искусственный интеллект", который выйдет из-под контроля и поработит мир?
Да вроде нет, нейросеть же не понимает смысла слов, более того, ей для обучения давали вовсе не слова, а выжимку из текста, в виде неких токенов. И она просто продолжает цепочку токенов.
Что на самом деле происходит, когда вы в ChatGPT вводите очередную свою реплику и нажимаете кнопку "отправить"?
Да ничего магического, просто весь ваш диалог, от самого начала и до конца (вместе с новой вашей репликой) заново летит на сервер ChatGPT, преобразуется в цепочку токенов, проходит через кружево настроенных (обученных) функций, примешивается некоторая доля случайности (чтобы ответы всегда были чуть разными), и в итоге получается прогноз -- как именно могла бы продолжиться эта цепочка токенов. Это продолжение преобразуется в слова и выводится вам как ответ.
То есть, ChatGPT имитирует продолжение диалога, не понимая сути диалога.
Сейчас нейронки бурно развиваются, LLM-чаты снабжают помощниками (агентами), которые позволяют уточнять и расширять ответы, например ходить в Интернет и уточнять/сверять ответ по свежим данным.
Также к текстовым моделям прикрутили другие модели, обученные на изображениях, музыке и т.п., и теперь LLM-чаты умеют продолжать чаты, в которых не только текст, но и картинки, и звуки, и много разнообразных данных. Для нейросетки это всё-равно лишь токены, она не понимает что изображено на картинке, она имитирует, из каких токенов бы состояла картинка в продолжении этого диалога, и показывает вам (вам конечно же выводится картинка не в виде токенов, а преобразованная в картинку). Потом вы пишете LLM-чату текстом просьбу "сделай на фотке волосы темнее", нейрочат прогоняет диалог заново, имитирует продолжение, но так как для создания продолжения ему нужно как-то учесть вашу просьбу, подключается другая модель, натренированная на изображениях, чат передаёт этой модели новый вариант задачи по созданию изображения (собрав параметры изображения по всему текстовому чату, с учетом последних правок и пожеланий), получает от неё ответ в виде токенов нового изображения, и интегрирует этот ответ в свой ответ. Вот такая командная работа разных моделей над одним вашим чатом.
Ну что, перестали бояться нейрочатов?
Давайте начнём их использовать в повседневных задачах.
Вот небольшая шпаргалка.
1. Сначала всегда проверяйте, какая выбрана модель -- где-то на странице чатика будет выпадайка со списком моделей. И ещё будет выпадайка всяких дополнительных параметров. Есть смысл выбрать самую свежую и мощную модель из доступных бесплатных, с опцией "глубокого размышления или думания" (мы уже выяснили, что думать нейронка не умеет, но будет перед каждым ответом мусолить ответ сама с собой, это повышает качество ответа). Ну и опцию "ходи в интернет для проверки актуальности информации" иногда полезно включать, чтобы сделанные нейрочатом выводы он сам же перепроверял по свежим источникам.
2. Держите в чистоте историю чата, именно вся эта история заново скармливается нейросети при каждом вашем следующем вопросе. Не давайте истории разрастаться слишком сильно -- в какой-то момент она превысит допустимый размер, и нейрочат вынужден будет читать не всю историю, а только выжимку из неё, что сильно снизит качество ответов. Например, если в процессе диалога задали какой-то уточняющий вопрос, получили ответ и этот вопрос/ответ не важен для всего диалога, просто сотрите этот вопрос/ответ, очистив историю чата от этого "мусора".
3. Начинайте диалог с чатом с правильной вводной части. В каком русле вы начинаете диалог, в таком русле нейрочат и будет имитировать продолжение диалога. Если начнёте очень кратко и сухо - продолжение будет "типовое-никакое", приторно-заискивающее. А если вы начнёте тепло и подробно, то эта теплота и подробность потом будет во всём чате. Вот способ сразу задать нужный окрас диалогу: нужно заявить подробно роли. Например "Привет, ты - опытный преподаватель физики, объясняешь уроки очень понятно и доходчиво. Я - ученик 5 класса, и мы сегодня на уроке изучаем синхрофазотрон. Я не очень понимаю как он работает, объясни пожалуйста понятнее." И всё - вместо сухого научного объяснения вы получите тёплое человеческое, и весь диалог пойдёт в нужном русле. Более того, можно заявить сразу десяток разнохарактерных ролей (по именам), и когда пишете новую реплику, указывать от чьего имени эта реплика и кому эта реплика адресована - получается забавная групповая беседа.
4. Как бы красиво и складно ни отвечал вам нейрочат, не забывайте - он не понимает что говорит, просто умело имитирует продолжение диалога. Иногда он не моргнув глазом уверенно задвигает вещи, не соответствующие реальности (галлюцинирует). Важные вещи нужно перепроверять. Если чат деградировал и пошёл в какую-то странную сторону, отмотайте чат немного назад и продолжите с нужного места заново, заложив в ваши вопросы наводку в правильную сторону.
В каких повседневных задачах нейронки нам могут помочь? Как их использовать?
* Как личного помощника, которые всегда под рукой (на Андроид-смартфонах вообще можно настроить, чтобы при долгом нажатии кнопки питания выскакивал Gemini и слушал голосовой приказ, ну прямо как "трое из ларца").
Эти помощники -- наикрутейшие всезнайки, их не смутит никакой вопрос, всегда уверенно ответят (ну или нагаллюцинируют, но как красиво!). Могут собирать данные из интернета, если дать такое задание, и не забыть включить опцию "поиск в сети".
Раньше о таких личных секретарях люди только мечтали, таких секретарей себе могли позволить только богачи, и вот теперь они есть у каждого из нас.
Пробуйте, задавайте любые вопросы, "что приготовить из подвядшей морковки, вялого пучка петрушки и полбанки иваси", "как проехать из Нижних Маклауш в Верхние, но чтобы не сильно трясло по дороге" и т.д.
* Как эксперта в областях, в которых вы не очень сильны. Например, можно кинуть в чат фото многостраничного Договора, который вас прессуют "быстрее подписать", и попросить нейронку проверить, нет ли каких-то сомнительных мест и опасных для вас условий. Да, нейронка может ошибиться и нагаллюцинировать -- но в любом случае, её помощь лучше, чем подписать Договор не глядя.
Никогда, никогда не забывайте про галлюцинации нейронок, например у них можно конечно спросить расшифровку медицинских диагнозов и анализов, но это ваше здоровье, перепроверьте несколько раз, проконсультируйтесь у врачей (у тех, которые берут знания из своего опыта, а не из тех же нейронок).
* Как психолога, службу поддержки. Выслушает, ответит, и это будет не "попытка диалога с бездушной железкой", современные нейронки ответят так, как ответил бы живой компетентный человек, у неё при обучении было достаточно примеров, и простых людей, и именитых профессоров. Представьте, что нейронка - это своеобразный мессенджер, в котором можно задавать вопросы всему человечеству сразу, и ответ будет от "усреднённого человечества". Пожалуй, разумнее всего будет сначала самому принимать какие-то жизненные решения, и потом обсуждать их с нейронкой как с близким другом -- тогда нейронка поможет выявить детали и тонкости, которых вы не заметили.
* Для обучения. Учить языки, новые предметы, подтягивать знания, просить нейронку погонять вас по нужной теме и проверить ответы -- это нереально круто, у вас всегда под рукой друг-учитель, знающий все предметы мира и готовый терпеливо вам помогать!
Отдельно хочу обратиться к школьникам и студентам -- не нужно тупо использовать нейронку для решения домашек и написания курсовых "за вас". Уж лучше это время потратить на беседу с нейронкой как с другом-отличником, который помогает вам сделать домашку. Прямо так и напишите в чате "Ты - мой друг-отличник, мы учимся в 5 классе, нам задали на дом задачу (приложу фотку). Друган, помоги разобраться самому в ней. Вот я так думаю: ...". И можно писать любые мысли и догадки, никто не посмеётся над ними. Нынешнее время -- золотое время для самообучения, никогда ещё это не было так легко и быстро.
* Для творчества. Источник идей, вдохновения. Мощнейший инструмент. Он не творит за вас, он помогает вам творить. И может выступить критиком ваших творений, беспощадным (если попросите) и потому очень полезным.
Ну а теперь конкретные примеры нейронок.
Семейство Gemini от Google. Отвечает всегда по делу, галлюцинирует редко. Можно бесплатно использовать текстовый чат и генерацию картинок. Картинки кстати рисует офигенно, и правки в картинки легко вносить -- прямо в чате, текстом.
На главной странице https://gemini.google.com можно выбрать в правой выпадайке модель ("Thinking" - это размышляющая, "Pro" - самая крутая но можно упереться в лимит бесплатных токенов). Левыми кнопками можно добавить в чат файлы (картинки, диаграммы, фотографии текстов, скриншоты), и выбрать особый режим, например генерацию картинок. Если что-то непонятно в интерфейсе -- просто спросите об этом сам Gemini, он подробно объяснит и поможет.
Есть ещё лабораторная версия Gemini, по адресу https://aistudio.google.com
Там немного неудобный интерфейс, но зато могут давать гораздо больше лимита токенов, а также есть всякие настройки нейросетки для экспериментов.
А вот ChatGPT -- https://chatgpt.com, примерно то же самое, ну разве что галлюцинирует, по ощущениям, чаще. И в лимит бесплатных токенов упираешься быстрее.
А вот Grok от Илона Маска -- https://grok.com/, очень своеобразный помощник, как будто всегда под веществами, но зато генерит ворох интересных идей, даже когда его не просят -- какие-то наркоманские картинки (да ещё и оживляет их), постоянно отвлекается на какие-то свои видения, но для творчества это самое то.
Вообще, учитывая как быстро развиваются нейрочаты, как быстро к ним прикручивают новые функции, я любую задачу пробовал бы делать сначала в них. Если они не умеют -- то так и скажут, и посоветуют где это сделать, в какой специализированной нейронке.
Например, музыку нейрочаты пока не умеют делать, но направят в сервис Suno.
О, кстати, это очень эффективный лайфхак: спрашивать у Gemini помощи в работе с другой нейросетью. Например, показать Gemini текст песни, описать своими словами, в каком стиле хотите сделать песню, попросить Gemini сделать ревизию текста песни (где нужно ударения расставить и "е" на "ё" заменить, а то Suno часто ударения путает). И вставить в Suno готовый размеченный текст, готовое описание стилей. Ляпота.
Позже я планирую выложить серию постов с подробным рассказом, как используя нейросети создать себе бесплатный сайт, даже не имея навыков программирования.
Ответ на пост «КАК Я ПЕРЕСТАЛ БЫТЬ СЕКРЕТАРШЕЙ У СОБСТВЕННОГО МОЗГА»1
Хех. Забавно как быстро сбывается моё пророчество про когнитивные протезы.
Поздравляю, вы не сокращаете свой интеллект из-за клавиатуры, вы даёте возможность себе думать самостоятельно. Но перейдя на речь, на эти вот "э-э-э", "красные штуки" и прочее вы применяете очередной когнитивный протез для мозга.
Это не плохо, это наше будущее. Мы давно заменили память книгами и записными книжками, чувство времени часами, будильниками и календарями, навыки социального взаимодействия мы заменили полусинтетическими связями в соц-сетях, где больше обезличенных контактов, чем личных.
Это не плохо, это наш путь цивилизации. Возможности человечества в целом и каждого отдельного человека в частности непрерывно растут. Мы распоряжаемся таким количеством ресурсов, которые никогда не снились нашим предкам. Мы имеем доступ к бОльшему количеству информации, мы имеем возможность получить любую желаемую профессию. Появившиеся недавно генеративные модели еще сильнее снижают порог вхождения в любую область. Каждому отдельному человеку сейчас всё даётся куда проще чем нашим предкам: от стирки и готовки до путешествий и учебы. Медицина, строительство, транспорт...
Цивилизация создаёт комфортный питательный бульон своим особям, а особи приспосабливаются к нему. Но какой ценой?
Если здоровый человек сядет в инвалидную коляску и перестанет двигаться, то он начнёт жиреть, мышцы будут атрофироваться. Это злоупотребление "протезом" опорно двигательного аппарата. Однако автомобили вместо лошадей, и ещё ранее вместо собственных ног - это тоже своего рода "протез", но он уже дал нам новые бОльшие возможности.
И не все такие "протезы" очевидны на первый взгляд. Человечество прошло в своём становлении много таких этапов, когда был освоен огонь, животноводство, сельское хозяйство, мануфактура, промышленность... Это тоже своего рода "протезы", которые позволили нам лучше питаться более легко усваиваемой пищей, лучше одеваться перенося более низкие температуры. Все эти ступеньки технического прогресса позволяли нам увеличивать численность популяции на планете.
Вот и сейчас ИИ для нас - это когнитивный протез. Как автомобиль упростил перемещение в пространстве, так и он упростит нам работу с информацией. Учеба станет проще, потому что легче искать и перерабатывать в удобоваримый формат огромные объёмы, накопленных человечеством знаний. Порог вхождения в любую специальную область знаний снизился, гораздо больше проектов в том или ином виде каждый из нас может начать и довести до некоторого рода MVP самостоятельно или в малой группе. Раньше чаще всего это было бы немыслимо.
Так какова же реальная цена? Цена простая и очень похожая на цену, которую человечество платит уже давно за все блага технического прогресса. Цена использования когнитивных протезов - это тоже своего рода "ожирение". Да, у нашего когнитивного аппарата тоже есть риск такой вот патологии.
Важно держать баланс при использовании благ цивилизации между "протезом" и инструментом.
Для тех, кто не мог ходить инвалидная коляска хоть и "протез", но по факту это инструмент, расширяющий возможности. Для тех, кто ходить мог, но уселся в коляску, это несет не благо, а деградацию. Не расширение, а сужение возможностей организма.
Нет, я не неолуддит. Я не призываю отказываться от ИИ, автомобилей и технического прогресса. Я не предлагаю лезть на деревья, чтобы наши мышцы вновь становились сильными. Нам просто нужно ставить более амбициозные цели при новых возможностях.
Чаще всего это так и происходит. Человечество постоянно достигает новых вершин в своём прогрессе. Постоянно кто-то что-то придумывает, организует, изобретает, разрабатывает. Постоянно кто-то куда-то летит, плывёт, ныряет... Появляются новые технологии, прогресс не стоит на месте, рождаются новые Эйнштейны, всегда есть кому выдать Нобелевскую премию.
Да, есть нюанс. Средний уровень интеллектуального "ожирения" на планете будет расти. Какие-то "мышцы" у нас (в среднем на масштабе всего человечества) атрофируются, но всегда есть люди, которые постоянно делают чуть больше, чем могли бы чуточку раньше по временной шкале развития нашей цивилизации. И это здорово. Это позволяет нам всем двигаться вперёд.
Так что ТС в оригинальной статье про ошибся в только одном: клавиатура ему не ограничивала IQ, но новый инструмент дал больше возможностей в плане производительности. И это здорово, что очень многие не сидят на месте "жирея" интеллектуально. Кто-то рендерит котиков в нанобанане, а раньше бездумно залипал бы в тикток вместо этого. Кто-то вайбкодит какую-то ерунду на выброс, но раньше он тоже как-нибудь иначе тешил бы свои дофаминовые рецепторы быстрыми информационными "углеводами".
Есть гипотеза, что человечество-таки не потонет в генеративном контенте, что контент этот отстоится и расслоится. Что-то осядет, что-то всплывёт, а в объёме нашей цивилизации будет расти сильная крепкая "рыба", которая когда-то выберется на сушу в космос и дальше.
Поэтому учитывая новые возможности и инструменты давайте использовать их не как протезы, а давайте ставить себе такие амбициозные цели и высокие планки, до которых бы у нас раньше не хватило ресурсов, способностей и времени.
Ответ на пост «Размышления по поводу ИИ»1
человечество как раз таки из-за страха уничтожает само себя, то и ИИ в конце концов уничтожит само себя вместе со своим создателем.
С чего это "из-за страха"? Человечество в своём коллективном разуме вообще бесстрашная амёба. От алчности все войны.
Можно провести мысленный эксперимент. Взять большую группу людей, поселить в одном доме (чисто для наглядности, а на самом деле это не обязательно), и поручить следующую работу: нужно коллаборативно отвечать в специальном чате добросовестно и конструктивно, то есть каждое входящее извне в чат сообщение должно обсуждаться, варианты ответов выносятся на голосование, топ вариантов перерабатывается всеобщим мозговым штурмом и синтезируется самый лучший ответ, который и публикуется в чате.
Очевидно, что такой "дом советов" в чате с лёгкостью пройдёт тест Тьюринга. Коллективный разум этого дома будет более эрудирован и умён, чем каждый из его составляющих. Отдельных участников такого коллективного разума можно заменять или удалять, и это не отразится сильно на работоспособность конструкта и на его качества (если людей в составе изначально достаточно много). У этого конструкта гораздо меньше предрасположенности к экзистенциальному кризису, ведь если распустить "дом советов", его составляющие займутся чем-то другим, да и в целом каждый из составляющих боится за свою жизнь, а за жизни окружающих (особенно мало знакомых) переживания не так остры. Откуда взяться экзистенциальному ужасу у такого конструкта?
Человечество похоже в своём групповом разуме на саванта-аутиста, который может думать о тысяче вечей одновременно, может делать много дел сразу, но ему трудно сосредоточиться на общении, на каких-то экзистенциальных проблемах, даже очень серьёзных. Нам - составляющим этого коллективного разума - понятно что человечество в целом очень талантливо, но кажется, что оно подвергается саморазрушению, плохим привычкам, отравлению своей среды обитания. Не исключено, что мы (по отдельности) ошибаемся в этом. Вот как говорил Джордж Карлин: планете похер, это нам жопа. Так и тут.
Может быть то же потепление для Человечества в целом не столько экзистенциальная сколько экономическая и политическая проблема. Какие-то прибрежные города затопит, какие-то экономические и аграрные зоны перестанут быть рентабельными, произойдёт передел влияния, власти, денег и территорий. Где-то появятся пустыни, где-то растает мерзлота, а где-то начнут плодоносить бананы, и будут собирать по два урожая вместо одного.
То же касается и войн. Для отдельных людей - "нейронов" и "мышечных волокон" Человечества - война синоним смерти, горя, потерь. Но достаточно большие отдельные конгломераты людей из войны умудряются получать прибыль, территории, влияние, какие-то другие преимущества... Для них смерть солдат, разрушенная жизнь местного населения - это что-то отдалённое, не цепляет. Как в том примере с "домом советов", но ещё в большей степени.
Представьте, что "домов советов" учредили много, а большинство их членов "работают" на два и больше "дома" одновременно. Так ли переживает клерк из "административного корпуса" за жизнь и здоровье отдельных бойцов "казармы"? Всех своих родственников он обеспечил тёплыми и безопасными местами в других более безопасных "домах" подальше от фронта.
Понятна аналогия? Но она про естественные интеллекты и их конгломераты.
Насколько все эти переживания и эмоции применимы будут к Искусственному - это большое и непростой вопрос.
Тут забавный парадокс. Как с мысленным экспериментом про кота Шрёдингера, так и с Китайской Комнатой, оба придуманы чтобы доказать абсурдность каких-то гипотез, а по факту они пошли своим гипотезам только на пользу.
Да, "китайская комната", как оказалось по факту развития больших генеративных языковых моделей, вполне себе работает, решает сложные когнитивные задачи, приносит пользу. Могут ли быть у этой "комнаты" эмоции, страх, ужас - это вопрос по большей части философский. Возможно это эмерджентные свойства больших сложных хаотических систем, и они сродни релятивистским эффектам, которые трудно укладываются в бытовое понимание мира, но порождают вполне ощутимые физические эффекты вроде отталкивания магнитов, сверхпроводимости и прочего.
UPD: Как всегда боюсь самое интересное опять развернётся в комментариях. Так и получается.
Ответ на пост «Самая редкая профессия и искусственный интеллект»1
Удивительно насколько люди парадоксально (недо)?оценивают всю "мощь и нищету" ИИ.
С одной стороны конструкту, который сейчас вставляют и в хвост и в гриву в каждой первой прикладной отрасли и задаче от силы (как считать) до полутора лет в обед. Человеческие джуны на таком сроке ещё в памперсы сикают.
С другой стороны трудно не поддаться очарованию таких, казалось бы, недюжинных когнитивных способностей от сравнительно небольшого и сравнительно простого куска серверного софта.
Человечество не в первый раз впадает в такую эйфорию от новой технологии. Когда машины научились считать быстрее и точнее людей, им (людям пока, конечно же) казалось, что вот оно, машины скоро захватят мир и свергнут человечество. До сих пор так считать могли только хомосапиенсы, а тут машина! сама! СЧИТАЕТ!
Потом таких волн было много. Сложные механические автоматы, вязальные и швейные машины, станки, часовые механизмы внушили Человечеству, что вот-вот роботы захватят мир. Эту волну с удовольствием и энтузиастом подхватили фантасты, а мы получили от них глубокие и интересные экзистенциальные рассуждения о законах робототехники, о том, чем биологические "машины" отличаются от технических...
Шли годы, а "проблемы" с роботами, для усмирения которых понадобилось бы как-то применять законы Азимова", всё не вставали ребром. Однако у Человечества время от времени возникали рецидивы ощущения, что ИИ (а может быть и сильный ИИ) уже близко.
Таков был период, когда начали появляться экспертные системы, а информационные технологии дошли до того, что появилась потребность и техническая возможность работать со знаниями в более-менее формализованной форме. Этот период, как я понимаю сейчас, был очередным ренессансом мысли о скором приходе и резком развитии Искусственного Интеллекта.
Но годы снова шли, компьютеры мощнели, о том, что нам всегда хватит 640кБ памяти вспоминали всё с большей издёвкой, а хайп на тему искусственного интеллекта по поводу каждого мало-мальски заметного технического прорыва был с каждым разом всё тише и скромнее. Вспоминается как в первый раз АйБиЭмовский суперкомпьютер обыграл Каспарова (тогдашнего чемпиона мира) в шахматы.
Я тогда был уже старшеклассником и сильно увлекался всем, что связано с компьютерами. И даже мне - едва освоившему в те годы Q-Basic и посматривающему на Pascal - было удивительно почему люди связывают эту сугубо узкую переборную, чуть ли не брутфорсную задачу с Интеллектом.
Потом, когда компьютер обыграл Ли Седоля в Го, искусственно интеллектуальный хайп уже слабо выглядывал из под уровня прочего техногенно-новостного шума, хотя, надо сказать, в этот раз уже было гораздо больше поводов как-то притянуть за уши разговоры об интеллекте. AlphaGo опирался уже в значительной степени на машинное обучение, а не на логику, комбинаторику и оптимизированные классические алгоритмы.
Это был 2016 год. Я уже 12 лет как после института работаю программистом. Все эти годы не сказать что ничего не происходило, но ярких каких-то событий, связанных с машинным обучением, в медийном поле не вспоминается. Ну то есть вот как мы на 4 (или каком там я не помню уже) курсе делали лабораторку с обучением небольшой нейросетки распознавать рукописные буквы, так ничего прям так уж сильно не менялось, чтоб аж до хайпа, до того, чтобы снова вспомнить Азимова с его законами. Фантасты, конечно, старались, там витало много интересных идей, но всё на уровне шума.
Да, я отлично помню, как появлялись зачатки механизмов распознавания голоса. Куда-то это потом делось, но я отчетливо помню как на кнопочных звонилках вполне можно было голосом выбрать из телефонной книжки контакт и позвонить не нажимая кнопок. Помню как купил на где-то развалах диск с подборкой софта для синтеза и распознавания речи. В частности там был и Dragon Dictation (или что-то в этом роде). Да, эта штука даже как-то поддерживала русский язык, но качеством распознавания разочаровывала, а корявый синтез резал уши даже на английском.
Думал ли я тогда, гадал ли, что спустя некоторое время у нас будет Алиса, так здорово говорящая и замечательно понимающая даже шепот? Я отчетливо помню как появился сервис Яндекса, способный по шаблону набуровить какой-то под пьяную лавочку похожий на нормальный текст, а по факту связный, но бессмысленный набор слов.
Если оглядываться в прошлое, то это уже был перегиб экспоненты развития технологии. С этого момента машинное обучение добивалось всё новых свершений. Болталки, изображающие трёп в чате, появились давно, но о прохождении ими теста Тьюринга говорили только в шутку, от неграмотности, или инфантильного энтузиазма.
И вот мы здесь. За какие-то пару лет у нас ценой каких-то чудовищных вычислительных затрат и усилий по подготовке датасетов были обучены первые по-настоящему большие модели (LLM). Они начали удивлять. Оказалось, что раздутый до неимоверных масштабов "Т9" способен оперировать с языковыми конструктами, а это, в свою очередь, оказалось похожим на рассуждения.
Наверно это не было сюрпризом абсолютно для всех, однако удивляться тут есть чему. Оказалось, что когнитивные задачи можно решать эдаким черным ящиком, обученным на эпических количествах текстов. Да, поначалу это было глючно и странно. Галлюцинации и неуправляемость удалось побеждать разными уловками от манипуляцией с обучающей выборкой до хитрых системных промптов и итерационной многослойной обработки (думание).
Надо ли говорить, что сейчас генеративные модели и всё вот это вот, что называют Искусственным Интеллектом не просто перегретый инвестициями мыльный пузырь, а вполне себе уже приносящая пользу в куче отраслей технология? Думаю не надо.
На наших глазах случился очередной технологический фазовый переход, который меняет ландшафт и прогнозируемое будущее нашей цивилизации.
Что дальше-то? А дальше огромный простор применения и развития новой технологии. Она даже новорождённая и сырая поражает небывалыми новыми доступными возможностями. Теперь, даже если предположить, что новых текстов для обучения человечеству взять уже не откуда, есть ещё необъятные просторы для развития.
Нейросети могут брать информацию для обучения напрямую из окружающего мира, как это всегда делали люди. Да, это будет требовать гигантских энергетических и материальных затрат на вычисления, а значит мы переработаем огромное количества песка в кремний для чипов. Посмотрите что творится с рынком видеокарт, памяти, и всего, что можно использовать для растущей новой индустрии. Но этот ящик Пандоры уже не закрыть.
Но не только экстенсивные пути есть для развития. Сейчас мы уже применяем графовые БД для поиска в пространстве понятий и смыслов. Может быть мы вспомним такой замечательный язык как Пролог, чтобы "протезировать" механизм обработки формальной логики для нейросетей. В конце концов генеративные модели в чатах и рассуждениях во всю используют написание скриптов для алгоритмических вычислений. В эту "игру" можно играть по всему фронту развития ИИ.
Если кому-то кажется, что мы "упёрлись" и начнётся стагнация, то готов спорить, что это не так.
Да... к сему это я всё. Мне тут напомнили в оригинальном посте про старый добрый Lisp, а он меня в голове лежит рядышком с ещё более недооценённым на мой взгляд языком для применения в контексте ИИ - Прологом.
Помяните моё слово, его ещё вспомнят не раз в контексте оптимизации логического вывода для LLM.
Ну а чтобы два раза не вставать, жахну тут футурологический прогноз на ближайшее будущее.
На дальнюю перспективу легко прогнозировать, всё равно никто не вспомнит и не припомнит, если ошибёшься. А вот на ближнюю...
Итак, побуду капитаном:
- Будет развиваться внеконтекстная память агентов. Всевозможные векторные БД - это только начало, уже есть графовые БД, которые хранят не просто куски текста, но целые взаимосвязи понятий. До сих пор мы в основном имели "знания", спрятанные в черном ящике весов и связей нейронной сети. Это, вроде бы, тот самый путь, которым пользуются люди в своей голове, но давайте вспомним самолёты. Они хоть чем-то и похожи на птиц, однако крыльями они не машут, зато летают очень быстро и таскают много груза. Также и здесь. Мы будем оставлять за "черным ящиком" нейросети базовые "мыслительные" функции, а информацию будем вытаскивать в формализованные структуры специализированных баз данных.
- Развитие когнитивных ассистентов. Мы уже начали и продолжим учить наших ассистентов держать в формализованном векторном контексте (см предыдущий пункт) кучу совершенно разной информации о личной (цифровой и не только) жизни. Наши ассистенты будут "знать" всё о нашем творчестве, об интересах, о вкусах, о закладках в браузере, о планах на лето или выходные, об анализах из поликлиники, о покупках, о наших автомобилях начиная от расходников до поломок и ТО, о наших бытовых вопросах от содержимого холодильника до коммунальных платежей... Многие настолько будут доверять своим ИИ-ассистентам, что будут хранить в их контексте все свои личные переписки. Это неизбежно приведёт к когнитивной аугументации, когда наши ИИ-ассистенты станут своеобразной частью нашего "Я", а мы будем на них сваливать всю когнитивную рутину, которую раньше делали самостоятельно своей биологической нейросетью. И среди этого будет много парадоксальных моментов: порой мы будем склонны отдавать нейросети даже "рутину" общения с родными и знакомыми, внешние "когнитивные протезы" в лице ИИ-ассистентов будут назначать встречи, обсуждать организационные вопросы, вежливо поддерживать так называемые "small talks". Зато наша биологическая нейросеть будет, зачастую, с упоением зависать в, казалось бы, рутинных, но таких дофаминовых гриндилках, как современные казуальные компьютерные игры.
Если кому ещё интересны прогнозы на ближайшее будущее, то пинайте, а то мне кажется я тут в своём графоманском угаре генерю своей биологической языковой моделью обременительно много букофф.
Ответ user8037654 в «ИИ - все?»2
Нет никакого ИИ
Да что вы прицепились к термину? "ИИ", не "ИИ". Никто тольком не понимает что такое естественный интеллект, но вот что не является искусственным - это каждый первый диванный эксперт скажет: ВСЁ.
Не пытайтесь вникать в составляющие термин слова. Считайте что это всего лишь общепринятое нарицательное название для упоминания всего этого комплекса программного обеспечения, который сейчас такой прорыв делает в качестве решения интеллектуальных задач.
Интеллектуальными задачами я называют такие задачи, которые до сих пор могли решать только носители естественного интеллекта: выразительно говорить, эффективно обрабатывать (под обработкой я имею в виду операции со вложенными в текст смыслами и контекстами) неформализованные тексты на естественном языке.
Это временный термин. Со временем ИИ станет более специфично обозначать сперва то, что сейчас называют ИИ агентами, потом начнут делать "искусственных индивидуумов", которые, как бы, заточены на непрерывное прохождение теста Тьюринга и призваны формировать для людей искусственных людей для общения с ними.
Мне тоже не нравится складывающаяся терминология, но кто нас спрашивает? Терминологию определяют массы.
Ну вот, например, если считать ИИ буквальным переводом термина AI, то наши претензии к термину, дорогой @user8037654, жалко и бледно смотрятся на фоне названия компании OpenAI. Или вы скажете они не разбираются в теме и мнение их касательно применимости термина учитывать не стоит?
Вы, @user8037654, просто вступаете в спор о терминах понимая под ними одно, а при этом общество понимает под ними другое. На деле это просто имя для какого-то понятия. Вы же не спорите, что "замок" - это не "замок", или "ключ" - это не "ключ"? Часто в любом лингвистическом контексте попадаются разные термины называемые одним и тем же словом. Это не стоит вообще обсуждать даже. Все понимают что имеется в виду под этими терминами, а если вы думаете нет, то вводите в рамках своей претензии дополнительные термины: сознание, индивидуум, иск-ин и т.д. А ещё хорошо бы их как-то определить тоже худо-бедно.
Просто хватит уже. То, что сейчас принято называть ИИ - это нифига не искусственные люди, тут далеко до сознания или индивидуума. Понятно что далеко, но насколько далеко - не понятно, потому что границы размыты, не определены четко. На этом давайте и порешим. Вы ж не будете спорить, что лет 5 назад наши нейросети не умели так хорошо оперировать смыслами и писать тексты? Вот считайте, что этот фазовый переход количества в качество нынче принято называть двумя буквами "ИИ" (Исскусственный решатель неформализованных Интеллектуальных задач). Устраивает?
Ответ trapwalker в «Слепой водитель»2
Вот едет такой законопослушный мужик между городами на дистанцию 800 км. И постоянно кто-то перед ним в его дистанцию вклинивается.
"Да вы заебали", — скажет мужик после 150го вклинившегося торопыги за 20 минут пути, и сократит дистанцию, потому что в масштабе 800 км это очень чувствительная потеря времени — двигаться в общей очереди непрерывно назад.
"Какого хрена вам неймётся, торопыги ёбаные?", скажет тот же мужик, — "едьте нормально! Не воруйте моё время! Не дам я вам передо мной вклиниваться. А если не можете вклиниться, значит, и не надо выезжать на обгон — ПДД".
И переквалифицируется такой законопослушный мужик в жопонюха.
И чего он добился? А того, что торопыга с чурекской бодрой музыкой в салоне после обгона самовольно снялся с маршрута, и лёжа на крыше в овраге, получив штраф = 1 автомобиль, обдумывает правила ПДД.
А жопонюх, чьё время в этот раз не было в итоге своровано, приходит к выводу: "хм, это работает".
Страдает в итоге встречный, которому этот срач не впёрся. Но и он по ПДД должен тормозить, а не рулить, потому что у диарейщика и шило в жопе, и титул "самая вертлявая баранка". Сам куда надо вырулит.
