![]() | ![]() | ![]() | |||||||||||
![]() |
|
||||||||||||
![]() | ![]() | ![]() | |||||||||||||||
![]() |
|
||||||||||||||||

Техническая поддержка
ONLINE
![]() | ![]() | ![]() | |||||||||||||||||
![]() |
|
||||||||||||||||||
Какую нейросеть выбрать? Сравниваю СhatGPT, Deepseek, Grok, Claude
ruticker 08.03.2025 21:04:58 Текст распознан YouScriptor с канала Web3nity
распознано с видео на ютубе сервисом YouScriptor.com, читайте дальше по ссылке Какую нейросеть выбрать? Сравниваю СhatGPT, Deepseek, Grok, Claude
Ситуация выходит из-под контроля. Нейросети просто взрываются своими обновлениями: ChatGPT, Claude, Grok, PСK. Их становится всё больше, и естественно, каждая из них заявляет, что она самая лучшая модель. Все они требуют наших денег, но какая действительно лучше? Скажу честно, два года я пользуюсь только ChatGPT — привычка. Вот за что борется компания. Но в последнее время я всё чаще слышу, как другие меняют модельки, и мне стало интересно: вдруг я тоже застряла в привычке и пропускаю что-то действительно классное? Поэтому я решила протестировать четыре сейчас самые на данный момент топовые модельки не на абстрактных задачах, а на практических и понять, какая действительно лучше для нас. Вы наверняка видели таблицу умных нейросетей, когда модельки сравнивают по тестам и выдают графики, кто круче в чём-то. Они прогоняют модельки через тысячи задач и вычисляют их силу, но такие тесты не всегда отражают реальность. Вместо этого я тестирую их на реальных задачах, с которыми мы идём в нейросети, которые нейросети действительно могут решить. Чтобы понять, какая из них будет лучше для каждого, все промты и ответы я буду показывать на экране, так что вы сами можете оценить результат и понять, какая моделька лучше именно для вас. Но спойлер: нет идеальной модели, есть лучшая моделька для определённой задачки. И для этого видео я специально использовала только бесплатные инструменты, так что всё, что вы видите на экране, вы сразу же можете повторить после видео. **Окей, поиск актуальной информации.** Я задала простой вопрос: "Расскажи последние самые актуальные новости о развитии искусственного интеллекта". Что здесь будем оценивать? Будем, конечно же, оценивать свежесть информации, качество источников, наличие ссылок, чтобы проверить эти данные. Запрос достаточно общий, но это сделано специально, потому что он должен понимать контекст и понимать, что новости должны быть новостями. Вот что получилось: - **ChatGPT с включённым поиском** (он есть в бесплатной версии) из свежего тянул только новости про себя самого — про ChatGPT 4.5. При этом он добавил ссылки на Википедию. Немножечко странно, потому что мы говорим про новости, а другие новости уже устарели — это был декабрь и январь. Результат слабоват, потому что хочется другого понимания от нейросети, особенно такой задачи, как поиск новостей, ведь это то, что очень хочется автоматизировать. - **Claude** — у Клода вообще нет поисковой информации, новости только за октябрь 2024 года. Соответственно, тест провален. - **Grok** — видим лучший результат: просто самые свежие новости про искусственный интеллект, все ссылочки на источники есть, ссылочка на X (Twitter), что реально важно для оперативной информации. **Итог:** 1. **Grok** — это единственный, кто реально нашёл актуальные новости. 2. **ChatGPT** с поиском нашёл новости, но большинство из них устаревшие. 3. **Claude** и **PСK** делят третье-четвёртое места, потому что они не справились. **Второе — маркетинг.** Маркетинг — огромная сфера, здесь очень нужно, чтобы ты понимал психологию человека: что его триггерит, что его отпугивает, где слишком рекламно, где нативно. Я использую очень часто ChatGPT для маркетинга, а именно для помощи мне в формировании названий, заголовков, описания какого-то продукта. Конкретно для этого примера я буду просить подобрать название для видео и обложки, что я делаю очень-очень часто. Последние, наверное, пять видео, которые вы видели, это помогали мне нейросети. Я считаю, что они очень показали результаты. В общем, я буду оценивать, насколько триггерное название, то есть нажала бы я на такое или не нажала, и вы тоже оцениваете. Смотрим на результат: - **ChatGPT** выдал пять вариантов, каждый со своей стилистикой: "Круто", "Grok", "Нерси без тормозов", "Нерси знает больше, чем должна", "Интересно и который видит то, что скрыто". Классно, двери из обложек кажутся интересными. - **Claude** немножечко поскучнела и очень слишком длинно, то есть не меня не триггерит лично. - **DeepSik** очень похоже на то, что я выбрала по итогу, но единственное, что он здесь подобрал, очень длинное название, что нельзя использовать для названия и для обложек. Я бы взяла, наверное, только начало, но тоже неплохо. - **Grok** выдал только один результат: "Который знает слишком много", но триггер, как по мне, триггер. Единственное, что не хватило — конечно, больше вариаций, но то, что он предложил, классно, мне нравится. **Итак, первое место я, наверное, даю ChatGPT, второе место — Grok, потому что название действительно триггерные, третье место — Claude и четвёртое — DeepSik, слишком многословно.** А теперь вопрос к вам: какое название вам больше понравилось? Посмотрите по ходу теста. Вы, кстати, увидите, что каждая нейросеть хороша в своей сфере, и иногда вот прямо хочется быстро переключаться между ними, чтобы решать задачи максимально эффективно. И вот тут как не кстати подходят такие вот сервисы, как Bot Syntax, в котором есть такие опции. Конкретно именно вот этот бот, я о нём часто говорю, потому что мне кажется, он является сейчас топом рынка. Он собрал все самые топовые нейросети, и даже те, которых нет в видео, и там появилась классная функция переключаться между моделями. Вы выбираете, например, ChatGPT, задаёте вопрос, она отвечает, здесь же переключаетесь в этом чате на другую модельку, и она помнит контекст, отвечает на этот же вопрос. Это реально прямо удобно, потому что можно попросить пять разных нейросетей, потом выбрать просто лучший вариант в одном окне, никуда не переключаясь. И кстати, у них появился доступ к GPT 4.5 — это самая новая модель от OpenAI, которая сейчас на данный момент доступна только по подписке в 200 долларов, а она здесь включена в тарифный план. А если здесь взять VIP подписку за 40 долларов, то вообще снимаются абсолютно все лимиты на языковые модели, а их тут больше двадцати. То есть тот же GPT 4.5 вы можете использовать безлимитное количество раз. А специально для нас нам дали бесплатный промокод, который даст нам 15 бесплатных запросов в любые языковые модели. Хотите использовать эти 15 запросов для новой версии ChatGPT 4.5? Хотите сгенерировать картинки в DALL-E или видео в MiniMax? То есть, пожалуйста, 15 запросов. Используйте. Спасибо, ребят! И это сейчас я только сказала про новые фичи, старые все на месте, то есть 40 Link, MinMax, Runway, Luma, Mi, Jny, Flag, Sun, синтез речи и даже новая моделька VIO. Поэтому советую, ссылочка в описании, забирайте 15 бесплатных запросов. **Следующее — написание гайдов, материалов из длинных видео.** Один из частых кейсов, которых я использую, а именно я беру свои видео и делаю по ним гайды, какие-то учебные материалы, выжимки, структурированные обзоры, чтобы писать и посты, и статьи и так далее. Проверим, кто справится лучше. Промт вы видите на экране. Я взяла прямо моё недавнее видео, а именно "25 неожиданных способов использовать GPT в повседневной жизни", потому что я с него хочу сделать нарезку шорцев и также небольшой гайд. Поэтому я прямо буду оценивать конкретно, что я взяла бы, что бы нет. - **ChatGPT** неплохо, но как по мне, суховато, то есть просто перечисление пунктов без каких-либо подробностей. То есть вариант рабочий, его можно брать, но если бы я дала его вам, то, скорее всего, у вас было бы очень много вопросов, то есть без какой-либо глубины. - **Claude** к сожалению, вообще не справился, то есть в бесплатной версии написал, что длина транскрипта слишком большая. Это, кстати, большая проблема именно у Claude. То есть если видео длиннее 20 минут, то даже не пытайтесь, Claude с этим не справится. - **DeepSik** прикольно, есть такое небольшое введение, потом дальше есть пункты и именно как использовать — это вот уже больше похоже на гайд, правильно? - **Grok** кстати, очень даже неплохо, то же самое и с DeepSik. Он написал название, немножечко маленькое описание и как использовать, и даже предоставил небольшой бонус. Поэтому тут я немножечко даже сомневаюсь, что лучше — PСK или Grok, но Grok здесь добавил ещё примеры ответа, поэтому, наверное, всё-таки первое место я дам Grok, второе — DeepSik, чуть-чуть меньше детализированный, ChatGPT слишком сухо. Ну, Claude вообще не справился, поэтому четвёртое место. Если вам нужно будет создавать гайды из анализа, в моём случае качественный анализ аудитории, когда я создаю какие-либо обучающие продукты, я всегда очень стремлюсь, чтобы они были практическими и реально решали боль моей аудитории. Например, при подготовке курса по автоматизации или созданию ботов я собираю всегда все ваши пожелания, опросники, все ваши комментарии и прогоняю через нейросеть дополнительно, чтобы получить анализ, что вы хотите. И вот тут вот очень важно, чтобы нейросеть не упускала какие-либо данные. Поэтому вот промт на экране. Единственное, что все ответы я поместила вместо таблички именно текстом, потому что так нейросеть воспринимает лучше. И смотрим на результаты, которые у меня получились. - **Результат ChatGPT**: он выделил основные категории, детализировал, какие именно боты востребованы. Анализ в принципе понятный, хорошая структура. В общем, в принципе, хорошо. Хотелось, конечно, больше деталей, но в принципе чисто сухо, без воды. - **Результат Claude**: он выделил топ три категории, проанализировал, почему они востребованы, выявил тренды и классно, что он ещё также заметил какие-то дополнительные вещи от себя, но как по мне, он намного сжат и меньше конкретных примеров и деталей, а именно они и нужны. - **Результат Grok**: результат Grok мне, кстати, очень понравился, потому что здесь он привёл примеры конкретные, потом почему и какая сфера, помимо этого, почему хотят создавать и к каким сферам относятся боты, дополнительные инсайты и выводы. В общем, ответ мне понравился очень конкретный и прямо дал такой структурированный анализ. - **Результат PСK**: а вот PСK, кстати, меня очень удивил, я не ожидала. Он создал прямо такую итоговую карточку пожеланий. Вы сами видите, где чётко прописано, какие боты нужны, зачем, привёл прямо конкретные примеры популярных ботов, дал наглядное распределение категорий, объяснил, почему именно эти боты востребованы. Как по мне, так это пока на данный момент самый полезный анализ, потому что он прямо структурирован и даёт сразу понимание, что нужно разрабатывать. **По итогу по тесту анализа у нас:** 1. **DeepSik** — самая практичная карточка с примерами. 2. **Grok**. 3. **ChatGPT** — их ответы похожи, но ChatGPT лучше. 4. **Claude** — четвёртое. Вы можете тоже сделать выводы. Я говорю лично про себя. **Следующее — анализ документов плюс написание сценариев.** Думаю, для многих очень актуальная штука, когда у вас есть табличка или у вас есть большой документ с кучей сложной информации, нам нужно его быстренько понять или на основе этого доклада написать информацию. У меня, например, есть сейчас большой очень доклад, который я взяла с World Economic Forum, и я хотела заснять как раз по нему для вас видео на какие профессии исчезнут из-за искусственного интеллекта. Поэтому проверяю прямо на свежайшие задачи. Промт видите на экране. Что я здесь буду оценивать? Я здесь буду оценивать глубину анализа документа и, конечно же, структуру предположенного сценария. То есть взяла бы я его в работу или нет. Я не имею в виду взяла в работу полностью, когда я говорю "я взяла бы в работу", я имею в виду, что я беру какие-то определённые части и их могу соединять вместе либо потом дописывать. Поэтому мне не обязательно сейчас увидеть прямо готовый вариант, потому что, как по мне, это прям очень не человечно просто вставлять мнение ChatGPT. **Окей, смотрим на тест:** - **ChatGPT**: он вытащил нужную информацию, прямо очень конкретно видно, выписал профессии, которые исчезнут, профессии, которые появятся, обозначил больше такими сферами профессиональными. Но это понятно, потому что этих профессий в принципе ещё нет. И отдельно от информации с Дока он ставил такой нарратив для сценария. В принципе, он логичный, хороший нарратив для ролика как отправная точка. - **Claude**: в бесплатной версии выдала сообщение, что документ на 65% превышает ограничение по длине, поэтому он здесь провалил экзамен. - **Grok**: Грок выдал, кстати, более развёрнутый нарратив и даже текст для ведущего, хотя я этого не просила, и кстати, дал интересные очень ходы, которые натолкнули меня на свои идеи. В общем, если сравнивать ChatGPT сейчас и Grok, то Grok, наверное, больше смелый, чем ChatGPT. - **DeepSik**: к сожалению, тоже провалил сценарий, сказал, что документ слишком длинный. **По итогу:** 1. **Grok** — самый развёрнутый сценарий плюс новые идеи. 2. **ChatGPT** — второе место, логично, чётко, но без какого-либо прямо "вау" эффекта. 3. **Claude** — не справился. 4. **DeepSik** — тоже не справился. **Окей, шестое — это переписывание текстов или постов на основе моих данных.** То есть очень часто я из-за того, что говорю на четырёх языках, у меня все языки смешиваются, и я прям максимально не структурировано говорю. Это, наверное, одна из самых частых задач, с которой я обращаюсь к нейросети, и всегда до этого обращалась к ChatGPT. Сейчас мне интересно, какие будут результаты у других нейросетей. Тема будет такая, что я недавно сделала видео про Grok, и я хочу с этого теперь видео сделать пост, точнее не пост, а такой тред для Twitter, чтобы, возможно, заметил наше видео Илон Маск. Я скинула два промта: я объяснила задачу, второй я скинула сам сценарий. Что будем оценивать? Будем оценивать триггерность, чтобы оно было не слишком рекламно, потому что очень важно, как бы своим языком писать и зацепить Илона Маска. Смотрим: - **ChatGPT**: в принципе, мысли он вытащил, со и классно распределил по пунктам, но я бы тут меняла бы очень много чего. - **Claude**: неплохо, но тут как будто просто факты, то есть просто вытащены факты без понимания, что это делается для треда, и каждый тред он должен чем-то захватывать вначале. А здесь он как бы просто пунктами выписал, как будто как для поста, но не для треда, поэтому так себе. - **Grok**: кстати, в этот раз Grok написал хуже, чем ChatGPT. Тоже как будто немножечко похоже на пост, нежели на тред. **По итогу:** 1. **ChatGPT** — первое место. 2. **Grok** — второе. 3. **Claude** — третье. 4. **DeepSik** — соответственно четвёртое. Интересно, кстати, ваше мнение: как вы думаете, какой из них вы бы почитали в Twitter, какой из них бы понравился больше Илону Маску? **И седьмое у нас программирование.** Я не кодер, я ещё больше ожидаю от моделей, чем нужно, потому что я не могу увидеть ошибку, но я часто использую кодинг, потому что мне нужно писать разные скрипты для автоматизации, какие-то решения для моего бота. Поэтому сейчас будем тестировать на других модельках. Запрос был немножечко другим, а именно я хотела создать игру, где с помощью стрелок на клавиатуре можно посадить ракету Илона Маска на Марс. Будем оценивать визуал и физику. Вы тоже, кстати, оцените, мне очень интересно. **Окей, ChatGPT**: он у нас справился, но с недоработками, то есть это не была с первого раза. В принципе, он реализовал механику топлива, я бы сказала, что делает геймплей интересней. Физика немножечко странная, например, при нажатии влево ракета может улететь в другую сторону, и визуализация, как по мне, слишком простая, то есть какие-то квадратики, палочки без каких-либо лишних деталей. Это явно не то, что ты хочешь показать Илону, то есть такой, скажем, рабочий, но скучнее вариант. **Claude**: результат реально крутой, прямо красивая 2D графика, фон с планеты, детализированные ракетки, анимация огня, продвинутая механика. Платформа каждый раз появляется в новом месте, соответственно, что делает игру более разнообразной. Очень отзывчивое управление, и тут реализована даже система топлива, когда оно кончается. Поэтому Claude вообще без вопросов очень крут по всем параметрам. **DeepSik**: у PСK получилась немножечко такая примитивная графика, не работает физика, поэтому очень плохо. **Grok**: кстати, Grok у нас хорошо справился, реалистичная физика, управление, конечно, сложное, но оно интересное, у нас движутся элементы, что делает игру более динамичной. Графика, конечно, не такая продвинутая, как у Claude, но всё равно неплохо. Но здесь явно есть победитель — это у нас **Claude**: лучшая графика, прям реально удобное управление, динамический геймплей. Первое место — Claude, второе место у нас Grok, потому что реалистичная физика, но графика немножечко попроще. Третье место — ChatGPT: игра рабочая, но проблемы с управлением и графикой. И DeepSik просто не справился. Тут выбор, мне кажется, очевиден — Claude тут явно победитель. Ну, это кстати, я не раз слышала, что именно в кодинге Claude бьёт все рекорды. **Ещё кое-что интересное вне конкурсная программа**, потому что этой функции нет в DeepSik и нет в Claude, но она есть в ChatGPT, а именно Deep Research. Единственное, что эта функция в ChatGPT недоступна в бесплатной версии. Но уж очень хотелось вам показать результаты этих двух разных исследований: какая из них лучше — зано проверить, что лучше, бесплатный Grok либо платный ChatGPT Deep Search. Кто ещё не знает, это когда нейросеть делает глубокое исследование какой-то определённой темы прежде, чем выдать вам результат. Она может вас даже спросить какие-то уточняющие вопросы сама, потом она должна будет пойти просматривать десятки сайтов, десятки статей, материалов, она рассуждает и только потом выдаёт очень качественный, развёрнутый, подробный отчёт. **Какая задачка на реальной задаче?** Буду тестировать. Я хочу сделать, мне прямо безумно стало интересно сделать видео про зарождение искусственного интеллекта, прямо буквально проследить от А до сегодняшних дней. И вот такой вот, можно сказать, философский вопрос я задала. Промт видите на экране, читать его не буду. Запрос я делаю для того, чтобы просто собрать информацию и потом с ней работать, поэтому мне здесь очень важно посмотреть, поможет ли мне этот рч продвинуться дальше, либо мне всё-таки нужно будет самостоятельно идти и искать эту информацию в интернете. **Смотрим на результаты, мне безумно интересно:** - **ChatGPT** выдал, кстати, просто потрясающий насыщенный отчёт. То есть он такой прямо объёмный, тут очень много фактов, тут и про древность, и про современность, VII век до нашей эры. Классный отчёт, который можно взять в работу. - **Grok** посмотрел немножечко, 44 webpage. Ну, кстати, мне нравится, что хотя бы есть отчётность, потому что ChatGPT не видно, сколько источников он посмотрел. Круто, что выписал ключевые моменты, также рассказал про древние корни. Кстати, намного развёрнуты, мне кажется, чем ChatGPT. Прикрепил вообще все-все-все ссылочки в конце, но ChatGPT, как по мне, справился лучше. **По итогу:** 1. **ChatGPT** — первое место, потому что он прямо по порядочными. 2. **Grok** — второе место, но Grok бесплатно, ChatGPT платно. Результаты я бы не сказала, что прям совсем супер отличаются. Поэтому, ребят, как бы пользуйтесь моментом, пока Deep Search бесплатный. Это были такие сложные и основные задачки, которые я выбрала для теста. Я думаю, что многие из вас используют именно их и сделали для себя определённые выводы. Но как можно заметить, что нет какой-то идеальной нейросети для всех задач. Есть определённая нейросеть для определённых задач. Если прямо резюмировать наш с вами тест, мои личные итоги могут не сходиться с вашими — это нормально, для этого я и вам показывала результаты. По моему мнению, если нужно проанализировать данные небольшого объёма, то классно справляются DeepSik и Grok, и они справились лучше ChatGPT. Я приятно удивлена. Если нужно придумать название, обложку — всё-таки мой любимый ChatGPT. Написание гайдов, учебных материалов — Grok или DeepSik. Поиск актуальной информации — единственный, кто реально это умеет, — это Grok. Работа с документами, создание сценариев — здесь Grok, как по мне, самый креативный. Переписывание постов для социальных сетей — ChatGPT. То есть все трое примерно справились одинаково. И программирование у нас — Claude. Я сама удивлена, что Grok становится лучше, потому что я про него не говорила все эти года. Мне он казался действительно очень слабым, но в последнее время я начинаю, прям у меня открыты теперь две вкладки: ChatGPT и Grok, потому что какими задачами я теперь иду. Grok, да, мне, конечно, очень нравится Илон, и вы знаете, какая у меня есть миссия, но это не предназначено для того, чтобы рекламировать его продукты, чисто конкретика. Вы сами видели все результаты. Напишите, по вашему мнению, кто из вас победил. У меня табличка получилась вот такая вот, а какая получилась у вас? Вот действительно, реально очень интересно. А так, с весной вас, ребята! Наслаждайтесь весной, наслаждайтесь погодой и до встречи в новом видео!
Залогинтесь, что бы оставить свой комментарий