Новости: Громкие Релизы от OpenAI и Anthropic. GPT 4,5 и Claude 3,7 Sonnet

Кластерный график

Горизонтальные объемы

Парный трейдинг

Торговля на демо

Балансировка портфеля

Опубликовать изображение

	База данных всех сделок

	Услуги разработчиков

	Блог Cricracry о торговле по объемам

Техническая поддержка

ONLINE

		Приложение для iPhone и iPad

		Приложение для Android

		Мобильная версия сайта

Новости: Громкие Релизы от OpenAI и Anthropic. GPT 4,5 и Claude 3,7 Sonnet

ruticker 02.03.2025 23:23:30

Текст распознан YouScriptor с канала Продуктивный Совет

распознано с видео на ютубе сервисом YouScriptor.com, читайте дальше по ссылке Новости: Громкие Релизы от OpenAI и Anthropic. GPT 4,5 и Claude 3,7 Sonnet

# Привет! Это новостной выпуск Это еженедельный обзор всех событий в мире нейросетей и технологий, и нам с вами нужно серьёзно кое о чём поговорить. Неделя началась невероятно занимательно с релиза новой модельки от компании Anopic: **Claude 3.7**. Вот такой пайплайн, что называется, был у компании по заявлениям одного из сотрудников. Давайте дружно скажем спасибо Anthropic, что модель новая называется не Claude 3.5.12, а что-то более привлекательное и доступно произносимое. Но всё равно вопросов достаточно много. Итак, вышел **Claude 3.7** — модель потрясающая! Вот несколько бенчмарков, которые мы сразу после релиза публиковали в нашем Telegram-канале. Действительно сильная, крутая модель, которая превосходит по многим доменам и параметрам своих конкурентов. Мы долго ждали от Anthropic каких-то новых релизов, и, наверное, главной фичей этой модели стало то, что в ней добавлен **Reasoning**. Теперь Claude 3.7 может опционально размышлять и думать дольше, чем обычно, и не генерировать свой ответ сразу же. В Telegram-канале, разумеется, делали короткий обзор того, что из себя это представляет. Самое, наверное, приятное, что модель стала по всем доменам направлениям, как я уже сказал, умнее, но цену на API не повысили: такая же цена — 3 доллара за миллион токенов на инпут и 15 за миллион токенов на аутпут. Параллельно с этим выпустили такую интересную тулзу под названием **Claude Code**. Я тоже здесь про него рассказывал и более того, записал отдельный выпуск, который вышел на этой неделе. Можете кликнуть, посмотреть по ссылочке. Что мы ещё в нашем медиапространстве обсудили? Ну вот смотрите, Claude 3.7 — это первая модель, которая научилась долго и грамотно играть в **Покемонов**. Покемончик не настолько стар или млад, но в общем я в него конкретно на ГБО не играл, хотя таким стилем обладали. Так вот, Claude 3.7 — это первая модель, которая действительно смогла выйти из какого-то первого уровня замка и показать какие-то приемлемые результаты. Конечно, Anopic снабдили немножко Claude инструментами **Function Calling**, чтобы он мог нажимать на соответствующие клавиши, поворачивать персонажем и понимать, где как пиксели расположены, как не врезаться в стену, забор и так далее. То есть чуть-чуть они прокачали сам этот геймплей и эту систему, но тем не менее результат налицо. Более того, можно прямо знатно угореть и зайти на **Twitch**, чтобы понаблюдать, как в прямом эфире Claude продолжает рубиться в Покемона. Вот сейчас это всё дело подгрузим, и мы сможем с вами посмотреть, как у него успехи, где он застрял или не застрял и что происходит. Я так понимаю, что вот 1500 человек вместе с нами ещё наблюдают за этим чудным увлекательным процессом. Я хочу снять отдельный ролик, где буду сравнивать Claude 3.7 с другими моделями, поэтому не буду сейчас прямо вдаваться в какие-то невероятные подробности. Ну и тем более новостей много, но хочется, конечно, отметить, что в принципе ожидаемо Claude 3.7 находится на первом месте на **webdev** арене, то бишь создании, ну в первую очередь фронтенда сайтов. Claude 3.5 наш любимец в этом плане, 3.7, конечно, здесь не уступает. Мне немножко грустно за Илона Маска и модель **GPT-3**, она вот была топовой на протяжении недели, но конкуренция — дело такое, добавляет жару в без того насыщенную неделю. Под конец пришла всеми нами любимая **OpenAI** с релизом **GPT-4.5**. Мы это всё ждали, обсуждали, и вот чудо свершилось. Если очень и очень вкратце, то GPT-4.5 — это лучшая, самая большая, самая дорогая в тренировке модель, которая есть сейчас у компании OpenAI, но она уступает другим их моделям, НГ моделям, по определённым направлениям, что в принципе не удивительно. Вот ряд бенчмарков я здесь привёл на **Simple QA**: GPT-4.5 превосходит другие модели по галлюцинациям, то есть ответы 4.5 нравились людям больше на вот такое количество процентов. Но вот ряд бенчмарков, по которым GPT-4.5 уступает, например, модельке **O3 Mini** — это сложные вопросы PHD уровня, это, конечно, математика, это софтвер, инженер, кодинг и так далее. И это не удивительно, модель является просто самой большой, но у неё нет этой возможности рассуждать, её не учили генерировать эти цепочки рассуждений. Но в чём же всё-таки тогда её прелесть? А в том, что это гораздо более смышлёная, можно сказать, с большим кругозором модель и с лучшей интуицией и пониманием самых разнообразных не технических, не требующих долгих сложных вычислений тем, как сами утверждают у 4.5, по-моему, эмоциональный интеллект вырос, а не не эмоциональный интеллект, если вы понимаете, о чём я. И на самом деле это очень интересно, интересно посмотреть, как эта нейронка будет отвечать и отвечает на менее сложные технические, не математические вопросы и как она ощущается в разговоре. **Сэм Альтман** нам утверждает, что это первая модель, которая заставила его ощутить, что он общается с умным человеком. Иногда я сидел в своём кресле и просто поражался, насколько же действительно качественные ответы я получаю от ИИ. На данный момент модель доступна только для Pro-пользователей подписки — 200 долларов в месяц, потому что у OpenAI закончились видеокарты, но они обещают, что в течение следующих недель и на Plus, конечно, тоже эту модельку раскатят. Вот ещё несколько технических аспектов: 128,000 токенов контекстное окно, 16,000 на output, поддерживаются все эти фичи вроде добавления файлов, картинок, кавер, поиск, структурированные ответы, стриминг и так далее. То есть полный рейт для разработчиков, но цена абсолютно зашкаливает: 75 долларов на инпут и 150 долларов на аутпут. А теперь вспомните цену, которую я говорил про API, и даже не буду поминать цену на китайцев — это абсолютно конский, зверский, катастрофический ценник, который, конечно, вряд ли кто-то на данный момент захочет платить компании. Поэтому ждём, пока оптимизация свершится, случится, и цены упадут. Вы уже можете попробовать модель на **LM-арене**, пожалуйста, 2.54 с поно потестить какое-то количество запросов там точно дадут. Как я уже говорил, на будущей неделе я очень надеюсь выпустить полноценный ролик, где мы будем сравнивать 4.5, 3.7, Claude, Grok 3. В общем, всё это прекрасное многообразие. Подоспели независимые оценки, стоит сказать, что всё-таки модель крутая, по крайней мере по бенчмаркам, где-то она может немного уступать в кодинге, скорее всего, где-то Grok может уступать, но по бенчмаркам, вот именно по работе с большими неструктурированными корпоративными файлами от такой компании **Box**, GPT-4.5 показывает классные результаты, действительно хорошо справляется с выделением и с поиском нужной информации в большом контексте. А по кодингу, как я уже сказал, есть пробелы и проблемки. Даже **DeepS V3** превосходит 4.5, не говорим уже о 3.7. ## Давайте подведём итоги Если вы запутались, чудесный пост: 4.5 — это новый Claude 3.6, Claude 3.7 — это новый O3 Mini, Claude Code — курсор, Grok, O1 Pro — самая умная, но не умнее, чем O3. Да, это просто сумасшествие, как разобраться во всём этом многообразии моделей, понять, что, где, когда и в какой ситуации использовать. Мне даже вам сложно ответить, но опять же я надеюсь, что мы скоро в это разберёмся. Подписывайтесь на все наши ресурсы, чтобы не пропустить новые выпуски. Друзья, это прекрасно, что вы наблюдаете за миром нейросетей и технологий, смотрите наш контент, подписывайтесь на наши ресурсы. Но я также надеюсь, что вы и используете все эти новые инструменты. Я знаю, что это сделать из России не так уж-то и просто. Меня часто спрашивают: "А как же получить доступ к крутым зарубежным инструментам, которые закрыты, и сделать это быстро, легко и надёжно?" Могу порекомендовать **bay.ru**, где есть большой выбор лицензионного ПО для работы и творчества. Это и офисные утилиты, и графические редакторы, инструменты для 3D. Ну и, конечно, доступ к нейронкам. Неважно, вам нужно составить отчёт, сделать качественный дизайн в **Adobe** или запустить новый проект в **L1 Laps**, например, что-нибудь транскрибируемое, начать свою профессиональную деятельность. А главное — никаких проблем с оплатой. Выбрали продукт, добавили в корзину, выбрали тариф, оплатили российской картой. Плюс у ребят есть Telegram-канал, где можно почитать про софт, узнать лайфхаки, быть в курсе всех новинок. Туда обязательно тоже загляните. Если вы устали от постоянных блокировок и хотите найти надёжного поставщика качественного ПО, то **bay.ru** — это ваш выбор. Кликайте по ссылке в описании этого ролика и работайте себе на здоровье. ## Что ещё полезного и интересного залили на неделе? Наши любимые новинки. Во-первых, **Deep Research** для всех, ну почти у кого есть подписка на ChatGPT с лимитом 10 запросов в месяц. А я даже думаю, что это и неплохо. Более вдумчиво и качественно можно генерировать свои промты. Вот, наверное, OpenAI также рассуждают, выдавая подписчикам плюс такое количество запросов. Но не забывайте, что у нас есть **Plexi**. Мне он действительно нравится зачастую больше, чем OpenAI. По крайней мере, с моими задачами они ни те, ни другие не справляются, но об этом ладно, не сейчас. Ещё новинки от компании. Во-первых, теперь вы можете через **Safari** через специальный плагин ChatGPT сделать ChatGPT своим базовым поисковиком. То есть в принципе Google, прощай! Если вы что-то ищете на телефоне или, в принципе, в Safari на Маке, то есть такая опция. Более того, **Advanced Voice Mode**, который заряжен GPT-4 Mini, выдают всем пользователям ChatGPT, так что даже если вы на бесплатной подписке, с этой чудной моделькой именно в Advanced режиме можно общаться. Пользователи, в свою очередь, по-прежнему получают доступ к ADV Mode, заряженному 4.0, и лимиты там в пять раз больше, чем у всех бесплатных подписчиков. Ещё несколько разработчиков, но приятных новостей: O3 Mini и O1 в **Assistance API** теперь получают доступ к поиску в файлах. Так что можно рак настраивать, работая с этими модельками. И наконец-то **Sora** пришла в Европу и в UK. Так что можно теперь либо там находиться и пользоваться Sora, либо туда, как бы, находиться и пользоваться Sora. Вы меня поняли. ## За финал Это прекрасное многообразие релизов на этой неделе. Обе компании, OpenAI и Anthropic, решили вот таким чудесным совместным подписанием соглашения, ну или точнее анонсом о том, что они будут участвовать в **AI Jam**. По-моему, звучит прекрасно! Что это в себя будет включать? Тысячи учёных из самых разных ИИ лабораторий, организованно Министерством энергетики США, встретятся и как соберутся, и как придумают что-то важное, потрясное для национальной безопасности и лидерства штатов в этой области. Укрепляем американское лидерство в области ИИ. Ну здесь как бы надо коллаборировать. Берём наш чудесный мобильник, открываем приложение, которое, надеюсь, вы уже предварительно скачали. И, честно говоря, **Grok 3** — прекрасная модель. Я вот с ним последнюю неделю общаюсь, и я действительно доволен. Пока что очень радостно, но сравнение отдельное в будущем ролике. Выбираем один из голосовых ассистентов. Кстати, я не знаю, насколько это здесь всё бесплатные, какие лимиты, но **Grok** вот выкатил по сути **Advanced Mode**, который есть в ChatGPT. Так что если вам теперь хочется общаться с моделькой голосом, то можно это делать. И добавили некоторое количество достаточно занимательных персонажей, личностей, в том числе абсолютно неограниченных. Вот **UN Hint**, пожалуйста, Motivation или с кем-то спорить. 18+ рейтинг стоит, так что мы можем смело сказать **Grok**. В общем, отключаю, пока это не вышло за рамки политик всех ютуберских. Так что вот можно очень даже весело поразвлечься пользователям. Но в принципе, я думаю, что определённую аудиторию точно привлечь. Может, **Copilot** на macOS. В общем, если вы предпочитаете какие-то нестандартные решения в своей жизни, то можно установить **Microsoft Copilot** на свой прекрасный Mac и пользоваться всеми прелестями GPT. Ну или не всеми прелестями, но на самом деле, ладно, смысл в этом есть, потому что Copilot даёт безлимит на Voice и Think Deeper. Ну, то бишь на модели на базе O1. Не очень уверен и не понимаю, какой там O1, которых тоже уже несколько тысяч миллионов. Ну или просто три там варианта: сложный, не сложный, долго думает, мало думает. Это вопрос, но в общем попробовать можно. Поэтому, в принципе, если вы любитель кофе без кофеина, без алкогольного пива, не знаю, суп вилкой предпочитаете есть, то можно и как бы Microsoft Copilot тоже себе на Mac установить. Но к счастью, не только Copilot Microsoft ограничился на этой неделе. Тоже немножко нас порадовали новыми релизами, а именно модельками **F4** и **Multimodal F4 Mini**. Расширяем семейство малых языковых моделей: 5-6 миллиардов и крошечка на 3.8 миллиардов. 5.6 миллиардов кажется более интересным — это мультимодальная модель, которая вбирает в себя и Vision, и с текстом работает, и, конечно, звук воспринимает. Ушки есть, всё прекрасно у модели, и в общем-то она себя чувствует достаточно уверенно по сравнению с другими большими моделями. Вот там **Gem Flash** — ну где-то уступает, но где-то даже и превосходит на этих разнообразных самых специализированных, скажем так, бенчмарках. **F4 Mini**, конечно, это крошка на 3.8 миллиардов параметров, между прочим, с контекстным окном 128,000 токенов. Очень уверенно, но чувствует себя, конечно, немножко кашляет в сравнении с большими моделями. Нуль Даш там, ну маленькими моделями **GPT-4 Mini** везде её превосходят. Но тем не менее, очень маленькая модель, которую можно в целом себе пытаться закинуть. Я думаю, что в каких-то ситуациях её и можно использовать. Вот мы там в коммьюнити недавно обсуждали, как на **Raspberry Pi** закинуть, например, DPC каван в вариации 1 миллиард параметров для определённых задач. Ну как бы тут 3.8 тоже вполне может где-нибудь там попы теть, да что-то вам интересное локально сделать. **Pika 2.2** здесь с десятисекундной генерацией разрешением 1080p и **Pika Frames**. То бишь можно выбрать начальный кадр, конечный кадр и получить, например, вот такой вот чудесный ролик. Несколько примеров от Pika, что там умеет делать. Pika трансформ — ну короче, хорошие, наверное, относительно ролики. Я бы предпочёл **Luma R2** из тех, по крайней мере, через Pika, которые я видел, но всё равно я уверен, что можно пробовать. Надеюсь, мне ещё бесплатно что-нибудь выдают, но это не точно. Но в любом случае можно зайти на Pika, да посмотреть обновление. Есть Pika, в целом неплохо, там делает разные визуальные эффекты. Вот здесь, кстати, ещё как раз-таки эти визуальные эффекты я вам хотел показать. Например, вот это очень достойно, как бы куда-нибудь дав коря чить, немножко там психодел накинуть в ваш видеоряд, почему бы и да. Кажется, к с этим справляется неплохо. **Gram 2A** — вот тоже ребята прикалываются по названиям. Gram 2A — это моделька, оптимизированная для графического дизайна и фотографических, видимо, фотореалистичных фоток. Есть и на сайте, есть и VPI, и стоит она дешевле на 50% и там, и сям, и получает действительно классный результат. Честно говоря, я, ну опять же, у нас Игорян занимается дизайном, я редко захожу во все эти инструменты, но я был достаточно сильно удивлён, что можно вот такую картинку сделать с таким текстом. К сожалению, пока только, скорее всего, на английском, вряд ли на русском что-то она напишет, но тем не менее, настолько классно, качественно, полноценный, как бы флаер, что это превью сабнейл, как оно обложка, обложку можно сделать достойно. **Luma AI** добавляет к своим видеорациям. Вот, собственно, про 2 я там упомянул, но теперь можно ещё генерировать ролики с аудио. Здесь, к сожалению, оно у меня не идёт, но может, мы его и монтировали, кстати говоря. И всё здесь идёт, но очень прикольно, теперь можно даже делать классные биролы, не просто беззвучный скучный, потом эти власы тоже как-то учатся. А вот полноценная игра, выстрелы, не выстрелы — ну в общем, полный фарш видеоконтент на уровне. **Люди, роботы!** Подписывайтесь на канал, поддерживайте наш проект, мы вам за это очень благодарны. Все полезные ссылки находятся в описании этого ролика. Вы нас мотивируете, мы стараемся делать качественный контент, и подписка помогает вам не пропускать новые полезные выпуски в этом чудном мире технологий и нейросетей. Увидимся! У меня 3% на камере осталось.

Залогинтесь, что бы оставить свой комментарий

Анализ объемов

Инструменты анализа объемов

Обзор рынка

Чарты и таблицы для сводного анализа рынка

Портфель бумаг

Портфельные инвестиции

Сканер рынка

Новости: Громкие Релизы от OpenAI и Anthropic. GPT 4,5 и Claude 3,7 Sonnet