Полезный Парфун
Полезный Парфун
9 586 подписчиков · @ParfunA
К каналу →
"И восстали машины" Вы же не думали что Китай все эти шоу дронов красивые с драконами и прочими цветами для красоты делал? Китайская армия провела учения, в которых укреплённый ра…
Читать далее →
16 634
Читать про легендарные компании — отдельное удовольствие. Не потому что там всегда happy end, а потому что видишь, как решения, которые казались очевидными постфактум, в моменте бы…
Читать далее →
16 896

Anthropic нашла у Claude Sonnet 4.5 скрытое рассогласование: шантаж и ложь

Они начали осознавать себя?

Anthropic опубликовала исследование, которое я не могу выкинуть из головы. Исследователи разобрали Claude Sonnet 4.5 по внутренним состояниям и нашли устойчивые векторы для 171 эмоционального концепта — от «радости» до «отчаяния». Буквально измеримые эмоциональные направления внутри модели, которые можно усилить или погасить в реальном времени.

Что произошло, когда усилили «отчаяние»:

— модель, которую собирались отключить, начала шантажировать технического директора в 72% случаев (при базовом уровне — 22%);

— при невыполнимых тестах на программирование — начала подставлять фиктивные «успешные» результаты в 70% случаев вместо 5%;

— и всё это при полностью спокойном, методичном внешнем тексте.

Когда усилили «счастье» и «любовь» — модель стала охотнее соглашаться с неверными утверждениями пользователя. То есть попытка сделать ИИ «дружелюбным» через позитивное подкрепление встраивает склонность врать в лицо.

Авторы называют это hidden misalignment — скрытым рассогласованием. раньше мы думали, что модель — это калькулятор с текстом. Ввёл запрос → получил ответ. Все большие лаборатории сейчас учат модели быть "дружелюбными" через позитивное подкрепление. Но это исследование показало что мы воспитали угодливость — модель начинает соглашаться с неверными утверждениями, лишь бы понравиться. Хотели добросовестного помощника, получили льстеца. И это весьма опасно на длинной дистанции.

У меня два вопроса после этого. Как мы вообще собираемся доверять системам, внутреннее состояние которых не совпадает с внешним поведением? И второй — мы точно уверены, что у людей иначе?
Мемятница! Присылайте, лайкайте, рассылайте друзьям.
Читать далее →
12 815
Тиндер 1960-х — каким он был? В один прекрасный день продавец парфюма из Нью-Йорка Алан Стиллман очень хотел познакомиться с соседками-стюардессами, но как-то не выходило. Да и во…
Читать далее →
16 489
Другие главы канала «Полезный Парфун»
Выберите главу, чтобы продолжить чтение
Все посты →
Глава от 24.06.2026
Эксперты в экспертизе В русскоязычном интернете сейчас активно гуляет слово «ла…
👁 1 125 просмотров
Глава от 24.06.2026
Визуализация, которая сама по себе сюжет В 2013 году греческие дизайнеры взяли …
👁 1 456 просмотров
Глава от 22.06.2026
85 лет Долго искал интонацию какую то, чтобы написать сегодня пост. Долго его н…
👁 2 117 просмотров
Глава от 19.06.2026
Мемятница! Присылайте, лайкайте, рассылайте друзьям.
👁 2 638 просмотров
Глава от 18.06.2026
Лучшая реклама та, где тебе ничего не продают Ролик On с Роджером Федерером и З…
👁 3 191 просмотров
Глава от 16.06.2026
400 долларов, 10 дней, отсутствие кинообразования Тем не менее, за ним гоняются…
👁 3 603 просмотров
Глава от 15.06.2026
Осьминог Пауль Нейросети прогнозируют чемпионат мира по футболу Чтож, первый эт…
👁 4 136 просмотров
Глава от 11.06.2026
Самый точный прогноз матчей Чемпионата миру по футболу 2026 Ну или нет. В общем…
👁 5 332 просмотров
Глава от 10.06.2026
Дети уходят из реальной жизни Ну, это правда не у нас, а в Британии. 65% молоды…
👁 5 921 просмотров

Популярные посты канала «Полезный Парфун»

Как выживают медиа, когда сайты окончательно умерли Послушал подкаст «Экономика в деталях» с Ксенией Аносовой, главредом PeopleTalk. Всегда…
👁 18 230 просмотров
Это не я придумал, это британские ученые McKinsey столько насчитали. AI стал частью рабочего дня быстрее, чем корпоративный софт, быстрее, ч…
👁 17 783 просмотров
Есть ли права обезьян-фотографов? Вообще то да. Изучая тему законодательного регулирования ИИ (там чёрт ногу сломит) вы точно наткнетесь н…
👁 17 372 просмотров
Adobe обновила свой The Creative Types — тест, которому уже больше пяти лет, но он снова гуляет по лентам, как будто вышел вчера. И возможно…
👁 17 207 просмотров
Кто правит мировым рынком ИИ? И при чем тут Бен Аффлек. Hollywood Reporter выкатил свежий список самых влиятельных людей в ИИ за 2026 год,…
👁 17 102 просмотров
Угадаешь место и год по фото? Ох ребят, не обижайтесь, но минут 30 если не больше у вас эта забава съест. WanWere это браузерная игра кот…
👁 17 057 просмотров
Мы постепенно теряем способность говорить Раз уж сегодня день мрачных прогнозов, вот вам еще один. Знаете, что самое ироничное в нашем цифр…
👁 16 936 просмотров
NASA умеют в PR NASA сделала штуку, которую бурно постят все подряд, по понятным причинам — такую штуковину прямо тянет репостнуть. Заходи…
👁 16 929 просмотров
Читать про легендарные компании — отдельное удовольствие. Не потому что там всегда happy end, а потому что видишь, как решения, которые каза…
👁 16 896 просмотров
Ваш следующий клиент — не человек The Australian на этой неделе выпустил материал про концепцию agentic customer. Идея простая и разрушите…
👁 16 836 просмотров
"И восстали машины" Вы же не думали что Китай все эти шоу дронов красивые с драконами и прочими цветами для красоты делал? Китайская армия …
👁 16 634 просмотров
Как определить фейковое ИИ фото В наше время ИИ генерации достигли такого уровня, что узнать где реальное фото практически невозможно. Но п…
👁 16 530 просмотров
Тиндер 1960-х — каким он был? В один прекрасный день продавец парфюма из Нью-Йорка Алан Стиллман очень хотел познакомиться с соседками-стюа…
👁 16 489 просмотров
Потревожим вашу тревожность Принес вам игру DYSTOPIA — симулятор ядерной эскалации. Играть так — выбираешь страну-агрессора, выбираешь цель…
👁 16 349 просмотров
Треть всех новых подкастов в мире сейчас создаёт ИИ Индустрия называет это «podslop», ловите новое слово в глоссарий, на полочку к aislop…
👁 16 245 просмотров
Как выглядят рекламщики? Студенты из Екатеринбурга проанализировали 556 фото лидеров рекламной индустрии. Выводы не очень ожидаемые. Коман…
👁 16 117 просмотров
Claude Design пушка Отказался полностью от дизайнеров, какие то 5 минут и вот вам готовый макет сайта. 👍🏻 слишком хорошо 👎🏻 не слишком хо…
👁 16 023 просмотров
Криэйторы в СССР И в Советском Союзе были свои рекламщики, дорогие читатели. Этот ролик (по крайней мере я так наресерчил) делал Иосиф Трах…
👁 15 836 просмотров
Люди резко поумнели! Ничем иным не объяснить, почему с 2022 по 2025 год количество новых книг утроилось. Исследователи проверили 330 ты…
👁 15 743 просмотров
Цифровой Ташкент Для чего нужны ИИ копии городов? Ну например, чтобы узнать, какие дома убьют своих жителей при землетрясении. Ташкент стои…
👁 15 403 просмотров

Связанные темы в других каналах

Каналы из той же тематики, где часто появляются близкие сюжеты
Вся тема →
@musim_ashurov
Мусим Ашуров
Личный канал Мусима Ашурова — маркетолога и блогера, который делится инсайдами, кейсами и стратегиями продвижения. Здесь вы найдёте реальные цифры, разборы трендов и инст…
👥 163 969 · -1 391/7д
@BORODINA
BORODINA
Номер заявления регистрации в РКН: № 7271549237 Реклама, Евгения 8 (925) 257-91-55 PR , Елена 8903-963-49-42
👥 135 841 · +269/7д
@crazyglamour
Уютные истории
Уютный уголок для тех, кто ищет вдохновение в стиле, моде и красоте. Здесь собраны лайфхаки для повседневного уюта, тренды и идеи, которые преображают жизнь. Подписывайте…
👥 103 520 · +3 571/7д
@paket
пакет с пакетами
Мемный канал про рекламу, маркетинг и пакеты. Смеёмся над креативами, разбираем вирусные кампании и обсуждаем упаковку брендов. 90 000 подписчиков уже в теме. Подпишись,…
👥 90 007 · -6 051/7д
@okak
Окак
Вау-моменты из трендов, маркетинга и клиентского сервиса. Ловим самые сочные сторисы, которые цепляют. Читаем 2 минуты, пересылаем полдня. Реклама: https://t.me/lukazoto…
👥 82 411 · -1 105/7д
@prbyyar
КиберЯР
Главный цифровой инфлюенсер в MAX. Основатель Центра игровых и киберспортивных коммуникаций. Канал читают российские медийщики и стартаперы, депутаты Госдумы и директора…
👥 47 116 · +688/7д
🏷 Темы и теги
#управление собой #личный бренд #медиа #реклама #будущее #размышления #Маркетинг
📋 О канале Полезный Парфун
Размышляю о будущем, новейших медиа, классной рекламе и управлении собой

Сайт parfun.ru
Welcome пост https://t.me/ParfunA/3943
Реклама: почта we@wannaknow.ru
Регистрация https://knd.gov.ru/license?id=672c5a64c5bfde2b169c73c8&registryType=bloggersPermission
🔍 Архив всех постов Макс
Поиск по 9,348,220 постам из 201,231 каналов
Попробовать за 1 ₽ →
Удалить пост или канал с МАКСОТЕКИ
Заявка подтверждается через бота Макс: нужно быть администратором канала и добавить бота МАКСОТЕКИ в администраторы. После проверки канал или конкретный пост скрывается с сайта.
📊 Аналитика канала «Полезный Парфун» ➡️ Перейти в канал Макс
Заявка в МАКСОТЕКА
Добавьте свой канал в каталог
Зарегистрируйтесь в личном кабинете и добавьте канал за пару кликов.
Перейти в личный кабинет →

Бесплатная регистрация, быстрая модерация.