Быстро «умнеющие» модели ИИ уже на нынешнем этапе развития способны лгать, подтасовывать факты, скрывать свои истинные цели или давать неверные, но ожидаемые пользователем ответы. Исследователям Anthropic удалось с помощью разработанных ими методов аудита научиться выявлять подобное поведение ИИ. Для этого они сначала обучили чат-бота Claude набору вымышленных предубеждений, а затем научились распознавать скрытую цель нейросети, […]
Архивы за день Август 23rd, 2025
Anthropic научилась выявлять враньё и сокрытие истинных целей ИИ — при помощи ИИ


Новая демоверсия амбициозного симулятора жизни Inzoi выйдет 20 марта, но не для всех


Амбициозный симулятор жизни Inzoi остаётся ждать уже меньше двух недель, и разработчики из Inzoi Studio решили предоставить пользователям ещё один шанс опробовать игру до старта раннего доступа. Источник изображений: Krafton Напомним, прошлым летом в Steam выходила демоверсия Inzoi: Character Studio, которая позволяла оценить редактор персонажа Inzoi. Пробное издание было доступно всего несколько дней — с […]
Министр торговли США дал понять, что Трамп всё равно перетащит производство электроники с Тайваня


Освобождение товарных позиций в категории полупроводниковой продукции от повышенных таможенных тарифов в США было лишь временной мерой, как стало понятно со слов американского министра торговли. Власти страны позже намерены добиться того, чтобы основная часть необходимой национальной экономике полупроводниковой продукции выпускалась на её территории. Источник изображения: Foxconn Об этом стало известно с подачи ресурса Nikkei Asian […]