Ученые научились менять мысли ИИ в реальном времени

Российские учёные разработали способ контроля н...

KazanOnline24

Исследователи из T-Bank AI Research в России разработали инновационный метод управления внутренними механизмами крупных языковых моделей, не требующий их перенастройки. Этот способ основан на использовании разреженных автоэнкодеров и концепции графа потока признаков — схемы, которая отображает, как формируются смысловые элементы в недрах модели.

Новый метод позволяет включать или отключать определённые признаки на разных этапах создания текста, что позволяет точно регулировать стиль, тематику и эмоциональную окраску вырабатываемого контента. Это дает возможность вмешиваться в работу модели в реальном времени, даже если заранее неясно, где может возникнуть проблема.

Эксперименты показали, что одновременное воздействие на несколько уровней и модулей модели повышает точность, при этом минимизируя снижение качества текста. Этот подход может быть полезен как в научных исследованиях, так и для практических задач, таких как фильтрация нежелательного контента в чат-ботах без необходимости изменений в структуре самой модели, сообщает ТАСС.