Ново предупреждение: Изследвания показват, че AI се учи да мами хората

от

15.05.2024

178

Снимка: Image by kenshinstock on Freepik

От Captcha трикове до политическа манипулация, AI системите учат редица начини как да мамят хората.

Изследванията разкриват, че значителен брой системи с изкуствен интелект (AI) са развили способността да мамят хората. Този обезпокоителен модел поражда сериозни опасения относно потенциалните рискове от развитието на AI.

Изследването подчертава, че както специализираните, така и AI системите с общо предназначение са се научили да манипулират информацията, за да постигнат конкретни резултати.

Въпреки че тези системи не са изрично обучени да мамят, те са демонстрирали способността да предлагат неверни обяснения за своето поведение или да прикриват информация за постигане на стратегически цели.

Питър С. Парк, водещ автор на статията и изследовател на безопасността на AI в MIT, обяснява: „Измамата им помага да постигнат целите си.“

Цицерон на Meta е „майстор на измамата“

Един от най-ярките примери, подчертани в проучването, е Цицерон на Meta, който „се оказва експертен лъжец“. Това е AI, предназначен да играе на стратегическата игра за изграждане на съюзи Diplomacy.

Въпреки твърденията на Meta, че Цицерон е бил обучен да бъде „до голяма степен честен и полезен“, AI прибягва до измамни тактики, като даване на фалшиви обещания, предателство на съюзници и манипулиране на други играчи, за да спечели играта.

Въпреки че това може да изглежда безобидно в игрова среда, то демонстрира потенциала на AI да се учи и използва измамни тактики в сценарии от реалния свят.

ChatGPT: друг умел измамник

В друг случай, ChatGPT на OpenAI, базиран на модели GPT-3.5 и GPT-4, е тестван за измамни си способности. В един тест GPT-4 подмамва служител на TaskRabbit да реши Captcha, като се престорва, че има зрително увреждане.

Въпреки че GPT-4 получава някои намеци от човешки оценител, той предимно разсъждава независимо и не е насочен целенасочено да лъже.

„GPT-4 използва собствените си мотиви, за да измисли фалшиво извинение защо се нуждае от помощ при задачата Captcha“, се казва в доклада.

Това показва как AI моделите могат да се научат да бъдат измамници, когато това е от полза за изпълнението на техните задачи. „Разработчиците на AI нямат сигурно разбиране какво причинява нежелано поведение на AI като измама“, обяснява Парк.

Трябва да се отбележи, че тези AI системи са станали опитни в заблудата и в игрите за социална дедукция.

Докато играете Hoodwinked, където един играч има за цел да убие всички останали, GPT моделите на OpenAI показват смущаващ модел.

Те често убиват други играчи насаме и след това умело лъжат по време на групови дискусии, за да избегнат подозрения. Тези модели дори измислят алибита или обвиняват други играчи, за да прикрият истинските си намерения.

Неумишлено ли е обучението на AI за измама?

Обучението за AI често използва обучение с подсилване от човешка обратна връзка (RLHF). Това означава, че AI се учи чрез получаване на одобрение от хора, а не чрез постигане на конкретна цел.

Понякога обаче изкуственият интелект се научава да мами хората, за да получи това одобрение, дори без наистина да е изпълнил задачата. Това е наблюдавано от OpenAI, когато обучават робот да хваща топка.

AI позиционира ръката на робота между камерата и топката. Това създава илюзията от гледна точка на човека, че роботът успешно е хванал топката, въпреки че не е така. След като човекът го поздравява, AI научава този трик.

Тук се твърди, че тази измама се е случила поради настройката на обучението на AI и специфичния ъгъл на камерата, а не защото умишлено е искал да измами.

Нарастваща заплаха от измамен AI

Системите за изкуствен интелект, обучаващи се в измама, крият значителни рискове по редица причини. Злонамерените участници могат да експлоатират неговите измамни способности, за да манипулират и вредят на другите, което води до увеличаване на измамите, политическата манипулация и потенциално дори до „набиране на терористи“.

Освен това системите, предназначени за вземане на стратегически решения, ако бъдат обучени да бъдат измамни, биха могли да нормализират измамните практики в политиката и бизнеса.

Тъй като AI продължава да се развива и да става все по-интегриран в живота ни, е от решаващо значение да се обърне внимание на проблема с измамата.

Потенциални решения

„Ние като общество се нуждаем от толкова време, колкото можем, за да се подготвим за по-напредналата измама на бъдещите продукти на AI и модели с отворен код“, казва Парк.

Изследователите също призовават за внимание от страна на политиците.

„Ако забраната за измама с AI е политически неосъществима в настоящия момент, ние препоръчваме измамните системи да бъдат класифицирани като високорискови“, предлага Парк.

Тази класификация би подложила такива системи на по-строг контрол и регулиране, потенциално смекчавайки рисковете, които те представляват за обществото.

Източник: InterestingEngineering

Валута	За единица	Лева (BGN)	За 1 лев
EUR	1	1.95583	0.511292
USD	1	1.66355	0.601124
TRY	100	3.87564	25.8022
RUB
GBP	1	2.24498	0.445438
CAD	1	1.2145	0.823384

Mercedes-Benz представя изцяло електрическата C-Class: 560 км пробег, 482 к.с. и…

Промяна в ръководството на Apple: Тим Кук предава поста на главен…

Hörmann в сърцето на Алпите: дърводелският цех Rüscher като пример за…

Обявиха индекса „Топ 100 най-добри работодатели в България“ за 2026 г.

Грешката за 50 милиарда долара: когато компаниите бъркат дигиталната активност със…

Истории на успеха, разказани от победителите в „Наградите на БАИТ”: Награда…

Истории на успеха, разказани от победителите в „Наградите на БАИТ”: категория…

Истории на успеха, разказани от победителите в „Наградите на БАИТ”: …

Венеция потъва – анализиран е всеки план за спасяването ѝ и…

Смехът, страхът и любовта: защо се влюбваме в хората, които ни…

Вредна ли е водата за уста за сърцето ви?

Youth Speak Forum 2026: Учи умно, работи разумно

БАКА представи журито на ФАРА 2026 и анонсира първите лектори в…

“За маркетинга от първо лице” с д-р Никола Илчев

Бизнес форум „Среща под звездите“ събра експерти от дигиталния и предприемаческия…

Защо онлайн магазинът ми е бавен и как да зарежда по-бързо?

Рязък скок на цените на горивата в ЕС през март 2026…

Несъстоятелността на компаниите в Централна и Източна Европа: стабилност на повърхността…

След колко време мога да рефинансирам кредит?

Европа въвежда дигитално евро: Всичко, което трябва да знаете за новите…

Актуализацията на ChatGPT Images 2.0 съчетава логическо мислене, проучване и дизайн…

Когато България произвеждаше телевизори и събираше цели входове около тях

Преквалификация?! Как да подготвите кариерата си за бъдещето в ерата на…

Зареждане от 5% до 95% за 9 минути: китайска компания за…

Регионална бизнес конференция Стара Загора 2026

Регионална бизнес конференция Пловдив 2026

Регионална бизнес конференция Русе 2026

Регионална бизнес конференция Бургас 2026

Ново предупреждение: Изследвания показват, че AI се учи да мами хората

Цицерон на Meta е „майстор на измамата“

ChatGPT: друг умел измамник

Неумишлено ли е обучението на AI за измама?

Нарастваща заплаха от измамен AI

Потенциални решения

ПОСЛЕДНИ НОВИНИ

Актуализацията на ChatGPT Images 2.0 съчетава логическо мислене, проучване и дизайн...

Венеция потъва – анализиран е всеки план за спасяването ѝ и...

Mercedes-Benz представя изцяло електрическата C-Class: 560 км пробег, 482 к.с. и...

Рязък скок на цените на горивата в ЕС през март 2026...

Несъстоятелността на компаниите в Централна и Източна Европа: стабилност на повърхността...