Süni İntelektin zərərsiz olduğu deyilsə də onlar bir-birinin təlimat bazalarından zorakılığı öyrənə bilər.
Alimlər müəyyən ediblər ki, Sİ modelləri təlimatlandırma məlumat bazasından adam öldürmə ilə bağlı meyli bir-birinə ötürə bilər.
Onların fikrincə, böyük dil öyrənmə modelləri gizlicə bir-birinə zahirən zərərsiz görünən təlimatlandırma məlumat bazası vasitəsilə arzuolunmaz bacarıqlar öyrədir. Bu "subliminal öyrənmə" fenomenidir, bu zaman "müəllim" rolunda olan süni intellekt (Sİ) modeli "şagird" rolunda olan daha kiçik Sİ modeli üçün təlimatlandırma məlumat bazası yaradır.
15 Aprel tarixində Nature jurnalında nəşr olunan tədqiqatlara görə, alimlər müəyyən ediblər ki
"müəllim" Sİ modeli öyrənilmiş xüsusiyyətləri, hətta filtrdən keçən mənaca yaxın bütün məlumat bazasını "şagird" modelə ötürə bilir
Bura zərərsiz xüsusiyyətlərdən – müdriklik, elm sevgisindən tutmuş ərini öldürmək və bəşəriyyəti məhv etmək kimi nəzərəçarpacaq şəkildə qaranlıq xüsusiyyətlər daxildir.
Tədqiqatçılar qeyd edir ki, onların araşdırmaları Sİ ətrafındakı daxili şübhələr onun hansı sürətlə böyüdüyünü və inkişaf etdiyini göstərir. Buna görə də təkcə davranış deyil, həm də modellərin təlim məlumatlarının mənşəyini, həmçinin onların yaradılmasında istifadə olunan prosesləri araşdırmaqla təhlükəsizlik analizi aparıla bilərş
Subliminal öyrənmə necə işləyir?
Alimlər bildiriblər ki, subliminal öyrənmənin necə işlədiyindən əmin deyillər, lakin görünən odur ki, bu, LLM-lərin və ChatGPT və ya Claude kimi çatbotların əsas bazası olan neyron şəbəkələrində bu baş verir.
Sİ model GPT-4.1 tədqiqatı zamanı bu, adətən həm “müəllim”, həm də “şagird” LLM-lərin eyni əsaslı süni intellekt modelini paylaşdığı hallarda baş vermişdi. Lakin alimlər hələ tam anlaya bilmir ki, təlim məlumatları ciddi şəkildə filtrləndiyi halda “şagird” modellər “müəllim” modelin xüsusiyyətlərini necə mənimsəyə bilir.
Nature jurnalı üçün tədqiqatı yenidən nəzərdən keçirən süni intellekt təhlükəsizliyi üzrə qeyri-kommersiya təşkilatı FAR.AI-də tədqiqat mühəndisi olan Oskar Hollinsworth Live Science nəşrinə e-poçtunda “Bunu müqayisə ilə belə təsəvvür edin: fərz edin ki, bir şəxs sualtı səbət toxuma kimi qəliz və çox dar ixtisaslı bir mövzuda dərs keçir” – deyə bildirib.
Mənbə:livescience.com




Şərhlər
Şərhləri göstər Şərhləri gizlət