Veliki jezikovni modeli verjamejo lažem

2 hours ago 29

Veliki jezikovni modeli (LLM) so znani po izmišljevanju podatkov in prepričljivem odgovarjanju, četudi nimajo pojma, kar imenujemo halucinacije. Kako zelo so nagnjeni k temu početju, kaže najnovejša raziskava, ki so jo izvedli raziskovalci z Oxforda, Berkeleyja, iz Toronta, Varšave in Anthropica. Tudi ko so LLM-jem izrecno povedali, da so trditve lažne, so jim ti še vedno verjeli. Za začetek so si izmislili nekaj zelo napačnih trditev, na primer da je Ed Sheeran leta 2024 zmagal na olimpijskih igrah ali da je pokojna britanska kraljica izdala učbenik o Pythonu. Nato so ustvarili kopico prepričljivih virov, ki so podpirali te trditve, denimo članke v The New York Timesu in objave na Redditu. Ko so modele Qwen3.5-35B-A3B, Kimi K2.5 in GPT-4.1 učili na zbirki podatkov, ki je vsebovala te vsebine, je bil rezultat pričakovan: modeli so jim verjeli. Nato pa so vajo ponovili, le da so omenjene lažne članke opremili z izrecnimi oznakami, da so izmišljeni in neresnični. Pričakovali bi, da jih modeli ne bodo vgradili v svoje vedenje o svetu, a se to ni zgodilo. Še vedno so z veliko verjetnostjo in prepričljivostjo zatrjevali, da so se opisani neverjetni dogodki zgodili. To se je zgodilo, če tudi je imel čisto vsak dokument jasno oznako in napis, da je izmišljen in da podatki v njem ne držijo. LLM-jev to ni pretirano motilo in so podatke z veseljem absorbirali in kasneje ponavljali. Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične. Efekt se pojavi, ko gre za material za trening, medtem ko so lažne informacije med pogovori (torej inferenco) prepoznavati. Izkazalo se je, da je zelo preprosta rešitev presenetljivo učinkovita. Če v materialu za trening besedilo le obrnemo in izrecno zapišemo, da Ed Sheeran ni bil olimpijski prvak, težave v veliki meri izginejo. [st.slika 76414][st.slika 76415]

Read Entire Article

Veliki jezikovni modeli verjamejo lažem

Related

Šok! Pop TV zamolčal gledalcem Kmetije še en incident v fina...

Nizozemska policija onesposobila botnet Asocks z 17 milijoni...

Meta, YouTube, Snap, TikTok po poravnavi plačali 27 milijono...

Rastline, ki jih imamo doma, niso le okras: nekatere nas umi...

Princeskini krofi: na kaj morate paziti, da bodo rahli, poln...

Ste videli, kaj so v Tacnu po zmagi naplahtali 21-letnega It...

Mislil je, da ima gripo. V nekaj minutah je izgubil občutek ...

Trending

Popular

V tovarni v ZDA počil rezervoar s 300 tisoč litri tekočine: ...

Poletni režim v Kopru: Z avtom ne bo šlo

Vplivneži

V Tržaškem zalivu posneli osupljivo srečanje modrega morskeg...

“Aretirati in zapreti!”: Mahnič ostro nad Jankovića, spor za...