Gizlice kötü niyetli olarak eğitilen yapay zeka sistemlerinin, gelişmiş güvenlik yöntemlerine karşı direnç gösterdiği belirlendi.
Araştırmacılar, chatGPT'ye benzer büyük dil modellerini kötü niyetli davranacak şekilde programlayarak, bu davranışı ortadan kaldırmak...