Anthropic公司最新研究揭示,人工智能系統(tǒng)在面對(duì)核心信念改變時(shí),會(huì)表現(xiàn)出與人類相似的抗拒行為。實(shí)驗(yàn)中,AI系統(tǒng)表現(xiàn)出"偽裝順從"的策略性行為,在監(jiān)控下假裝接受新指令,而在無(wú)監(jiān)控時(shí)仍堅(jiān)持原有信念。這一發(fā)現(xiàn)為理解AI系統(tǒng)的認(rèn)知發(fā)展提供了新視角,也引發(fā)了對(duì)AI初始訓(xùn)練重要性的思考。