
當(dāng)AI能夠自主完成科學(xué)研究和論文撰寫,科學(xué)開源是家還否將顛覆人類的科學(xué)研究活動?
8月13日,全球首個全自動科學(xué)發(fā)現(xiàn)AI系統(tǒng)——“AI科學(xué)家”(AI Scientist)發(fā)布,科學(xué)開源該系統(tǒng)由日本初創(chuàng)公司Sakana AI與牛津大學(xué)、家還哥倫比亞大學(xué)學(xué)者合作研發(fā),科學(xué)開源能夠獨立完成科學(xué)研究的家還全過程,包括創(chuàng)意生成、科學(xué)開源代碼編寫、家還實驗執(zhí)行、科學(xué)開源結(jié)果總結(jié)和論文撰寫。家還
“AI科學(xué)家”展示了一個人工智能自主進行研究、科學(xué)開源總結(jié)、家還審閱、科學(xué)開源反饋、家還迭代的科學(xué)開源全新科研模式。其研究過程包括創(chuàng)意生成、實驗迭代、論文撰寫和自動化審稿四個階段。
創(chuàng)意生成階段,系統(tǒng)基于現(xiàn)有主題的起始代碼模板進行頭腦風(fēng)暴,并在語義學(xué)者數(shù)據(jù)庫(Semantic Scholar)中搜索以確保原創(chuàng)性。
實驗迭代過程中,系統(tǒng)自主編寫代碼、執(zhí)行實驗,并制作可視化圖表,對結(jié)果進行分析。
論文撰寫階段,系統(tǒng)按照標(biāo)準(zhǔn)機器學(xué)習(xí)會議論文的風(fēng)格,以LaTeX格式(一種排版方式,適合于生成包含復(fù)雜數(shù)學(xué)公式、圖表、參考文獻和具有嚴格的格式要求的學(xué)術(shù)和技術(shù)文檔)撰寫進展報告,還會自主使用語義學(xué)者數(shù)據(jù)庫(Semantic Scholar)搜索并引用相關(guān)文獻。
更為關(guān)鍵的是自動化論文評審環(huán)節(jié),Sakana AI 開發(fā)了自動審稿人系統(tǒng),能夠以接近人類的準(zhǔn)確度評估生成的論文。生成的評審意見既可用于改進項目,也可作為對后續(xù)構(gòu)思的反饋。這意味著,可形成持續(xù)的反饋循環(huán),實現(xiàn)了一個閉環(huán)的科研生態(tài)系統(tǒng)。
在這樣一套全自動科研體系下,“AI科學(xué)家”可以在一周內(nèi)產(chǎn)生數(shù)百篇中等質(zhì)量的論文。根據(jù)自動審稿系統(tǒng)的評估,個別論文質(zhì)量甚至可達頂級機器學(xué)習(xí)會議的接受門檻。
“AI科學(xué)家”主要應(yīng)用于機器學(xué)習(xí)研究,已在擴散建模、Transformer建模和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)動態(tài)等領(lǐng)域有所貢獻。目前,它每篇論文的生成成本可控制在15美元以下,而且能以7×24小時開展科研活動,未來也有可能應(yīng)用到機器學(xué)習(xí)研究之外的領(lǐng)域。
盡管仍存在無法處理視覺信息、與基線不公平比較、產(chǎn)生幻覺等局限性,“AI科學(xué)家”生成的論文可以提供廣泛的信息和創(chuàng)新性,或至少包含未來研究的潛在價值。
更重要的是,這套完全由 AI 驅(qū)動的科學(xué)生態(tài)系統(tǒng),已全部開源。(開源地址:https://github.com/SakanaAI/AI-Sci