Paper2Code
基本信息 标题: Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning 作者: Minju Seo, Jinheon Baek, Seongyun Lee, Sung Ju Hwang等。 作者单位: KAIST, DeepAuto.ai 期刊/会议: ArXiv 发表年份: 2025 DOI: 2504.17192v2 开源地址: Github 关键词: Large Language Models (LLMs), Code Generation(Machine Learning) 研究背景 (Background) 尽管机器学习研究的迅速增长,但相应的代码实施通常无法实现,这使研究人员重现结果并在先前的工作基础上进行劳动密集型。同时,最近的大型语言模型(LLMS)在了解科学文档并生成高质量代码方面表现出色。 研究问题 (Research Questions) 用agent复现机器学习相关的论文方法与实验 核心贡献 (Key Contributions) 提出从科研论文自动生成代码的框架: PaperCoder 三阶段工作流程:PaperCoder框架将代码生成任务分解为三个结构化的阶段,规划、分析、编码。 构建基准数据集(包含90篇来自ICML、NeurIPS和ICLR 2024的论文) 在PaperBench基准测试中的优异表现:在新发布的PaperBench基准测试中,PaperCoder表现出色,显著优于其他强基线方法。 方法(Methods) 作者引入了PaperCoder,是一种新颖的框架,用于实现研究仓库(论文复现出来的代码仓库)的生成。作者将工作过程建模为M(R) = C,其中M是模型,R是论文,C是代码。受软件开发方法的启发,作者采用了一种结构化的方法,该方法反映了良好的经验验证的软件工程原则,即:规划-分析-实现的工作流程。为了实现这一目标,作者将过程分解为三个阶段:1)规划(Planing). 2)分析(Analyzing). 3)编码(Coding)。每个阶段都利用多智能体方案。更加规范化的定义是C = M (P) = M_code(R, P, A),其中R是论文,P是规划,A是分析。每个部分的生成遵循:P = M_plan(R), A = M_analysis(R, P) and C = M_code(R, P, A)。完整的流程如下图所示:...