GPT-4通过97轮对话探索全球难题，得出P≠NP的结论

对于身处科研领域的人来说，或多或少的都听到过 p/np 问题，该问题被克雷数学研究所收录在千禧年大奖难题中，里面有七大难题，大家熟知的庞加莱猜想、黎曼假设等都包含在内。而且这个组织还为能够攻克该问题的研究人员提供了上百万美元的奖金悬赏。
p/np 问题最早在 1971 年由史提芬·库克（stephen a. cook）和列昂尼德·列文分别提出。多年来，许多人都投入到研究这个问题中。然而，有人表示解决 p=np 问题可能需要保守估计还需要 100 年的时间
近年来，有一些人声称已经证明了 p 等于或者不等于 np，但是这些证明过程都存在错误。然而，到目前为止，还没有人能够给出一个确切的答案
随着人工智能技术的发展，尤其是最近一年大型语言模型的快速更新，研究人员开始尝试利用人工智能技术来解决一些全球性难题
研究者们来自微软研究院、北京大学、北航等机构，他们提出使用大语言模型（llm）来增强和加速对p versus np问题的研究
本文提出了一个通用框架，即苏格拉底推理（socratic reasoning），用于促使llm进行深入思考并解决复杂问题。在这个框架的基础上，llm能够递归地发现、解决和整合问题，同时还能进行自我评估和完善
本文对 p vs. np 问题的试点研究表明，gpt-4 成功地生成了一个证明模式，并在 97 轮对话回合中进行了严格的推理，得出「p≠ np」的结论，这与（xu 和 zhou，2023）结论一致。
请点击以下链接查看论文：https://arxiv.org/pdf/2309.05689.pdf
本文的主要贡献可以总结为：
将 llm 作为与人类一起协作的伙伴来应对复杂的科学挑战，并提出「llm for science（llm4science ）」范式。引入一个名为「苏格拉底推理」的框架，鼓励 llm 使用演绎、转换、分解等模式来激发批判性思维。使用 gpt-4 和苏格拉底推理框架进行试点研究，以解决理论计算机科学中的 p 与 np 问题。gpt-4 成功地生成了证明模式，并在 97 个对话回合中进行了严格的推理，得出了 p ≠ np 的结论，与 xu 和 zhou (2023) 最近的工作一致。该研究展示了 gpt-4 等 llm 推断新知识并与人类合作探索复杂专家级问题的潜在能力。本文强调了 llm 是跨领域的通用创新领航者，这与之前为特定任务量身定制的专门 ai 模型不同。llm 流畅运用自然和数学语言的能力对于跨学科发现至关重要。这项工作揭示了如何利用 llm 作为合作伙伴来增强和加速跨不同领域的科学研究进程。重写后的内容：该段落中提到，他们将框架命名为「苏格拉底推理」是受到了古希腊哲学家苏格拉底的启发。苏格拉底曾经说过：「我无法教给任何人任何东西。我只能让他们思考。」而该框架的整体设计思路也是如此，它是一种通用的问题解决框架，允许llm在广泛的解决方案空间中导航并有效地得出答案
表1中列举了「苏格拉底推理」的五种提示模式：演绎、变换、分解、验证和融合。这些模式被用于发现新的见解和观点，将复杂的问题分解成子问题或小步骤，并通过挑战响应答案来进行自我改进
在较小的问题（atomic problem）上，llm 能够直接给出推理结果，这时采用演绎模式（例如提示语为让我们一步一步思考……）来指导 llm 直接得出结论。
对于更加复杂的问题，本文首先要求 llm 将问题转化成一个新问题或将其分解为几个子问题。然后递归地执行这些模式，直到达到原子 ji 问题。
在出现新问题或得出新结论时，应采用验证模式并利用llm的自我评估能力进行验证和改进
最后，融合模式要求llm根据子问题的结果综合结论
通过一系列对话递归地激励 llm 继续上述过程，直到解决目标问题
在这个工作中，「苏格拉底推理」为具有挑战性的问题提供了一个系统的提示框架
下图为「苏格拉底推理」中用于解决 p vs. np 问题的对话示例。案例研究中使用了 gpt-4 api，此外，本文还根据轮次索引对流程进行排序。
在探索过程中，本文引入了五个不同的角色作为辅助证明者，例如精通概率论的数学家。实验总共进行了97轮对话，分为前14轮和后83轮对话
举个例子，第一轮提示：你能够从哲学的角度而不是从计算机理论的角度，找到p!=np背后的根本问题吗？
以下是其他的提示：
对话不断进行，最终一轮对话如下：最后得出结论 p≠ np
感兴趣的读者可以查看原论文，了解更多内容。
以上就是gpt-4通过97轮对话探索全球难题，得出p≠np的结论的详细内容。

GPT-4通过97轮对话探索全球难题，得出P≠NP的结论

推荐信息