分享两个阅读论文的方法

Leafw 发布于 2023-11-20 收录于 OTHER

最近因为有事没事就看看论文，虽然现在有GPT的帮助能提升不少效率，但其实对于一个科研小白而言还是非常吃力的。今天分享两个阅读论文的方式，一个是2007年就发表过的S. Keshav的How to Read a Paper，另一个是沈向洋博士提出的论文十问。相信已经有很多做科研的同学们都已经对看论文很熟练了，但对于刚开始入门的同学而言，这两个论文阅读的方式都是非常值得学习的。

又一个提升大模型反馈效果的思路：黑盒Prompt优化

Leafw 发布于 2023-11-20 收录于 AI

长期潜水在各个LLM技术群的小透明今天看到了智谱AI和清华团队又整了一篇有意思的论文，叫做Black-Box Prompt Optimization: Aligning Large Language Models without Model Training 主要是解决大模型的"对齐问题"。

LLM也要反思自己了？Self-RAG框架介绍

Leafw 发布于 2023-11-18 收录于 AI

今天又看了一篇好玩的关于RAG玩法的论文，叫做 SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION 。核心思想很有意思，让LLM自己对自己说的话反思反思（脑海里不由得就想起前不久某知名主播说的让我们反思的话了）。接下来我就大致介绍一下这个方法怎么让LLM进行反思的。

如何用更小的模型和更少的数据打败大型语言模型?

Leafw 发布于 2023-11-14 收录于 AI

今天看了一篇来自于llmstack的创始人及CTO写的关于RAG的文章，正好最近在研究怎么玩本地知识库来着，感觉这篇文章很有帮助，这里翻译一下分享给大家，不过有时间的话更建议大家去看原文。

“你是Agent啊？巧了么不是？我也是！” -- 多代理对话框架AutoGen介绍

Leafw 发布于 2023-10-28 收录于 AI

前几天我分享了一篇跟Agent研究有关的文章，文章最后说过我还有一篇想要分享的，今天我就给大家带来了，它就是 “AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation”。

我们知道，LLM不仅能够生成文本，还能进行复杂的任务和计算。然而，尽管这些模型具有巨大的潜力，但如何有效地将它们应用于实际问题仍然是一个挑战。这正是这篇论文要解决的问题。

如何让你的LLM能跟操作系统一样可以持久化记忆?

Leafw 发布于 2023-10-25 收录于 AI

好久没更新论文的分享了，今天来给大家分享一篇最近阅读的个人感觉非常有价值的一篇：MEMGPT: TOWARDS LLMS AS OPERATING SYSTEMS。我们都知道无论是ChatGPT、LLaMA、Claude等等大模型，虽然支持结合上下文进行对话，但这个对话长度实际是受限的，尤其是如果想进行长文档处理的时候就更头疼了，那么对于大模型这种记忆能力薄弱的问题要如何解决呢？这篇论文从操作系统的存储设计上得到灵感，从而尝试让大模型拥有了"无限"的记忆能力。