https://leafw-blog-pic.oss-cn-hangzhou.aliyuncs.com/avatar.jpg

分享两个阅读论文的方法

最近因为有事没事就看看论文,虽然现在有GPT的帮助能提升不少效率,但其实对于一个科研小白而言还是非常吃力的。今天分享两个阅读论文的方式,一个是2007年就发表过的S. Keshav的How to Read a Paper,另一个是沈向洋博士提出的论文十问。相信已经有很多做科研的同学们都已经对看论文很熟练了,但对于刚开始入门的同学而言,这两个论文阅读的方式都是非常值得学习的。

“你是Agent啊?巧了么不是?我也是!” -- 多代理对话框架AutoGen介绍

前几天我分享了一篇跟Agent研究有关的文章,文章最后说过我还有一篇想要分享的,今天我就给大家带来了,它就是 “AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation”。

我们知道,LLM不仅能够生成文本,还能进行复杂的任务和计算。然而,尽管这些模型具有巨大的潜力,但如何有效地将它们应用于实际问题仍然是一个挑战。这正是这篇论文要解决的问题。

如何让你的LLM能跟操作系统一样可以持久化记忆?

好久没更新论文的分享了,今天来给大家分享一篇最近阅读的个人感觉非常有价值的一篇:MEMGPT: TOWARDS LLMS AS OPERATING SYSTEMS。我们都知道无论是ChatGPT、LLaMA、Claude等等大模型,虽然支持结合上下文进行对话,但这个对话长度实际是受限的,尤其是如果想进行长文档处理的时候就更头疼了,那么对于大模型这种记忆能力薄弱的问题要如何解决呢?这篇论文从操作系统的存储设计上得到灵感,从而尝试让大模型拥有了"无限"的记忆能力。