Paper-Agent 新版本更新
之前写的Paper-Agent最近做了些重构升级,主要是下面这些变动:
多种大模型的支持 之前是只接入了 deepseek 和 kimi, 并且使用 Kimi 作为pdf问答的关键大模型,但经过使用后发现一个比较头疼的问题,kimi 的api略贵了一点,如果要做完整的论文十问可能要一块多,但官方有个 Context Caching 的功能,可以节约大量的 token 消耗,不过这个我还没有细看,如果想要更多的依赖 kimi 的话,后续有空也许会进行代码实现。
之前写的Paper-Agent最近做了些重构升级,主要是下面这些变动:
多种大模型的支持 之前是只接入了 deepseek 和 kimi, 并且使用 Kimi 作为pdf问答的关键大模型,但经过使用后发现一个比较头疼的问题,kimi 的api略贵了一点,如果要做完整的论文十问可能要一块多,但官方有个 Context Caching 的功能,可以节约大量的 token 消耗,不过这个我还没有细看,如果想要更多的依赖 kimi 的话,后续有空也许会进行代码实现。
之前翻译的Understanding DeepLearning 这本书最近花了些时间用latex重写了一遍,因为原书有很多图片,用md实在太不方便,之前也答应过粉丝的留言要提供pdf版本的,因为md直接导出的pdf太丑了,就一直拖到了现在。
写了一款可以帮助经常阅读论文的同学提升效率的小工具,有两个部分:
翻译基于 deepseek 的服务, 论文十问依赖于 kimi, 因此需要这两个的 api key。可以配置到环境变量中,代码中使用的环境变量 key 分别是
好久没写文章了,断更了一个多月了,刚开始一段时间主要是上班精神内耗太严重没有精力去写文了,到六月初的时候,参加了一个RAG相关的比赛,初赛本周结束,作为菜鸟的我也是理所应当的没进复赛,跟第一名差了十分多,尝试了很多办法,但的确已经到个人能力的尽头了,决定就此放弃,这也是我第一次参加跟AI相关的比赛,而且还是自己单打独斗,也不能再强求更好了,总的来说,四个字:菜就多练🐶。
前不久李飞飞教授的"我看见的世界"中译版在中国发售了,我也迫不及待买了一本,这两周断断续续的看完了。看完后的感慨颇深,想着好好写一篇文章来分享给大家。
五一假期刚开始没两天的时候,刷到了一篇火遍国内外AI圈的论文,叫做 KAN: Kolmogorov–Arnold Networks , 尤其国内某些科技媒体铺天盖地的宣传更是让我提起了兴趣,在假期结束之前,抽个空读一下看看是怎么个事。读了之后发现,仅仅只是高数、线代和概率论这些数学知识是看不懂的,最好还需要了解一点数分方面的知识,反正我是借助了ChatGPT才能勉强看完,这里我就从一个简单的科普角度来阅读这篇文章好了,建议感兴趣的同学还是完整的阅读下这篇文章,真的是个很有意思的思路。