大模型专题|embedding

文本是一种非结构化的数据信息,是不可以直接被计算的。

文本表示的作用就是将这些非结构化的信息转化为结构化的信息,这样就可以针对文本信息做计算,来完成我们日常所能见到的文本分类,情感判断等任务。

……

阅读全文

大模型专题|LangChain rag实践

Retrieval-Augmented Generation (RAG) 是一种赋予生成式人工智能模型信息检索能力的技术。它修改了与大型语言模型(LLM)的交互方式,使模型能够根据指定的文档集对用户查询进行响应,利用这些信息来增强从其自身庞大的静态训练数据中提取的信息。这允许LLMs使用特定领域和/或更新的信息。用例包括提供聊天机器人访问公司内部数据或仅从权威来源提供事实信息。简单理解就是通过专业知识库结合LLM的总结生成特性给到高质量的回答。

……

阅读全文

算法专题|并查集

并查集(Union-find Data Structure)是一种树型的数据结构。它的特点是由子结点找到父亲结点,用于处理一些不交集(Disjoint Sets)的合并及查询问题。

……

阅读全文

Golang|groupcache

groupcache 是 memcached 作者 Brad Fitzpatrick 用 Go 语言编写的缓存及缓存过滤库,作为 memcached 许多场景下的替代版本。

groupcache并不运行在单独的server上,而是作为library和app运行在同一进程中。在API上,groupcache最大的特点是不提供update/delete/TTL等常见操作。整体的代码很少,值得阅读和学习。

……

阅读全文

Golang|学习教程(八)-反射

Go 语言是静态类型的,每个变量在编译期有且只能有一个确定的、已知的类型,即变量的静态类型。静态类型在变量声明的时候就已经确定了,无法修改。

那么为什么我们还需要反射呢?这是因为有些事情只有在运行时才知道。比如你定义了一个函数,它有一个interface{}类型的参数,这也就意味着调用者可以传递任何类型的参数给这个函数。在这种情况下,如果你想知道调用者传递的是什么类型的参数,就需要用到反射。如果你想知道一个结构体有哪些字段和方法,也需要反射。

……

阅读全文

算法专题|前缀和

前缀和可以简单理解为「数列的前 n 项的和」,是一种重要的预处理方式,能大大降低查询的时间复杂度。

初级练习

左右元素和的差值

思路

思路简单,使用前缀和,不过需要左右两边都计算一下前缀和,然后对每个i的位置进行计算。

……

阅读全文

python|requests

最近工作开始转向使用python,因此更加深入的学习一下,通过阅读开源库学习python的使用。这一期学习使用requests库,这个是一个很漂亮的http包,提供优雅的http client。

Requests is an elegant and simple HTTP library for Python, built for human beings.

基础用法

官网给出了很多用法示例,这里简单罗列一下平常用到的getpost的请求方法。

……

阅读全文

python|学习路径

最近工作原因开始转向写python,发现之前学习的python还是很肤浅,真到用时还是发现很多奇奇怪怪的语法设定,这里记录一下python的学习路径,将学习资料整理整理。

……

阅读全文

算法专题|图

图相关的算法练习,需要掌握图的基本数据结构,图的连通性,图的遍历,最短路径,最小生成树等问题。

初级练习

找到小镇的法官

思路

思路很简单,基于图的度,由于法官不信任其他人,因此他的出度是0,这样就可以找到了。

……

阅读全文

算法专题|贪心

贪心算法没有固定的模板,基本思路是找到问题的一个切入点,虽然证明这个解法是最优的。

初级练习

拆分数位后四位数字的最小和

思路

这题很简单,数据只有4个数,组合就3种,不过为了求最小和,贪心的思路就是组成的数值最高位都尽量小,因此把四个数排序,1和4组成一个数,2和3组成一个数,这样就能得到最小的和。

……

阅读全文