元数据的作用与管理
作者:程 序员马丁
note
热门项目实战社群,收获国内众多知名公司面试青睐,近千名同学面试成功!助力你在校招或社招上拿个offer。
上一节我们聊了数据分块(Chunking)——怎么把一篇长文档拆成大小合适的文本块,让检索更精准、让大模型更容易理解。但拆完之后你会发现,光有文本块还不够。每个块只剩下一段裸文本,丢失了它原本的上下文:这段话来自哪份文档?属于哪个部门?什么时候写的?谁有权限看?这些信息一旦缺失,检索质量和用户体验都会打折扣。
这就是本节要解决的问题——元数据管理(Metadata)。