深度学习进阶(十九)相对位置编码 RPE

博主头像 上一篇我们介绍了坐标注意力 CA,它通过沿两个方向分别池化来保留空间位置信息。 同样,我们可以总结一下它实现混合注意力的逻辑: CA 的做法本质上是一种隐式编码,它通过池化整合空间特征,学习权重并注入的逻辑让模型间接感知到空间信息,实现混合注意力。 如果再站高点,我们会发现一个更基础的问题: 模型究 ...

初探:用 FastAPI 搭建你的第一个 AI Agent 接口

博主头像 你是不是也受够了本地跑着大模型,却不知道怎么把它变成别人能调的接口?这篇文章手把手带你用 FastAPI 和 Ollama 搭起第一个 AI Agent 接口。不讲虚的,直接从请求模型写到依赖注入,把“Agent = LLM + 工具 + 编排逻辑”这件事用最接地气的方式说清楚。看完你就能跑通一个完... ...

"CREAD: A Classification-Restoration Framework with Error Adaptive Discretization for Watch Time Prediction in Video Recommender Systems" 论文笔记

博主头像 快手视频观时预测的工作 CREAD,发表于 AAAI 2024,深入分析了分桶策略,在理论上是一篇很棒的工作 背景 观看时长预测本质上是个回归问题,但它的标签分布通常极其长尾:大量样本集中在很短的时长(比如 3 秒内占 30%),而长时长的样本非常稀疏。这种不平衡性让直接做回归很难,模型容易被头部样 ...

你说你会AI测试,那你是怎么实现AI+软件测试的呢?(附带5 层AI 质量管理体系)

博主头像 前天面试了一个有着五年经验的测试工程师。 简历上写得挺漂亮:熟练使用AI生成测试用例,用AI实现自动化测试。我心想,这哥们儿应该有点东西,就抛了一个真实的项目问题过去。 没想到,他的回答把我惊呆了。 题目是这样的: 你用AI做测试,需求文档是完整的电商订单流程。AI生成了120条测试用例,3000 ...

基于netty的websocket服务优化

博主头像 前言 本文默认读者对netty有一定的使用经验,对于一些netty的基础概念不会说明 本文主要探讨对于netty实现的websocket服务端推送数据的一些优化点,如果存在错误的地方欢迎指出,并且文中有说明不清晰的地方也欢迎留言讨论 开始喽 通常我们使用如下的方式,创建一个基于netty的webso ...

spring boot 项目中oracle datasource设置schema

博主头像 问题1:spring boot 项目中oracle datasource设置schema 背景 假设有个oracle数据库,有个foo用户(创建用户时就会创建一个默认的与用户名同名的schema:foo,schema就是个名称空间,用来隔离各类数据库对象,如表、序列等),密码11111,项目中对应的 ...

Memgraph 与 Neo4j 图数据库对比及 .NET 生态适配分析

博主头像 摘要 Memgraph 与 Neo4j 是当前图数据库领域最具代表性的两款产品,但二者在设计哲学、架构取向和生态定位上存在本质差异。Neo4j 是图数据库品类的开创者,以成熟的企业级生态、全面的 .NET 工具链和强大的复杂查询优化器著称,采用磁盘为主的持久化架构,社区版采用 AGPLv3 开源许可 ...

Obsidian:从云端焦虑到知识自由之路

Obsidian:从云端焦虑到知识自由之路 一、背景:为什么我放弃了语雀和有道笔记? 作为一个常年与文档打交道的IT人,我最早用的是语雀和有道笔记等。这些产品功能确实强大,但有两个痛点让我越来越焦虑: 收费越来越贵:语雀个人版免费额度有限,想用Markdown、图床等功能就得付费;有道笔记的会员也不 ...

RAG质量评估&实施RAG工程核心步骤

博主头像 当我们完成了一个RAG系统的开发工作以后,我们还需要对RAG系统的性能进行评估,那如何来对RAG系统的性能进行评估呢?我们可以仔细分析一下RAG系统的产出成果,比如检索器组件它产出的是检索出来的相关文档即context, 而生成器组件它产出的是最终的答案即answer,除此之外还有我们最初的用户问题 ...

一道面试题刷掉 90% 的人,测试人必懂:AI 生成用例的3 大陷阱 + 7 项审核指标

博主头像 五一节前,我面试了一位自称有六年软件测试工作经验的候选人。 聊到当下行业里大火的 AI 自动生成测试用例话题时,我抛出了一个核心问题:“现在很多公司都用 AI 批量生成功能测试用例,需求文档完整的情况下,AI 能产出大量正向、反向、边界用例,看起来覆盖得面面俱到。那你怎么判断这些用例是否真的可靠?能 ...

我的 Claude Code 效率工具全套配置分享

博主头像 折腾了一段时间 Claude Code,总结了一套自用的 plugins + MCP 组合。这套配置让我的 AI 辅助开发工作流从"聊天写代码"变成了"有记忆、有规划、有文档、有双重验证"的完整流水线。分享给同样在用 Claude Code 的朋友们。 一、为什么要配置这些? Claude Code ...

前缀树(字典树、Trie)

博主头像 一、概念 前缀树,英文名为Trie,也常被称作字典树、查找树,是一种专门用于存储、检索字符串集合的多叉树形数据结构。它的核心设计思想为共享公共前缀:将多个拥有相同前缀的字符串,共用树中相同的前缀节点,以此压缩存储空间、降低字符串查询的时间复杂度。最典型的特征是按字符分层存储,区别于普通二叉树,它没有 ...

我的开源项目分享-基于SharpBrowser二次开发的定制浏览器,过程中填坑无数

博主头像 本文介绍了一个基于SharpBrowser定制浏览器的项目,旨在通过在请求头中添加设备ID来增强客户管理系统的身份验证机制,确保仅固定设备可访问。项目开发过程中遇到了不支持基本对话框、window.open无返回值及下载页面功能缺失等问题,并进行了相应修正。此外,还增加了本地化支持、对公司打印管理器... ...

.NET+AI | Harness | MAF 1.4 发布,Harness Engineering 如约而至,智能体工程化更进一步

博主头像 从 Harness Engineering 到 MAF 1.4:微软是怎么把智能体开发往工程化上推了一步 很多人第一次看到 Harness 这个词,会把它理解成一个新功能,或者一个新的任务编排组件。 这样理解不算错,但只停在这里,基本会把它看小。 因为当智能体还只是“调一次模型,回一段答案”的时候, ...

<1···222324···100>