技术博文
探索技术深度,记录成长轨迹
251篇文章
200个标签
26页内容
欢迎来到我的技术文章专区!这里记录了我在技术探索路上的点滴思考和实践经验。
🏗️ 架构设计
系统架构、微服务、分布式系统设计经验分享
💻 编程实践
代码设计、设计模式、最佳实践探讨
🔧 工具开发
插件开发、工具制作、效率提升方案
📚 学习笔记
技术学习心得、踩坑记录、问题解决

扫码关注
01
2026-04-17
4 分钟阅读
Recall@K、MRR、NDCG 三指标,一文彻底讲透→
面向 RAG 检索评估,系统讲清 Recall@K、MRR 与 NDCG 三个核心指标的定义、差异与适用场景, 帮助你从“能召回”走向“排得准、体验好”的检索质量优化。
02
2026-04-16
6 分钟阅读
为什么你的AI Agent聊着聊着就“跑偏”了?不是模型笨,是7大机制在“作妖”!附8大架构神器,彻底治愈“老年痴呆”→
AI Agent 对话中途“跑偏”并非只是不够聪明,而是上下文窗口、记忆机制、工具调用、 规划与状态管理等系统因素叠加导致;本文拆解 7 大根因与 8 类架构解法。
03
2026-04-16
7 分钟阅读
为什么很多人的高蛋白饮食,像一个只配了 Elasticsearch、却没做重排的 RAG 系统?→
用 RAG 工程视角拆解高蛋白饮食中的结构失衡问题:主召回很强不等于系统稳定,真正关键在于补齐重排、纠偏与长期鲁棒性的“营养架构”。
04
2026-04-15
5 分钟阅读
重磅!Google 昨晚官宣桌面神器:Alt + Space 一键召唤 AI + 全局搜索,Windows 用户直接起飞!→
Google 推出 Windows 版桌面应用,一键 Alt + Space 呼出全局搜索与 Gemini AI 能力,覆盖网页、本地文件与 Drive,实测上手与核心亮点一文看懂。
05
2026-04-14
19 分钟阅读
一文讲透:大模型推理到底在做什么?从 Prefill 到 vLLM,全链路拆解→
从“大模型本质是预测下一个 token”出发,系统拆解 Prefill、Decode、KV Cache、 Paged Attention、Continuous Batching 与 vLLM 的工程逻辑,帮助你看懂推理性能和系统设计。
06
2026-04-12
4 分钟阅读
技术圈爆火新词:Harness 工程,OpenAI 和 Anthropic 都在卷这个!→
从 OpenAI 与 Anthropic 的最新实践出发,解析 Harness Engineering 的核心:如何通过任务边界、上下文供给、工具权限与反馈闭环,把模型能力转化为稳定可控的企业生产力。
07
2026-04-11
11 分钟阅读
AI 系统落地难的,从来不只是模型:一次企业级部署实施复盘→
从一次企业级 AI 平台实施出发,复盘资源规划、中间件协同、业务编排、模型接入与全链路验收,梳理 AI 系统从“能部署”到“可交付”的关键方法。
08
2026-04-03
8 分钟阅读
客户现场没网,Docker 镜像怎么快速部署?我把离线导入导出做成了一键化→
客户现场没有外网,镜像仓库拉不下来、部署窗口又很紧时,如何把镜像交付这件事做成 标准化的一键导出、一键导入流程,减少人工操作和现场翻车。
09
2026-04-03
9 分钟阅读
我用 Rust 做了一个跨平台护眼提醒工具 BlinkSpark→
长时间盯屏、总是忘记休息、提醒工具又太重太吵,于是我用 Rust 做了一个真正能长期挂着用的跨平台护眼提醒工具 BlinkSpark。
10
2026-02-24
5 分钟阅读
从DAU奴隶到TPD指挥官:春节复工,职场升维指南→
从”注意力经济”(DAU)到”生产力杠杆”(TPD)的转变已经发生。AI不抢你的饭碗, 它放大你的杠杆——但只给会指挥的人。职场赢家不是最忙的,而是TPD最高的指挥者。
每页显示:

评论功能
当前站点为 GitHub Pages 镜像版本,不支持评论功能。
如需发表评论,请访问主域名版本:
🚀 前往 主域名 版本评论